Entendiendo a alto nivel sobre que, porque y como realizar un gobierno de datos.

Cuando tenemos una datos, es como tener un cochera desordenada: es un problema poder navegar y sacar provecho sobre las cosas que se tiene. El saber que cosas van en su lugar porque es su espacio asignado para ello y se debe ver que se cumpla; hace que las cosas sean más faciles de gestionar.

Igualmente con los datos; definir las politicas de quien es responsable de que, porque y cual estructura debe soporta ello y que involucra esto; son parte del gobierno de datos que toda empresa debe tener.

En este artículo; daremos una visión general de lo involucra este punto. Si eres buen y quieres saber que involucra: esto es para tí.

Nota: esto esta basado en los curso y estudio sobre el tema; con el fin de prepararme para un puesto con relación o gestión de datos, gobierno de datos o arquitectura. Si tienes un comentario, compartelo: ayudame a salir de la ignoracia 😄

La importancia y aclaración del qué es

Los datos generan valor a la empresa ya que reflejan la realidad de una empresa a captado de si misma sobre sus proceso; por la calidad de los datos del mismo para ver claramente este reflejo es importante para sacar provecho e innovar dentro del negocio. La imagen de abajo refleja una realidad que todo ingeniero de datos afronta.

1*KWteqr dBkU 3ofIIXYvkw
Como se siente a veces 😅

Gracias a este hecho es que los datos requieren una limpieza y toma tiempo buscarlo; que hace los gerentes no confien en sus reportes[]; lo que refleja pobre uso por un problema de fondo: Sin reglas de juego para y con los datos, es dificil innovar.

Para lograr la solución a este problema; debemos cambiar la organizacion para usar técnologia con el fin de mejorar su desempeño; además de reunir personas, datos y proceses para crear ventaja competitiva.

Con esto dicho; una definición de gobierno de datos es: Es la capacidad de control y autoridad sobre la gestión de datos en sus activo por medio de roles, procesos, responsabilidades y practicas. Entonces con ello; debemos borrar algunos mitos del gobierno de datos :

  • Es engorroso”: Al contrario busca dar claridad sobre el tema.
  • Es sobre tecnología o proyecto”: No es un proyecto; porque se quedará en la organización por se una forma de trabajo; y usará tecnología pero no busca implementarla.
  • No genera beneficios”: Si genera beneficios cuantitativos y cualitativos, cuando se implementar.
  • Es complejo”: Se empieza de poco a grande; porque esto requiere una ruta de trabajo para realizarlo de la forma más simple posible.

¿Qué involucra y porque?: retos y contexto

1* CpLolz2uvxNYwhP 5EpLw
Como el gobierno interactuva en el ciclo de vida de datos: desde el diseño hasta la construcción 🙌

La gestión y el gobierno de datos tiene puntos en común, y esto se basa en que la gestión ve como hacer las cosas; mientras que el gobierno ve que y quién lo hace, dando un funcion de monitoreo a la gestión:

  • Ven las formas en como los datos conectar con los procesos de datos.
  • La relación entre procesos de negocio y la tecnología que los soporta.
  • El diseño y arquitectura de los sistemas y los datos que almacenan y producen.
  • La forma que el uso de los datos para la estrategia de la organización.

Y esto se ve plasmado en el ciclo de vida de los datos: como se crea y almacena, es utilizado durante el negocio y son compartidos, para finalmente ser archivados y eliminados.

Es un ciclo sin fin: requiere que todo los puntos anteriores tengas responsables y procesos adecuados a nivel organizacional.

Esto hay que agregar que esto puede ser afectado por el tipo de datos: los datos maestros y de referencia pueden tener un proceso diferentes que los metadatos, datos transacionales o no estructurados. Si bien puede empezar con un grupo de datos pequeño; el fin es gobernar todos los tipos de datos dentro de la organización.

1*o4Scry54TeERN3LgZV0V7A
¡Todo se centra en el gobierno de datos!

Diferentes partes requieren o son afectadas por el gobierno en algun punto para lograr implementarlo; por ejemplo: el modelo de datos necesita saber cuales son las entidades y sus restricciones, por lo que la calidad de datos es necesario para indicar estas restricciones y su impacto; el uso de los datos nos ayuda a entender como los procesos y las personas los necesitan y que arquitectura y herramientas de datos se requieren para soportar ello. Estos puntos son muy enfocados al negocio y su estrategia para buscar monetizar los datos y sacar su maximo provecho con un enfoque orientado a proceso.

Un punto importante es como somos cambiamos al personal del negocio en como usar los datos; cuales herramientas requieren para ello y lo que pueden realizar con los datos. Todo esta cambio de cultura dirigida por datos; o cultura data driven; ayudará al negocio a tener el maximo beneficios posible para operar sus actividades de forma diaria.

Todo los puntos anteriores se pueden plasmar en retos internos dentro del gobierno de datos podrian resaltar son:

  • Que y porque priorizar un objetivo y alcance.
  • Crear beneficios de los objetivos y alinearlos a la estrategia del negocio.
  • Crear soluciones con enfoque más integral para solucionar los problemas de la empresa.
  • Como medir resultados y el impacto generado para indicadores de valor y la gestión de gobierno.
  • Implementar la comunicación clara y sencilla dentro de la empresa: expandir conocimientos, uniformizar tecnisismo, saber procesos, etc.

¿Cuan madura es mi empresa?

El nivel 0 siempre es un caos. Hay partes imporntate que cada paso debe ejecutarse.

El nivel de madurez es necesario para saber que cosas se realizan con los datos; y que cosas se podrian realizar según la etapa actual, tanto para una oportunidad de innovar como prepararse para pasar al siguiente nivel. Esto puede ser a nivel multiples area como por una area sola: Una area puede estar más madura que otra; pero como organización se mide como un todo.

Los niveles podrian agruparse en[1]:

  • Nivel 1: Hay un conjunto aplicado de buenas practicas minimas necesarias para la gestión de datos necesaria en sus procesos de negocios. Esto incluye: gestión de requisitos de datos, configuración, infraestructura además de establecimiento de fuentes y destino de datos.
  • Nivel 2: Hay un conjunto de buenas practicas minimas que se usan en los procesos de negocios, que estan alineados con la estrategia organizacional. Estas practicas estan orientadas al gobierno de datos.
  • Nivel 3: Hay un grupo de buenas practicas demostrables y garantizas que estan orientados a la calidad de datos para garantizar que los diferentes procesos de negocios que usan los datos.
  • Nivel 4: Hay monitoreo constante de las practicas sobre los niveles anteriores; velando que la estrategia de datos es efectiva.
  • Nivel 5: Utiliza un conjunto de buenas prácticas orientadas a que la estrategía de datos evolucione conforme evoluciona la estrategia organizacional.

Esto niveles necesitan componentes para evaluar: (1)el acceso a los datos que se tiene, (2) el modelo operativo y la arquitectura, (3) el valor de datos que se puede extraer, (4) la tecnología que se utiliza para soportar las operaciones, (5) la estrategia de datos que se siguie, (6) la cultura que se tiene dentro de la organización sobre los datos, y (7) la capacidad del personal para utilizarlos.

Workshops, cuestionarios o tercerizar el proceso son herramientas que podriamos utilizar para evaluar los componentes dentro de una area a fin e determinar su madurez. Se debe realizar cada tiempo la evaluacion para ver el avance de cada area; anualmente puede ser un tiempo producte, que podria estar alineado a metas.

Estructura y modelos de trabajo

La estructura y modelo de trabajo, depende de mucho tipos de factores: estructura organizacional, madures de datos, la capacidad de descentralizar operaciones o alcance de lo que se quiere gobernar en las unidades de negocios.

DAMA propone modelos de como operar el gobierno de datos según la estructura del negocio dentro de la organización; estos modelos son:

  • Centralizado: Ve todas las actividades de todas las areas de negocios; siendo una sola oficina de datos con todos los roles. Esto ayuda a tener un solo liderazgo y un solo plan pero depende del modelo de negocio para ello.
  • Replicado: El modelo operativo y estandares de gobierno de datos son adoptadas por cada unidad de negocio inicialmente; lo que lleva definir sus propios estandares de forma independiente eventualmente por el ritmo, casos de uso y desarrollo de la unidad de negocio.
  • Federado: Tiene una oficina de datos centralizada para definir politicas y estandares, pero la ejecución de las mismas es realizada por cada unidad de negocios y velada por el responsable de los datos.

Un punto importante a tener en cuenta es que entre más centralizado el modelo, se tiene una coordinación eficiente entre los dominios; mientras que una versión más descentralizada se centra más en los responsables de los datos y los ajustes necesarios por el dominio.

1*UNnar7W6TC ew bgpXGvKQ
Un ejemplo didactico de los modelos de gobierno. Propiedad de DAMA.

Ya teniedo el modelo de gobierno que se aplica para una unidad de negocio; se debe estructurar roles dentro del modelo para implementar el gobierno. Los roles y sus reponsabilidades son:

  1. Chief data officier: Establece metas estrategicas sobre los datos para la empresa formado por un comite de representantes; u oficina de datos; de areas como negocio, recursos, legal o/y IT donde se aplica el gobierno: desarrollar capacidad analitica para el negocio, establecer un modelo de gobierno de datos e implementar una estructura arquitectural de la informacion.
  2. Head of data o Domain head: Represente supremo de un dominio, responsable de la administración del dominio, cumplimiento del gobierno y principios de datos; ya que monitorea la ejecución de estos puntos y propone acciones para cumplir las metas estrategicas. Es un rol estrategico.
  3. Sub-domain: Similar al domain head; debido a el dominio tiene muchas responsabilidades por cada subdominio asociado; por lo que se toma un representante para este subdominio.
  4. Data owner: Supervisor de la calidad, trazabilidad y disponibilidad de los datos a nivel funcional como responsable de la definición transversalo del dato ante el dominio. Es responsable ante el domain head de los datos a su cargo, siendo esto un puesto tácticos, con poder de decisión y un entendimiento funcional de los datos basico dentro de la organización.
  5. Data steward: Ejecuta las acciones de mejorar definidas por el data owner; practicamente las actividades operativas del gobierno; ya que tiene un entendimiento funcional técnico más profundo de los datos. Esto lo lleva a documentar y estandarizar los datos, crear metadatos basicos y gestionar los problemas de calidad, medición y monitoreo de datos.
  6. Data entry: Asegura el correcto registro de los datos. Esto es transversal a todo los puestos, no solo los consumidores.
  7. Data user: Son las personas que utilizan los datos dentro de la organización y que son transversales a todas las operaciones de la organización.
1*g65do9JfY4v2Rh0wHWrK4w
Roles y responsabilidades en cualquier modelo de datos. Autor Lourdes Rojas.

Estos roles son tomados por mientros de la estructura organizacional de negocio; por lo que lleva a tener 2 roles o más; para poder animarlo a tomar esta responsabilidad, se puede basar en los beneficios que el rol le entrega dentro de sus otros roles: iniciativas de control, mejorar la calidad de sus datos para sus proceso, etc.

El fin de esto debe entregar un modelo de gobierno capaz de definir, disponibilizar, dar trazabilidad y asegurar la calidad de los datos.

Gobernando los reportes

Un producto en particular es la reporteria: esto es porque más datos se generan ya sean calculados, de auditoria entre otros; llevandonos a la necesidad de gobernarlos para estos tipos de datos por la logica que se requiere para construirlos.

Para ello también hay roles asociados para estos puntos:

  • El BI owner es responsable de la ejecución y uso de datos calculados. Generalmente puede tener un rol de producto; porque es el responsable de la definición del producto en si mismo.
  • El data translator es responsable de la construción de los calculos como su despliegue y visualización. También se le puede llamar analista de datos.

Para poder definir el alcance de un reporte; o producto; se requiere que se construya un grupo de trabajo con:

  • Las areas definidas para ver el alcance del producto.
  • Equipo de IT o desarrollo para guia sobre la viabilidad del tema.
  • La oficina de datos para documentar los acuerdos y definir las politicas del producto para la organización.

¿Cuales son los entregables?

La empresa tiene una serie de entregables que son tanto organizacionales como artefactos, de tal forma que se tenga la capacidad y continuidad de gobernar los datos dentro del negocio.

El glosario de datos o negocio es un repositorio que contiene definiciones y conceptos de negocio, terminos e indicadores junto con su estructurada. Estos terminos estan definidos desde una vista de negocio y por el data owner o/y los involucrados en el uso de un termino.

El diccionario de datos es un documento que indica como son las tablas de una sola fuente de información y como deben ser entendidas; para ello enlista las tablas y sus columnas que se utilizan. Estan definidos por el data steward y el equipo de IT asociado a ello.

1*g So9Qun0gR vBzYvSTyug
La relación entre el diccionario y glosario de datos: es simbiotica.

Entre el diccionario y glosario de datos hay una conección: ya que para implementar un concepto se requiere un lugar donde esten los datos. Para ello siempre se toma el lugar de la fuente de información más confiable, donde estarán los datos desde ahora en adelante y se agregaran los demás temas: calidad, arquitectura y gobierno entre otros.

Solo debe haber una fuente de información confiable, y no más fuentes distintas para el mismo concepto. Todo debe reducirse a las fuentes de información necesarias para lograr ello.

La definición, implementación y monitoreo de la estructura y modelo de gobierno de los datos es un entregable organizacional: los diccionarios y glosarios de datos son creados por esta estructura como cualquier otra operación asociada.

Definir, implementar, asegurar y mejorar la calidad de los datos en las fuentes confiables una actividad crucial para ver que las politicas del gobierno son aplicados correctamente por las fuente de datos. El tener documentado las definiciones, monitorearlo que se cumplan estas caracteristicas y asociarlas al negocio con metas y umbrales para tener control de la calidad es parte de este entregable.

“Planeamos con los principios; pero implementamos con los subprincipios”

El monitoreo u trazabilidad de los datos es necesario como los datos se mueven dentro de la empresa: los sistemas, su ciclo de vida en cuestion de origen, destino y tiempos; como también en su periodo de uso, etc. El tener panel para monitorear y dar alertas de estos puntos es necesario para saber como se comportan los datos en si mismo. Se debe escoger cual enfoque es mejor:

  • Técnico: Empieza desde el origen hasta identificar a los consumidores y dar sus seguimiento, y documentar los procesos. Siendo más complejo de ejecutar.
  • Negocio: Desde el destino de un producto o caso de uso hacia atras hasta los origenes, buscando descubrir como se crean los datos para un producto en especifico y sus procesos asociados.

La adquisición de una cultura data driven puede llevar aun amplio grupo de entregables: responsabilidades por ser influencers, plan de trabajo de capacidades y comunicación, perfil de usuarios entre mucho más.

Cultura de datos

La adquisición de una cultura data driven es un enfoque organizacional cultural en el que todos los miembros de la organización utilizan los datos para tomar decisiones y mejorar sus labores. Para lograr ello necesitamos potenciar a las personas en:

  1. Entender los datos y los procesos que los generan dentro de su area y en la organización.
  2. Darles herramientas técnologicas adecuadas para que puedan trabajar de forma independiente en muchos casos.

Obviamente esto con lleva a un cambio dentro de las capacidades del personal; pero el beneficio que podria dar es amplio:

  • Que entiendan la implicancia del desarrollo de procesos dentro de la organización: debe preocuparse de la calidad de los datos y el proceso que lleva.
  • Ser capaces de comprender mejor como una área se integra y como esto sucede con los datos y procesos.
  • Tener la capacidad de hacer analisis independiente y agilidad.
  • Descubrir nuevas oportunidades de mejora en los procesos y uso de los datos para con otras áreas.
  • Decisiones más precisas con datos tangibles y fundamento respaldados.
1*dyVYy z0z70KDGlOfATbFA
Las personas son el nuclo; los procesos, herramientas y datos los empoderan. Un ejemplo academico didactico.

Para lograr ello se debe realizar un proceso de adaptación y capacitación del personas dentro de la empresa la base es diagnosticar cual es la situación del perfil de los colaboradores de la organización en temas de datos, analitica y procesos. Esto se da de la mano con el equipo de recursos humanos, y alineado con la cultura organizacional del negocio; ya que esto marca el camino para dar potenciación de habilidades de la empresa.

Hay 3 puntos claves para adaptar una cultura de data driven: gestión de influencers, gestión de comunicación y desarrollo de capacidades.

La gestión de influencers busca segmentar el publico e identificar su capacidad de influencia en los miembros de la organización con el fin de ayudar a la organización a utilizar datos y velar que se haga de forma optima. Para ello se agrupan en 3 grupos:

  • Referentes: Una persona comprometida, que inspira a la gente y busca lograr metas. Es un punto más estrategico como un VP, gerente o domain owner.
  • Embajadores: Son personas especializadas en una aréa de trabajo orientado hacia un tema. Siendo este una influencia más tactica.
  • Usuario de datos: Un consumidor de la información que se entrega. Siendo un operador. Se puede segmentar este grupo por nivel de conocimiento.
1*cjkk8iV0ElDJCPHddRoG8Q
Asi es como se generán comunidades: por la interacción de los grupos de influencers.

El desarrollo de capacidades se basa en que los colaboradores puedan leer, escribir, trabajar, analizar y comunicarse con los datos de forma eficiente; para ello se debe construir una literatura o alfabetización de datos; o data literacy en ingles, que requiere ser construido e impulsado.

Como ya tenemos un perfil de los colaboradores; podemos ver que capacidades deben adquirir para utilizar los datos de la empresa de forma eficiente. Este punto busca genera un plan para cada grupo de colaboradores con perfiles similares.

Esto es la combinación de 4 ejes principales en los que se debe trabajar dentro de la literatura para tener exito dentro de la empresa. Para desarrollar estos ejes, se deben basar en 4 lineas estrategicas :

  1. Formación técnica de herramientas y/o funcional de los procesos de una area.
  2. Tener talento nuevo listo para asumir nuevos retos con herramientas dentro de la empresa.
  3. Comunidades de analitica y gobierno de datos que genera puntos de innovación y apoyo para temas de analitica y gobierno.
1*2 vTL8S4k2Qwesq6hAI2jw
Lo que se debe cumplir en cada eje. Autor Lourdes Rojas.

Esto hace que las herramientas como diccionario, calidad glosario de datos o flujos de trabajo tomen importancia junto con la actitud colaborativa y de compañerismo dentro de la organización; haciendo que la cultura sea integrada con la importancia de los datos.

La gestión de comunicación busca generar un plan de comunicación para difundir los beneficios que entregamos para la organización, y estar al tanto de ello. Los influencers toman fuertemente este punto para aprender, conocer y expresar sus necesidades.

Para esto debe tener un mensaje claro y sencillo, facil de llegar a todo el mundo para transmitir a idea de forma correcta en toda la organización. Esto lleva a un plan orientado para todas las areas para enfrentar mejor la necesidad de eliminar la ignorancia y promover el conocimiento.

1*2BZNgXTIL1 LzKeR cLaZg
Las claves para tener una comunicación referente. Autor Lourdes Rojas.

Hay herramientas que podrian ayudarnos a gestionarlo de forma correcta: el glosario de datos podria tener terminos populares para referenciar a otros terminos menos conocidos.

Monetización de los datos

Si bien el gobierno de datos debe alinear la estrategia de datos con la estrategia organizacional; debemos enfocarnos en como maximizar el valor de los datos para generar una ganancia monetaria a la empresa, basado en las iniciativas.

Estas iniciativas deben dar un valor cuantitativo como cualitativos; temas como automatización, reducir gastos de procesos, ahorro en multas, reducción de horas nombres, eficiencia son ejemplos de valores que se entrega a la empresa.

Uno podria empezar con iniciativas más tácticas u operacionales, de corto plazo y claves para la organización.

como también con iniciativas de largo plazo que consoliden y cimienten el valor; esta cantidad de iniciativas debe ser pocas y fuertemente ligadas a programas de negocio que permitan la escalabilidad y generen sponsorship para otras iniciativas.

Para generar un caso de uso de la monetización se debe pasar por los siguientes puntos:

  • Entender la situación actual sobre el alcance del proceso e identificar puntos de dolor hacia negocio por sus diferentes aspectos.
  • Identificar los impactos que los puntos de dolor afectan tanto al negocio en sus diferentes areas y procesos adjuntos como internos.
  • Priorizar esfuerzos que se realiza versus impacto del puntos de dolor, desde un punto de vista de los encargados del negocio y los roles del gobierno.
  • Definir e implementar acciones de mejora para crear una solucion hacia el punto de dolor seleccionado.
  • Comunicar y sensibilizar los resultados a la organización para tener visibilidad de los beneficios.
  • Dar seguimiento a acciones a la solución para ver una posible mejora o encontrar nuevos puntos de dolor.
1*Oyj1ruG6F8SsuI Nv5wUA
Como un problema necesita ser afrontado: todo se puede traducir en dinero en algúnn punto.

¿Como medir nuestro progreso?

Dentro del gobierno de datos, necesitamos medir nuestros esfuerzos para demostrar al negocio el impacto generado como el monitoreo de nuestras implementación para tener el control deseado.

Sin monitorear nuestros progreso, no se progresa realmente.

Para lograr ello hay que definir mediciones en los objetivos, esto depende del tipo de caso de uso que el programa vaya a implementar; pero generalmente estas mediciones tiene 2 tipos de categorias:

  • Impacto economico para el negocio.
  • Avance del programa de gobierno.

Estos 2 puntos son ampliamente acogidos tanto por el negocio como por la oficina para lograr medir como se desenvuelve un caso de uso del gobierno de datos.

Por ejemplo; en un caso de gestión dde tarifas de transporte y mitigar los riesgos por consumo del dato, se podria implementar los siguientes puntos:

  • Cuantificar el retorno económico que supone la reducción de herramientas, bases de datos, repositorios, gasto administrativo como mantenimiento.
  • Definir los principales KPIs de calidad de datos antes y posterior de la implementación del proyecto: vigencia de datos o cumplimientos de reglas.
  • Evolución de los activos de los data owner y stewards: numero de reglas validades por data owner, porcentaje de datos definidos.
  • Impacto de procesos: numero personas impactadas con mejoras o horas ahorradas en ejecución y reproceso.

Consejos finales para principiantes

Hay algunos consejos que debes tener en mente cuando empieces este punto:

  • El primer modelo no va a ser perfecto: lo importante es iniciar, ejecutar, aprender, corregir, ajustar y aplicar mejoras.
  • Todo debe ser agil y enfocado en la entrega de valor incremental.
  • Siempre habla con el negocio para alinear posturas y priorizar.
  • Elimina temores y busca complicidades.
  • Ejecuta rápid y aporta siempre valor: si no, ¡no lo hagas!
  • Siempre mide todo lo que se pueda medir.
  • Escucha, aprende y comparte.
  • Comunica y evangeliza los exitos e iniciativas.

¿Como empezar a trabajar?

1*jX5qfTRs0p keVGT6HwmnQ
Hay mucho trabajo para incluir a la gente de negocio de forma permanente en esta iniciativa: vamos a empezar.

Para abordar el proceso de implementación del gobierno; podria definirse por los siguientes pasos:

  • Saber el norte: entender las metas del negocio y su estrategia.
  • Saber donde estas: entender la madurez de datos dentro de la organización.
  • Tener un mapa y definir objetivos: trazar un mapa estrategico para lograr las metas del negocio por medio de objetivos internos con su alcance definido.
  • Identificar puntos y priotizar: entender los puntos disponibles a mejorar dentro del negocio y selecionar los más importantes y/o faciles de entregar para el negocio basado en los beneficios que pueden entregar alineados con la estrategia de negocio.
  • Realizar el trabajo: Construir junto al equipo, los productos o artefactos que el negocio consumira y utilizará.
  • Informa al negocio: informa sobre el estado actual del trabajo y el plan al negocio para saber que beneficios se estan disponibles y las dificultades que pueden haber.
  • Monitorear avances: Ver el estado del trabajo de acuerdo al mapa y el progreso del artefacto para continuar o ajustar el plan.