Table of Contents
ToggleCuando tenemos una datos, es como tener un cochera desordenada: es un problema poder navegar y sacar provecho sobre las cosas que se tiene. El saber que cosas van en su lugar porque es su espacio asignado para ello y se debe ver que se cumpla; hace que las cosas sean más faciles de gestionar.
Igualmente con los datos; definir las politicas de quien es responsable de que, porque y cual estructura debe soporta ello y que involucra esto; son parte del gobierno de datos que toda empresa debe tener.
En este artículo; daremos una visión general de lo involucra este punto. Si eres buen y quieres saber que involucra: esto es para tí.
Nota: esto esta basado en los curso y estudio sobre el tema; con el fin de prepararme para un puesto con relación o gestión de datos, gobierno de datos o arquitectura. Si tienes un comentario, compartelo: ayudame a salir de la ignoracia 😄
Los datos generan valor a la empresa ya que reflejan la realidad de una empresa a captado de si misma sobre sus proceso; por la calidad de los datos del mismo para ver claramente este reflejo es importante para sacar provecho e innovar dentro del negocio. La imagen de abajo refleja una realidad que todo ingeniero de datos afronta.
Gracias a este hecho es que los datos requieren una limpieza y toma tiempo buscarlo; que hace los gerentes no confien en sus reportes[]; lo que refleja pobre uso por un problema de fondo: Sin reglas de juego para y con los datos, es dificil innovar.
Para lograr la solución a este problema; debemos cambiar la organizacion para usar técnologia con el fin de mejorar su desempeño; además de reunir personas, datos y proceses para crear ventaja competitiva.
Con esto dicho; una definición de gobierno de datos es: Es la capacidad de control y autoridad sobre la gestión de datos en sus activo por medio de roles, procesos, responsabilidades y practicas. Entonces con ello; debemos borrar algunos mitos del gobierno de datos :
La gestión y el gobierno de datos tiene puntos en común, y esto se basa en que la gestión ve como hacer las cosas; mientras que el gobierno ve que y quién lo hace, dando un funcion de monitoreo a la gestión:
Y esto se ve plasmado en el ciclo de vida de los datos: como se crea y almacena, es utilizado durante el negocio y son compartidos, para finalmente ser archivados y eliminados.
Es un ciclo sin fin: requiere que todo los puntos anteriores tengas responsables y procesos adecuados a nivel organizacional.
Esto hay que agregar que esto puede ser afectado por el tipo de datos: los datos maestros y de referencia pueden tener un proceso diferentes que los metadatos, datos transacionales o no estructurados. Si bien puede empezar con un grupo de datos pequeño; el fin es gobernar todos los tipos de datos dentro de la organización.
Diferentes partes requieren o son afectadas por el gobierno en algun punto para lograr implementarlo; por ejemplo: el modelo de datos necesita saber cuales son las entidades y sus restricciones, por lo que la calidad de datos es necesario para indicar estas restricciones y su impacto; el uso de los datos nos ayuda a entender como los procesos y las personas los necesitan y que arquitectura y herramientas de datos se requieren para soportar ello. Estos puntos son muy enfocados al negocio y su estrategia para buscar monetizar los datos y sacar su maximo provecho con un enfoque orientado a proceso.
Un punto importante es como somos cambiamos al personal del negocio en como usar los datos; cuales herramientas requieren para ello y lo que pueden realizar con los datos. Todo esta cambio de cultura dirigida por datos; o cultura data driven; ayudará al negocio a tener el maximo beneficios posible para operar sus actividades de forma diaria.
Todo los puntos anteriores se pueden plasmar en retos internos dentro del gobierno de datos podrian resaltar son:
El nivel de madurez es necesario para saber que cosas se realizan con los datos; y que cosas se podrian realizar según la etapa actual, tanto para una oportunidad de innovar como prepararse para pasar al siguiente nivel. Esto puede ser a nivel multiples area como por una area sola: Una area puede estar más madura que otra; pero como organización se mide como un todo.
Los niveles podrian agruparse en[1]:
Esto niveles necesitan componentes para evaluar: (1)el acceso a los datos que se tiene, (2) el modelo operativo y la arquitectura, (3) el valor de datos que se puede extraer, (4) la tecnología que se utiliza para soportar las operaciones, (5) la estrategia de datos que se siguie, (6) la cultura que se tiene dentro de la organización sobre los datos, y (7) la capacidad del personal para utilizarlos.
Workshops, cuestionarios o tercerizar el proceso son herramientas que podriamos utilizar para evaluar los componentes dentro de una area a fin e determinar su madurez. Se debe realizar cada tiempo la evaluacion para ver el avance de cada area; anualmente puede ser un tiempo producte, que podria estar alineado a metas.
La estructura y modelo de trabajo, depende de mucho tipos de factores: estructura organizacional, madures de datos, la capacidad de descentralizar operaciones o alcance de lo que se quiere gobernar en las unidades de negocios.
DAMA propone modelos de como operar el gobierno de datos según la estructura del negocio dentro de la organización; estos modelos son:
Un punto importante a tener en cuenta es que entre más centralizado el modelo, se tiene una coordinación eficiente entre los dominios; mientras que una versión más descentralizada se centra más en los responsables de los datos y los ajustes necesarios por el dominio.
Ya teniedo el modelo de gobierno que se aplica para una unidad de negocio; se debe estructurar roles dentro del modelo para implementar el gobierno. Los roles y sus reponsabilidades son:
Estos roles son tomados por mientros de la estructura organizacional de negocio; por lo que lleva a tener 2 roles o más; para poder animarlo a tomar esta responsabilidad, se puede basar en los beneficios que el rol le entrega dentro de sus otros roles: iniciativas de control, mejorar la calidad de sus datos para sus proceso, etc.
El fin de esto debe entregar un modelo de gobierno capaz de definir, disponibilizar, dar trazabilidad y asegurar la calidad de los datos.
Un producto en particular es la reporteria: esto es porque más datos se generan ya sean calculados, de auditoria entre otros; llevandonos a la necesidad de gobernarlos para estos tipos de datos por la logica que se requiere para construirlos.
Para ello también hay roles asociados para estos puntos:
Para poder definir el alcance de un reporte; o producto; se requiere que se construya un grupo de trabajo con:
La empresa tiene una serie de entregables que son tanto organizacionales como artefactos, de tal forma que se tenga la capacidad y continuidad de gobernar los datos dentro del negocio.
El glosario de datos o negocio es un repositorio que contiene definiciones y conceptos de negocio, terminos e indicadores junto con su estructurada. Estos terminos estan definidos desde una vista de negocio y por el data owner o/y los involucrados en el uso de un termino.
El diccionario de datos es un documento que indica como son las tablas de una sola fuente de información y como deben ser entendidas; para ello enlista las tablas y sus columnas que se utilizan. Estan definidos por el data steward y el equipo de IT asociado a ello.
Entre el diccionario y glosario de datos hay una conección: ya que para implementar un concepto se requiere un lugar donde esten los datos. Para ello siempre se toma el lugar de la fuente de información más confiable, donde estarán los datos desde ahora en adelante y se agregaran los demás temas: calidad, arquitectura y gobierno entre otros.
Solo debe haber una fuente de información confiable, y no más fuentes distintas para el mismo concepto. Todo debe reducirse a las fuentes de información necesarias para lograr ello.
La definición, implementación y monitoreo de la estructura y modelo de gobierno de los datos es un entregable organizacional: los diccionarios y glosarios de datos son creados por esta estructura como cualquier otra operación asociada.
Definir, implementar, asegurar y mejorar la calidad de los datos en las fuentes confiables una actividad crucial para ver que las politicas del gobierno son aplicados correctamente por las fuente de datos. El tener documentado las definiciones, monitorearlo que se cumplan estas caracteristicas y asociarlas al negocio con metas y umbrales para tener control de la calidad es parte de este entregable.
El monitoreo u trazabilidad de los datos es necesario como los datos se mueven dentro de la empresa: los sistemas, su ciclo de vida en cuestion de origen, destino y tiempos; como también en su periodo de uso, etc. El tener panel para monitorear y dar alertas de estos puntos es necesario para saber como se comportan los datos en si mismo. Se debe escoger cual enfoque es mejor:
La adquisición de una cultura data driven puede llevar aun amplio grupo de entregables: responsabilidades por ser influencers, plan de trabajo de capacidades y comunicación, perfil de usuarios entre mucho más.
La adquisición de una cultura data driven es un enfoque organizacional cultural en el que todos los miembros de la organización utilizan los datos para tomar decisiones y mejorar sus labores. Para lograr ello necesitamos potenciar a las personas en:
Obviamente esto con lleva a un cambio dentro de las capacidades del personal; pero el beneficio que podria dar es amplio:
Para lograr ello se debe realizar un proceso de adaptación y capacitación del personas dentro de la empresa la base es diagnosticar cual es la situación del perfil de los colaboradores de la organización en temas de datos, analitica y procesos. Esto se da de la mano con el equipo de recursos humanos, y alineado con la cultura organizacional del negocio; ya que esto marca el camino para dar potenciación de habilidades de la empresa.
Hay 3 puntos claves para adaptar una cultura de data driven: gestión de influencers, gestión de comunicación y desarrollo de capacidades.
La gestión de influencers busca segmentar el publico e identificar su capacidad de influencia en los miembros de la organización con el fin de ayudar a la organización a utilizar datos y velar que se haga de forma optima. Para ello se agrupan en 3 grupos:
El desarrollo de capacidades se basa en que los colaboradores puedan leer, escribir, trabajar, analizar y comunicarse con los datos de forma eficiente; para ello se debe construir una literatura o alfabetización de datos; o data literacy en ingles, que requiere ser construido e impulsado.
Como ya tenemos un perfil de los colaboradores; podemos ver que capacidades deben adquirir para utilizar los datos de la empresa de forma eficiente. Este punto busca genera un plan para cada grupo de colaboradores con perfiles similares.
Esto es la combinación de 4 ejes principales en los que se debe trabajar dentro de la literatura para tener exito dentro de la empresa. Para desarrollar estos ejes, se deben basar en 4 lineas estrategicas :
Esto hace que las herramientas como diccionario, calidad glosario de datos o flujos de trabajo tomen importancia junto con la actitud colaborativa y de compañerismo dentro de la organización; haciendo que la cultura sea integrada con la importancia de los datos.
La gestión de comunicación busca generar un plan de comunicación para difundir los beneficios que entregamos para la organización, y estar al tanto de ello. Los influencers toman fuertemente este punto para aprender, conocer y expresar sus necesidades.
Para esto debe tener un mensaje claro y sencillo, facil de llegar a todo el mundo para transmitir a idea de forma correcta en toda la organización. Esto lleva a un plan orientado para todas las areas para enfrentar mejor la necesidad de eliminar la ignorancia y promover el conocimiento.
Hay herramientas que podrian ayudarnos a gestionarlo de forma correcta: el glosario de datos podria tener terminos populares para referenciar a otros terminos menos conocidos.
Si bien el gobierno de datos debe alinear la estrategia de datos con la estrategia organizacional; debemos enfocarnos en como maximizar el valor de los datos para generar una ganancia monetaria a la empresa, basado en las iniciativas.
Estas iniciativas deben dar un valor cuantitativo como cualitativos; temas como automatización, reducir gastos de procesos, ahorro en multas, reducción de horas nombres, eficiencia son ejemplos de valores que se entrega a la empresa.
Uno podria empezar con iniciativas más tácticas u operacionales, de corto plazo y claves para la organización.
como también con iniciativas de largo plazo que consoliden y cimienten el valor; esta cantidad de iniciativas debe ser pocas y fuertemente ligadas a programas de negocio que permitan la escalabilidad y generen sponsorship para otras iniciativas.
Para generar un caso de uso de la monetización se debe pasar por los siguientes puntos:
Dentro del gobierno de datos, necesitamos medir nuestros esfuerzos para demostrar al negocio el impacto generado como el monitoreo de nuestras implementación para tener el control deseado.
Sin monitorear nuestros progreso, no se progresa realmente.
Para lograr ello hay que definir mediciones en los objetivos, esto depende del tipo de caso de uso que el programa vaya a implementar; pero generalmente estas mediciones tiene 2 tipos de categorias:
Estos 2 puntos son ampliamente acogidos tanto por el negocio como por la oficina para lograr medir como se desenvuelve un caso de uso del gobierno de datos.
Por ejemplo; en un caso de gestión dde tarifas de transporte y mitigar los riesgos por consumo del dato, se podria implementar los siguientes puntos:
Hay algunos consejos que debes tener en mente cuando empieces este punto:
Para abordar el proceso de implementación del gobierno; podria definirse por los siguientes pasos: