Developers

¿Cómo construimos un catálogo de datos con AI en Pomelo?

¿Cómo construimos un catálogo de datos con AI en Pomelo?
Share

¿Cómo construimos un catálogo de datos con AI en Pomelo?

En Pomelo veníamos creciendo fuerte en datos: equipos especializados, productos analíticos, dashboards activos y mucha energía puesta en generar impacto. Aun así, empezamos a notar una señal clara de escala: las definiciones no siempre eran consistentes, medir el impacto de un cambio requería demasiada coordinación y los modelos, más que acelerar, introducían fricción. Estábamos creando valor, pero no con la fluidez que necesitábamos para movernos a la velocidad del negocio.

Para dar el siguiente paso entendimos que no alcanzaba con documentar mejor, sino con cambiar la forma en que accedíamos y usábamos el conocimiento de datos. Por eso, tomamos OpenMetadata como base y lo potenciamos con MCP (Model Context Protocol) para construir un catálogo de datos con AI capaz de interactuar en lenguaje natural, ejecutar validaciones, estandarizar métricas y mostrar el impacto real de cada cambio en la operación. 

El resultado fue un ecosistema de datos más ordenado, menos ruido entre equipos y mucha más confianza para decidir. A continuación, te contamos cómo lo hicimos y qué aprendimos en el proceso

Catálogo de datos centralizado sobre el Data Lake

El primer paso fue claro: si queríamos tomar decisiones consistentes, necesitábamos una única fuente de contexto. Por eso, implementamos un catálogo central sobre el Data Lake que nos permitió ordenar el ecosistema desde sus cimientos:

  • Todas las tablas catalogadas
  • Owner claro para cada asset
  • Dominios de negocio bien definidos (Transacciones, Fraude, Lending, Logistics, etc.)
  • Glosario y definiciones alineadas para que cada métrica signifique lo mismo en toda la organización.

Esto nos dio algo que parece simple, pero es clave cuando se escala: que cualquier persona, al ver una métrica o una tabla, entienda exactamente qué representa, cómo se calcula y quién es responsable de mantenerla. Esa claridad reduce interpretaciones, acelera conversaciones y sienta una base común para decidir mejor.

Entender el flujo completo: del dato crudo al impacto en negocio

Ordenar no era suficiente. El siguiente desafío fue entender cómo fluye el dato y cómo los cambios se propagan. Construimos linaje end-to-end, incluyendo dependencias a nivel columna, desde el evento crudo hasta el último dashboard.

El efecto en la dinámica diaria fue inmediato. Preguntas que antes requerían múltiples mensajes, reuniones y validaciones cruzadas —“si cambio esto, ¿qué rompo?”— hoy se responden de forma directa. El linaje hace explícitas las dependencias, elimina suposiciones y reduce el riesgo de cambios “a ciegas”.

Pero lo más importante no es técnico: es cultural. Cuando el impacto es visible, el miedo a cambiar baja. Los equipos pueden iterar más rápido, discutir con datos y no con intuiciones, y evaluar trade-offs con información completa. El linaje deja de ser un diagrama bonito y se convierte en una herramienta para decidir mejor y moverse más rápido sin romper la confianza.

El diferencial: un catálogo de datos con el que puedes hablar

Hasta acá, podríamos hablar de un buen catálogo. El salto real llegó cuando nos enfocamos en eliminar una de las mayores barreras del self-service en datos: la fricción de entrada.

En la práctica, el problema rara vez es que la información no exista, sino que acceder a ella exige aprender herramientas nuevas, entender flujos complejos o depender de saber a quién preguntar. Ese costo cognitivo frena la adopción y concentra el conocimiento en pocos perfiles, incluso cuando está bien documentado.

Al integrar MCP (Model Context Protocol), el catálogo dejó de ser una UI para navegar y pasó a convertirse en una capa operable en lenguaje natural. No para hacerlo más sofisticado, sino para hacerlo más usable. Hoy los equipos pueden consultar calidad de datos, entender el impacto de un cambio, crear validaciones, mejorar documentación o definir métricas consistentes como parte de su flujo habitual de trabajo.

El impacto real se ve en el día a día. Las discusiones por métricas bajan porque las definiciones son únicas, visibles y versionadas. La dependencia de perfiles “expertos de datos” se reduce porque el conocimiento vive en el catálogo y no en personas. Los cambios generan menos miedo porque el impacto es visible antes de tocar producción. Y el onboarding se acelera, ya que nuevos perfiles pueden entender el ecosistema sin recorridos eternos ni explicaciones ad hoc.

No forzamos adopción ni cambiamos procesos de golpe. Hicimos que usar el catálogo sea más fácil que no usarlo. Así, el catálogo dejó de ser una herramienta más y se convirtió en una pieza integrada al trabajo cotidiano, funcionando como la interfaz natural entre negocio y datos.

Qué aprendimos implementando esto en Pomelo

  1. No pensar en el catálogo como “documentación 2.0”, sino como infraestructura de conocimiento.
  2. Ir más allá del “mirar” y pasar a operar el catálogo vía MCP.
    Resolver no sólo dónde están los datos, sino cómo se definen las métricas que usamos para tomar decisiones.

Si en tu equipo:

  • Hay tres definiciones distintas de “cliente activo”,
  • Los cambios en el esquema dan miedo,
  • Y la documentación existe, pero nadie confía del todo…

entonces no necesitas otro dashboard: necesitas un catálogo gobernado, con linaje y operable en lenguaje natural.

En Pomelo estamos construyendo un catálogo vivo, pensado como una capa que conecta datos, personas y decisiones. El resultado es simple, pero potente: más confianza, menos fricción y decisiones que todos entienden de la misma forma.

SOBRE EL AUTOR
Bruno Iungano

Bruno Iungano

Data Lead en Pomelo

Ver más artículos de este autor
Hablemos

Construye el
producto que buscas
para tu negocio

Agenda una llamada con nuestro equipo.

Cecilia BrittoHead of Business
Alfonso TorreguitarHead of Global Solutions
Santiago WitisCountry Manager Cono Sur Latam
Jacob LevinCountry Manager México
Rafael GoulartCountry Manager Brasil
Paula BarnesHead of Risk
Emilia SerranoNew Businesses Director
Contactame