En este documento, tratamos acerca de las necesidades e infraestructura que suelen tener las compañías de cierto tamaño para manejar los grandes volúmenes de información a que tienen acceso.
El reto es integrar todos los repositorios u orígenes de datos. Con el avance de la digitalización el volumen de datos no estructurados ha crecido exponencialmente. En la siguiente imagen se detallan algunas de las fuentes de información interna y externa. Las clasificamos en datos estructurados y no estructurados.
Algunos soluciones son la implementación Data Warehoue, Data Lake y Data Hub:
- Data Lake almacena grandes volúmenes de datos, tanto estructurados, como no estructurados. Suele requerir ingenieros y data scientist para su explotación.
Data Warehouse almacena los datos de forma estructurada y relacional, suele incorporar herramientas de explotación de los datos, con el objetivo de facilitar el acceso a los miembros de la organización. - Data Hub está diseñado para integrar tanto datos estructurados como no estructurados. Centraliza los datos de la empresa que son críticos en todas las aplicaciones y permite compartir datos sin problemas entre diversos puntos finales, al mismo tiempo que es la principal fuente de datos confiables para la iniciativa de gobierno de datos
La tendencia es evolucionar hacia soluciones de Data Management que integran tecnologías On Premise + Cloud + Big Data + Data Quality + Data Governance.
En el siguiente vídeo podrás ver algunos detalles:
Para saber más sobre cómo gestionan los datos las grandes empresas, contacta directamente por email.