En una solución típica/tradicional de ETL o almacén de datos, es necesario introducir los datos en el lago de datos desde varios sistemas de origen y limpiarlos antes de que puedan ser procesados por las aplicaciones posteriores. Además, en el contexto actual, la migración de datos de los sistemas locales a la nube es cada vez más popular.
Virtusa, como socio empresarial estratégico, inició el proceso con la migración del marco de adquisición de datos existente del cliente mediante técnicas de modernización de Hadoop en AWS. Además, utilizamos Talend para extraer, transformar y cargar (ETL) aprovechando las soluciones de marco de lago de datos sin servidor del cliente.
Después de lo cual, originamos la idea de aprovechar el marco de integración de datos impulsado por metadatos y desarrollamos el esquema para ingerir datos de cualquier fuente de datos estructurados en cualquier destino mediante la adición de información de metadatos en un archivo/tabla de metadatos. Este marco puede ingerir datos de cualquier sistema de fuente de datos estructurados (RDBMS como Oracle, archivo local, extracciones de servidor FTP, etc.) y almacenar datos en cualquier destino (AWS S3, Azure ADLS, RDS, etc.).
Este acelerador admite la evolución del esquema. Cualquier cambio en el esquema de cualquier fuente existente no tiene ningún impacto en el marco de la solución, reduciendo así la necesidad de cualquier cambio de código. Esto ahorrará tiempo de construcción y pruebas y mucho esfuerzo al reducir la necesidad de análisis de impacto de cualquier cambio de esquema.