solución

Integración de datos

Diseñamos y construimos plataformas de datos fundamentales para apoyar la transformación digital de toda la empresa.

  • Plataformas de datos en RDBMS (Oracle, SQL Server, DB2, etc.)
  • Dispositivos DWH (Netezza, SAP HANA, Teradata)
  • DW basado en la nube (AWS, HP Vertica, etc.)
  • Plataformas sin SQL (como Hadoop, neo4j, MongoDB, etc.)

Tenemos una amplia experiencia en la extracción, transformación y carga (ETL) de datos procedentes de una gran variedad de fuentes, incluyendo aplicaciones heredadas, sistemas ERP, CRM y otros contenidos web, bases de datos relacionales estándar, HDFS, datos no estructurados, incluyendo redes sociales, blogs, datos de máquinas, bases de datos NoSQL, MongoDB, Cassandra, Hbase, aplicaciones locales basadas en la nube, archivos (por ejemplo, XML, Excel, CSV, archivos planos) y API de servicios web.

Nuestras habilidades de integración de información empresarial especializada en herramientas ETL de vanguardia, incluyendo DataStage, Oracle Data Integrator, MS-SSIS, Informatica, Talend, AbInitio y similares que apoyan la entrega de soluciones de integración de datos escalables y fiables a nuestros clientes en todo el mundo. Las prestaciones de servicio de integración de datos de Virtusa adquieren datos estructurados y no estructurados de prácticamente cualquier fuente, integran y entregan datos de calidad en un entorno de alto rendimiento.

Nuestras historias de éxito:

  • Plataforma de datos analíticos basada en la nube para un proveedor líder de comparación de precios: desarrolló una plataforma de datos analíticos de última generación basada en la nube mediante nuevos modelos de datos empresariales, unificados, conformes y coherentes.
  • Lago de datos ágil para monetizar los datos de forma eficaz para un proveedor líder de análisis sanitario: desarrolló un lago de datos ágil basado en Hadoop, agilizó la ingestión de datos, distribuyó el almacenamiento de datos, el lago de datos (HDFS) y estandarizó y proporcionó un procesamiento de datos escalable.
  • Plataforma de datos Hadoop para una empresa líder en medios de comunicación e información: desarrolló un sistema integrado de métricas (IMS) basado en big data para ofrecer métricas de investigación y reducir significativamente el tiempo de procesamiento de datos.
  • Migración de dispositivos Oracle a Netezza para una compañía de seguros líder: proporcionó una estrategia de consolidación y migración de almacenes de datos de la plataforma Oracle a Netezza.
  • Implantación de un almacén de datos de clientes para una empresa de telecomunicaciones líder: unificación de los datos de los clientes a partir de más de 50 sistemas heredados para crear una visión de 360 grados del perfil del cliente.
Centro de Excelencia de Integración de Datos

Nuestro CoE de integración de datos ofrece una amplia gama de servicios para proporcionar a nuestros clientes la información que necesitan en el formato adecuado, de modo que su tiempo se emplee eficazmente en la toma de decisiones empresariales precisas y oportunas.

Nuestros servicios de integración de datos se basan en las mejores prácticas del sector, metodologías, conocimientos especializados y experiencia en compromisos similares.

Nuestras soluciones de integración de datos son suministradas por un grupo dedicado de especialistas en integración de datos, expertos en la materia, analistas de negocio y arquitectos técnicos, respaldados por nuestros procesos de CoE probados a lo largo del tiempo.

  • Más de 500 profesionales de servicios de integración de datos en nuestro CoE proporcionan diseño, arquitectura y liderazgo técnico de alta gama

  • Los aceleradores de soluciones y los marcos de trabajo probados aumentan la productividad y reducen el coste total de las implantaciones de EIM y mejoran el tiempo de comercialización

  • Componentes reutilizables que aceleran la entrega del proyecto

  • Reducción sustancial de costes gracias a nuestro modelo de entrega global

  • Gestión de la relación con el cliente de tamaño adecuado, de alto nivel de contacto y centrada en el cliente, proporcionando una experiencia superior al cliente

Herramientas y aceleradores

Aceleradores de modelos de datos centrados en el sector, desarrollados al nivel del modelo de datos lógico y con provisión para añadir elementos de datos que puedan ser necesarios más adelante

  • Aceleradores de modelos de datos: aceleradores de modelos de datos centrados en el sector, desarrollados al nivel del modelo de datos lógico y con provisión para añadir elementos de datos que puedan ser necesarios más adelante
  • Aceleradores ETL:
    • Monitor de los N trabajos que más tiempo consumen: mecanismo automatizado para identificar los trabajos ETL que consumen recursos para iniciar los esfuerzos de ajuste del rendimiento
    • Herramienta de comparación de trabajos: automatiza el seguimiento de los cambios de versión de los trabajos ETL, mecanismo automatizado para comparar la versión de un trabajo que permite una rápida puesta en marcha/retroceso de los trabajos resultantes de una solicitud de cambio
    • Herramienta de análisis de impacto: ayuda al desarrollo para el análisis de impacto, utilidades de búsqueda, listado de parámetros y complejidad del trabajo
    • Herramienta de automatización de pruebas ETL: una manera automatizada de comparar y realizar la validación de metadatos, proceso de verificación y validación automatizado que garantiza una precisión del 100 % en menos tiempo
    • Herramienta de estadísticas de carga/trabajos de ETL: automatiza la supervisión de los trabajos de DataStage a través de la solución de secuencias de comandos UNIX para recopilar las estadísticas del trabajo una vez completada la carga diaria
    • Herramienta de captura de rechazos de BD: captura los registros que se perdieron durante la carga debido a las restricciones de la base de datos, identifica la carga de datos incompleta a nivel de tabla / fila y proporciona un resumen de por qué hay una falta de conciliación de datos
    • Conciliación de atributos: proporciona un flash automatizado bajo demanda del recuento real de atributos en todos los proyectos, flujo de trabajo basado en un motor de reglas con algoritmos de recuento configurables que ahorran tiempo de conciliación
  • Herramienta de revisión de código ETL:
    • Permite la estandarización, lo que garantiza la calidad del código y la ejecución eficaz del trabajo
    • Solución escalable y configurable que puede ampliarse a todos los proyectos y escenarios
    • El procesamiento por lotes permite revisar varios objetos Talend de una sola vez
    • Proporciona detalles de error precisos sobre los objetos fallidos en el informe de revisión de código
    • La productividad se multiplica por 8
    • Capacidad para revisar los cambios que afectan a varios trabajos
  • Herramienta de prueba de validación de datos:
    • La validación de datos incluye la comprobación de que se cargan todos los registros, todos los campos y los datos completos de cada campo, y la validación de los datos de origen y de destino para comprobar el recuento y la integridad
    • Forma automatizada de comparar y realizar la validación de metadatos
  • Herramientas de garantía de entrega, plantillas:
    • Lista de comprobación de la revisión del diseño de la EIM
    • INFA, Oracle, Teradata, Talend, Ab Initio, DataStage: estándares de desarrollo y mejores prácticas
    • Lista de comprobación de desarrollo e implementación
  • Marco de migración ETL
    • Marco de migración ETL común que puede ampliarse a todas las herramientas: SSIS a Informatica y Ab Initio a Talend, etc.
Contenido relacionado