I en typisk/traditionell ETL- eller datalagerlösning måste du mata in data i din datasjö från olika källsystem och rensa dem innan de kan bearbetas vidare av nedströmsapplikationer. Dessutom har datamigrering från lokala system till moln i nuvarande scenario blivit mer och mer populärt.
Virtusa som strategisk affärspartner initierade processen med migrering av klientens befintliga ramverk för datainsamling med hjälp av Hadoop moderniseringstekniker på AWS. Dessutom använde vi Talend för att extrahera, transformera och ladda (ETL) med hjälp av kundens serverlösa ramverkslösningar för datasjöar.
I ett inlägg skapade vi idén att dra nytta av metadatadrivet ramverk för dataintegrering och utvecklade beskrivningen för att mata in data från alla strukturerade datakällor till valfri destination genom att lägga till metadatainformation i en metadatafil/-tabell. Detta ramverk kan mata in data från alla strukturerade datakällsystem (RDBMS som Oracle, Local File, FTP-serverdrag etc.) och lagra data till valfri destination (AWS S3, Azure ADLS, RDS etc.).
Denna accelerator stöder schemautveckling. Alla ändringar i schemat för ett befintligt flöde har ingen inverkan på lösningsramverket, vilket minskar behovet av kodändringar. Detta kommer att spara bygg- och testtid och mycket ansträngning genom att minska behovet av konsekvensanalys av eventuella schemaändringar.