Gegevensontsluiting
Extract, Transform en Load
Extract
Tijdens de extractie fase worden de gegevens uit het bronsysteem gehaald en desgewenst getransformeerd naar een bruikbaar formaat. Tijdens deze laag kan er voor gezorgd worden dat alleen de wijzigingen worden overgenomen, zodat gegevens die niet veranderd zijn ook niet opgehaald hoeven te worden.
Gegevens kunnen worden overgenomen uit databases, flat files, Microsoft Excel bestanden en nog een tal van andere ‘gegevensbronnen’ zoals niet-relationele databronnen. Deze gegevens worden in een ‘staging’ geplaatst. Tijdens de extractie vindt al een eerste opschoonactie plaats; er wordt gecontroleerd of de overgehaalde data aan de kwaliteitsverwachting voldoet.
Transform
Gedurende de transformatie fase worden tal van zaken uitgevoerd om de gegevens om te vormen naar bruikbare informatie, zo kunnen tijdens deze fase de volgende stappen worden genomen:
- Gecodeerde gegevens omzetten naar leesbare informatie (bijv. M naar Man, 1 naar Ja, etc.).
- Gegevens verrijken; zo kunnen onjuiste adresgegevens worden verrijkt daar waar bijv. geen postcode beschikbaar is, of er kan een controle plaatsvinden o.b.v. postcode en huisnummer met woonplaats en straat, om zo de kwaliteit van de gegevens te waarborgen.
- Aggregaties; gegevens kunnen worden verwerkt tot op een hoger niveau, waardoor men eenvoudiger en sneller kan rapporteren.
- Validaties; gegevens worden gecontroleerd of ze correct zijn, en zonodig gecorrigeerd.
- Definities; deze worden in de transformatie vastgelegd (en beschreven voor de gebruiker), zodat iedereen over dezelfde informatie met dezelfde definities beschikt.
- Calculaties, samenvoegen gegevens, sorteringen, etc.
Load
De load fase wordt gebruikt om de gegevens in het uiteindelijke Data Warehouse model te laden. Hiervoor zijn verschillende modellerings technieken beschikbaar, zoals sterschema’s (Kimball), Snowflakes en Data Vault. Rivium Business Solutions heeft veel kennis van Kimbaliaanse sterschema’s en past dit dan ook veelvuldig toe. Een sterschema maakt het, zeker in combinatie met de tools die wij gebruiken, enorm flexibel om te rapporteren. Naast sterschema’s worden er ook Datamarts gerealiseerd, waarbij de informatie al kant-en-klaar beschikbaar is voor de business user. De definities en naamgeving zijn uniek in het Data Warehouse.
Rivium Business Solutions gebruikt de ETL tools van Microsoft en BusinessObjects. Daarnaast is Rivium Business Solutions gespecialiseerd in het real-time ontsluiten van gegevens, waardoor wij in staat zijn real-time informatie te verschaffen aan de gebruikers.


