Gefragmenteerde data harde rem op bedrijfsgroei

Columns

Big data is de toekomst. AI is onmisbaar om concurrerend te blijven. Het zijn koppen die in tal van varianten al jarenlang voorbijkomen. De cijfers liegen er niet om: we maken iedere dag steeds grotere hoeveelheden data aan. 2,5 miljoen Terabyte om precies te zijn – dat zijn zo’n 2,5 miljoen PC’s die we iedere dag volledig vullen. En het einde is nog niet in zicht: organisaties én consumenten digitaliseren steeds meer, waardoor we in 2025 naar verwachting dagelijks zo’n 463 miljoen Terabyte aanmaken.

De vraag is hoe je in hemelsnaam zo’n verbijsterende hoeveelheid data op een kostenefficiënte manier bruikbaar maakt. Kort gezegd doe je dit door je data centraal bruikbaar én beschikbaar te maken. De werkelijkheid zit iets complexer in elkaar.

Alle data, verzamelen!

Om waarde uit je data te h...

Sander Griffioen
Lid sinds 2019
De strekking van het artikel is om 'twee werelden bij elkaar te brengen', in dit geval datalake en datawarehouse, en dat wordt dan 'datalakehouse'. De hypothese die hier onder zit, is dat als je '2 werelden bij elkaar brengt, het beter zal gaan'. Is dat wel zo? Mij lijkt beter dat je dergelijke zaken altijd moet toetsen aan doel en waarde. Hieruit kun je vervolgens afleiden hoe je iets zou moeten organiseren. Een voorbeeld. Het doel, en de waarde van een organisatie die geen relevantie ontleent aan data-onderzoek en data-analyse, omdat hun bedrijfsvoering dit niet nodig heeft, zal hier niets aan hebben. Terwijl een organisatie, die het doel heeft zich te onderscheiden door data-gedreven producten en diensten te ontwikkelen, en daar waarde aan ontleent, zal dit mogelijk wel zo organiseren.
Met andere woorden, de context van doel en waarde bepaalt hoe je om gaat met je data-organisatie. En daar zou een datalakehouse een uitwerking van kunnen zijn, maar hoeft niet per sé.

Meer over IT en Business