De andere kant van big data

Geschreven door Ronald Kubbe op 17-03-2014


Big data is hot. Op radio, online en op papier wordt veel geschreven over big data. Heel veel van die verhalen gaan over de mogelijkheden van big data. Deze mogelijkheden liggen op verschillende gebieden. Zo kondigde de ING vorige week aan om betaalgegevens van klanten te gaan analyseren om persoonlijke aanbiedingen te kunnen doen. In de volkskrant las ik een artikel over het gebruik van big data in de zorg, waarbij met behulp van big data ernstige aandoeningen eerder opgespoord kunnen worden. 

De indruk ontstaat dat de mogelijkheden van big data onbeperkt zijn. Door gebruik te maken van slimme computerprogramma’s kunnen snel verbanden in grote datasets ontdekt worden èn kunnen persoonlijke ‘adviezen’ gegeven worden. Hierbij worden interessante nieuwe methodieken gebruikt die een grote aanvulling zijn op de traditionele statistiek die ik ooit geleerd hebt. Er hoeft niet meer gewerkt te worden met bijvoorbeeld valide steekproeven, maar de hele dataset kan in totaliteit geanalyseerd worden (inclusief de vervuiling in de dataset).

Wat is de andere kant van big data waar ik in de titel van deze blog op doel? De andere kant van big data is de kant van het verzamelen van data. Als je betekenisvolle informatie uit gegevens wilt gaan halen met big data technieken zal je wel eerst de data moeten gaan verzamelen en vastleggen. Niet iedereen is in het bezit van gegevens van miljoenen klanten zoals banken. 

Wordt het tijd je zorgen te gaan maken als je nog geen enorme grote hoeveelheden data tot je beschikking hebt? 
Hoe kom je aan waardevolle gegevens die je nieuwe inzichten gaan opleveren? Moet je apps laten ontwikkelen die gegevens van je klanten vastleggen, moet je social media data gaan verzamelen, moet je sensoren in systemen bouwen die van alles en nog wat registreren? 

Het verzamelen van (veel) gegevens is geen doel op zich, volgens mij is big data vooral een andere kijk op informatie, waarbij je gebruik maakt van de huidige ICT mogelijkheden. Een mooi voorbeeld las ik al weer enige tijd geleden in de computable. Hier werd verwezen naar de manier waarop de NS data gebruikt voor het communiceren over de bezettingsgraad van treincoupés. De bezettingsgraad wordt niet meer op de traditionele manier voorspeld op basis van historische steekproeven. Nu wordt dit gedaan aan de hand van camerabeelden waarmee te zien is hoeveel mensen er op elk moment daadwerkelijk in de trein zitten. Deze informatie wordt vervolgens gebruikt in de NS-app om informatie te leveren over de daadwerkelijke bezettingsgraad. De klant kan dan kiezen om te gaan staan of een volgende trein te nemen. 

Als je met big data aan de slag wilt gaan, denk dan eerst na over de vraag wat informatie voor uw organisatie betekent. Kies vervolgens de juiste aanpak en methodiek(en) en zoek hier vervolgens slimme oplossingen bij. Zaken als bijvoorbeeld privacywetgeving dienen hierbij zeker niet over het hoofd gezien te worden.

We helpen u graag bij het nadenken over, en het organiseren van uw informatie.


Labels: innoviq, big data, informatisering, organiseren van informatie