Big data; toekomst of bedreiging?

OP het congres vertelde Sander Klous over een risico van big data ook wel het Simpson’s paradox genoemd. Deze paradox is aan niet-statistici eenvoudig uit te leggen met het voorbeeld waarin uit statistieken blijkt dat zeelieden die overboord zijn geslagen zonder reddingsvest vaker konden worden gered door de hulpdiensten dan de zeelieden die wel een reddingsvest droegen. Dat druist in tegen elke intuïtie maar blijkt bij nadere analyse heel goed verklaarbaar. De zeelieden bleken er vooral in slechte weersomstandigheden voor te kiezen wel een reddingsvest te dragen.
big data congres
Dit voorbeeld is typerend voor de wereld van data scientists. Een foute conclusie op basis van een statistische analyse kan levensgevaarlijk zijn. Het zal de eerste keer niet zijn dat op basis van data-analyse wordt besloten het gebruik van zwemvesten te staken. In overdrachtelijke zin dan.

Meer variabelen betekent meer analyseren

Hoe meer data er geanalyseerd moet worden hoe meer je te maken hebt met extra variabele. Zoals het vorige voorbeeld de weersomstandigheden, stroming, temperatuur van het water. Brenno de Winter heeft hierna gehad over privacy van data. Hij geeft aan dat een gebruiker altijd op de hoogte moet zijn wat er met zijn data gebeurd en waar het voor gebruikt wordt.
Hierbij het voorbeeld van de wifi tracking bij winkels. Deze winkel verzamelt via wifi gegevens van welke route klanten lopen in een winkel, of welke klanten voorbij lopen langs de winkel. Op deze manier is bij te houden hoe vaak klanten terug keren naar de winkel en waar ze naar kijken in de winkel.

Meer weten over big data?

Meer weten over big data en hoe je het kunt inzetten voor jouw organisatie? We gaan graag met je in gesprek om de mogelijkheden te bespreken!

Hebben we je interesse?

Waarmee kan ik jou helpen? Ik ga graag met je in gesprek om te komen tot online resultaat.

 

Hebben we je interesse?

Zoeken