Big Data. Het nieuwe goud?

Big Data is een term die binnen de datacenterwereld reeds een aantal jaren langskomt. Door het recente “klokgelui” van Snowden heeft het meer bekendheid gekregen. Maar wat is het nu, en wat kun je ermee?

Iedereen die met internet werkt zal vrijwel dagelijks te maken hebben met zaken die Big Data gerelateerd zijn zonder dat men er erg in heeft. Heeft u zich wel eens afgevraagd hoe het kan dat Linkedin met “People you may know” bijna altijd met mensen komt die inderdaad op de één of andere manier relaties zijn, ook al heeft u misschien al jaren geen contact meer? Of hoe het komt dat Amazon, nadat u ooit een boek heeft besteld in een bepaalde categorie, met voorstellen komt van boeken die u inderdaad interesseren?

Definitie

Net als voor de term Cloud is er voor de term Big Data niet een vaste definitie. De term wordt over het algemeen toegepast als er aan drie voorwaarden wordt voldaan. De eerste is voor de hand liggend; het gaat om grote hoeveelheden data, meer dan met een regulier databasemanagement systeem verwerkt kan worden. De tweede voorwaarde is dat de data met hoge snelheid gegenereerd wordt, een Big Data set is geen statische omgeving maar verandert constant. De derde voorwaarde is dat het om een enorme variëteit aan data gaat. De data is dan niet direct aan elkaar gerelateerd waardoor het moeilijk is directe verbanden of trends te zien.

Analyse

Enorme hoeveelheden data bewaren heeft weinig zin als je er niks mee doet, de waarde van de Big Data zit hem juist in de analyses die er op los gelaten worden. Door allerlei slimme berekeningen en algoritmen los te laten op de data is er vaak zeer interessant informatie uit grote datasets te halen. Een mooi voorbeeld van hoe Big Data gebruikt zou kunnen worden is het vroegtijdig signaleren van de uitbraak van ziekten in een bepaalde regio. Mensen zullen op Facebook berichtjes zetten als: “voel me niet lekker, ziekjes”. Vanuit dezelfde regio zullen op Twitter gelijksoortige berichten verschijnen en zullen op Google vaker dan anders searches worden gedaan naar anti-griep middelen. Door deze gegevens te matchen met de geografische locaties van waar ze gepost werden kan de trend ontdekt worden en kunnen er indien nodig maatregelen worden genomen. Voor een fabrikant van hoestdranken heeft deze informatie commerciële waarde. Hij zal op Facebook, of in de Google pagina waarop de gebruiker gezocht heeft graag zijn advertentie bovenaan zien waardoor er extra omzet gegenereerd wordt. Met name om deze marketingwaarde wordt Big Data ook wel de nieuwe olie of het nieuwe goud genoemd. Big Data geeft kennis, kennis is macht.

Snowden

Op zich is Big Data niet nieuw. Al sinds het ontstaan van de eerste zoekmachines worden de zoekopdrachten en de resultaten daarvan geanalyseerd. Ook is het niet nieuw dat Amerikaanse bedrijven hun data, al dan niet verplicht, ter beschikking stellen aan de NSA. Edward Snowden heeft met zijn “klokgelui” veel mensen de ogen geopend. Voor het grote publiek was het blijkbaar niet helemaal duidelijk, maar wie de paginalange voorwaarden voor het gebruik van de vaak gratis beschikbare software helemaal doorworstelt zou niet verbaasd mogen zijn de eigen data in feite uit handen te geven. Het staat er allemaal wel degelijk in vermeld. Ook in het geval van de NSA gaat het weer om de kennis die uit Big Data gehaald kan worden en ook hier geldt; kennis is macht.

Kritisch

In veel bedrijven worden de eerder genoemde gratis online diensten vaak gebruikt voor “het gemak”. Het is zo makkelijk om je bestanden met een collega te delen via Dropbox, of om even snel het privé e-mail account van Gmail te gebruiken om dat vertrouwelijke document te versturen zodat je er ’s avonds nog even naar kunt kijken. Maar is het ook de bedoeling dat er allerlei analyses worden losgelaten op de data van die bedrijven? In de Nederlandse datacenters wordt er gelukkig anders omgegaan met data. Data zal zeker niet zomaar beschikbaar worden gesteld aan derden. Als datacentersector is het zaak dat we onze klanten goed adviseren en de risico’s van Big Data inzichtelijk maken. Hierdoor kunnen we als sector een sterke positie in Nederland bewerkstelligen en helpen we bedrijven de juiste kant op.


Peter Bult is Manager Consultancy & Projecten bij Previder.

Dit artikel verscheen eerder op de blog van Previder en is met toestemming op ISP Today overgenomen.