The next big thing?

Big data is na de cloud, mobiele toepassingen en sociale media het actuele ICT-buzzword. Daarbij draait het niet alleen om de explosief toenemende hoeveelheid gegevens. Big data slaat vooral op het vermogen informatie uit verschillende bronnen te combineren, verrijken en analyseren. Dit leidt tot nieuwe kennis en maakt voorspellingen mogelijk met een grote nauwkeurigheid. De impact op de maatschappij is enorm, net als de kansen voor het bedrijfsleven.

De term big data zoemt steeds nadrukkelijker rond en is onderwerp van een toenemend aantal blogs, boeken en bijeenkomsten. Bij velen roept de omschrijving vooral een beeld op van datacenters met eindeloze rijen servers. Dat is maar een deel van het verhaal. Want het draait niet zozeer om de beschikbaarheid van gegevens maar vooral om wat er mee gebeurt.

Meerdere bronnen
Volgens ICT-onderzoeksbedrijf Gartner moet bij big data sprake zijn van volume, variety en velocity. Gegevens moeten afkomstig zijn uit meerdere bronnen en verrijkt kunnen worden met andere, gestructureerde maar ook ongestructureerde data. Verder ligt hun toegevoegde waarde met name in de snelle beschikbaarheid. Een database met klantgegevens – hoe groot ook – valt niet onder de definitie. Dat is wel het geval als informatie over eerdere aankopen gecombineerd wordt met gegevens over surfgedrag om iemand online te triggeren met een aanbieding op maat.

Griep
Om inzicht te geven in de reikwijdte van big data, schetsen Viktor Mayer-Schonberger en Kenneth Culier in hun boek De Big Data Revolutie een aantal aansprekende voorbeelden. Als een nieuw griepvirus opduikt, is informatie over de verspreiding ervan vrijwel altijd gedateerd. Mensen zijn vaak al enige tijd ziek voordat ze een arts raadplegen. Ook worden gegevens niet continu verzameld. Google onderzocht of de verspreiding van een virus sneller voorspeld kon worden. Daartoe werd het online zoekgedrag in de VS vergeleken met officiële gegevens over griep. Dit was al eerder geprobeerd, maar zonder de rekencapaciteit en statistische expertise waarover Google beschikt. De sleutel lag niet – zoals verwacht werd – bij zoektermen als ‘griep’ of ‘medicijn voor hoest’. Google ontwierp daarom een systeem waarbij niet gekeken werd naar de inhoud van zoektermen. Er werd alleen gezocht naar een match tussen de frequentie van bepaalde zoekopdrachten en verspreiding van de griep. Verwerking van 450 miljoen verschillende wiskundige modellen leverde uiteindelijk een combinatie van 45 termen op die een sterke correlatie lieten zien met de landelijke griepcijfers. Hiermee bleek het mogelijk de geografische verspreiding van griep bijna realtime te voorspellen. Bij de griepepidemie in 2009 in de VS was het systeem van Google bruikbaarder en sneller dan de vertraagde statistieken.

Goedkope tickets
De Big Data Revolutie behandelt ook een initiatief van Oren Etzioni, big data-pionier avant la lettre. Hij ontwikkelde een voorspellingssysteem voor de prijs van vliegtickets, gebaseerd op een analyse van 12.000 prijsobservaties van een reiswebsite. Dit leidde tot een kleinschalig model dat in de praktijk prima voldeed en verder geperfectioneerd werd door Farecast. Dit bedrijf verzamelde aanvullend onder meer grote aantallen gegevens uit een reserveringsdatabase van de luchtvaartbranche. Voor haar voorspellingen verwerkte Farecast bijna 200 miljoen vluchtprijsrecords. Wordt een prijsdaling voorzien dan volgt het advies te wachten met kopen, stijgt het gemiddelde tarief dan is het slim om toe te slaan. Microsoft kocht het bedrijf in 2008 en integreerde de dienstverlening in zoekmachine Bing.

Rechtsaf
Professor Erik Brynjolfsson is directeur van het MIT Center for Digital Business en veelgevraagd spreker over – onder meer – de impact van data. Hij liet projecten met big data bij 330 bedrijven onderzoeken en lichtte er tijdens een Amsterdams congres in mei vorig jaar een aantal toe. Zo kan een wijnmaker door de samenstelling van zijn product nauwkeurig te ontleden, vooraf voorspellen hoe de wijn smaakt. Pakjesbezorger UPS gebruikt big data om te achterhalen dat een route waarbij bestelauto’s alleen naar rechts afslaan sneller en goedkoper is dan de ‘traditionele’ kortste weg. En een analyse van zoekopdrachten in Google bleek in de VS waardevoller als voorspeller van de koopbereidheid op de huizenmarkt dan statische modellen als historische gegevens en economische indicatoren.

Microscoop
Bij onderzochte big data-projecten zag Brynjolfsson gemiddeld een toename van 4 procent in productiviteit; de winst steeg met 6 procent. Natuurlijk gaat het lang niet altijd om succesverhalen, benadrukt hij. Maar wanneer een project geen resultaat oplevert, komt dat volgens de professor meestal niet door een gebrek aan relevante data maar door de kwaliteit van de analyses. Brynjolfsson ziet big data niet alleen als een technische doorbraak maar denkt dat het zal leiden tot een revolutie in de hoofden van bestuurders. Hij vergelijkt big data zelfs met de uitvinding van de microscoop. Toekomstige beslissingen zullen niet langer gebaseerd zijn op aannames en keuzes van een beperkt aantal leiders. Ze kunnen genomen worden op basis van gegevens, van feitelijke informatie.

Revolutie
Viktor Mayer-Schönberger en Kenneth Cukier schetsen in De big data revolutie de gevolgen van de mogelijkheid om een schier oneindige reeks gegevens met elkaar te verbinden en te analyseren. Het is een toegankelijk boek dat een breed publiek zal aanspreken. Conclusie: big data zal onze manier van denken, werken en leven voorgoed veranderen (Maven Publishing, € 22,-).

Oorzaak en gevolg
In het verlengde daarvan wijzen Cukier en Mayer-Schönberger op een andere belangrijke verandering. Om ontwikkelingen te voorspellen en beslissingen te onderbouwen, worden op dit moment nog vooral steekproeven gebruikt. Omdat het gaat om een beperkt aantal gegevens moeten die steekproeven zeer zorgvuldig zijn samengesteld om waarde te hebben. Door de enorme hoeveelheid informatie die beschikbaar is voor analyse hoeft onderzoek bij big data veel minder nauwkeurig te zijn om toch betrouwbare conclusies te kunnen trekken. Zelfs gegevens waarmee op het eerste gezicht geen verband wordt verwacht, kunnen in het onderzoek worden betrokken. Big is beautiful, in dit geval; kwantiteit leidt tot kwaliteit. Een wezenlijk verschil met de wereld zoals we die kennen, is ook dat het niet langer essentieel is om te weten waarom iets zo is. Big data maakt het op grond van gegevensanalyse mogelijk om te voorspellen dat iets met zeer grote waarschijnlijkheid het geval is. Causaliteit wordt minder belangrijk. We hoeven niet noodzakelijkerwijs op zoek te gaan naar de oorzaak als het gevolg bekend is.

4,4 miljoen banen
De hoeveelheid gegevens neemt explosief toe. Denk aan bronnen als online zoekgedrag, smartphones, applicaties, profielen en berichten in sociale media. De opslag en ontsluiting van al deze data levert in technische zin amper problemen op. De sleutel ligt in het vermogen om onderlinge verbanden te leggen met hulpmiddelen als analysesoftware en algoritmes. Dus zal een sterke vraag ontstaan naar onderzoekers en analisten. Gartner voorziet dat in 2015 wereldwijd 4,4 miljoen banen gecreëerd worden die samenhangen met big data. Europa zal bijna een derde hiervan voor zijn rekening nemen. Het onderzoeksbureau verwacht echter dat maar 1 op de 3 van deze banen ook werkelijk kan worden ingevuld. Privacy is een andere bottleneck. Koppeling en analyse van gegevens kan leiden tot discriminatie. Ook zorgt het mogelijk voor conflicten met bestaande wetgeving en toekomstige Europese privacyregels.

Goud in handen
Deze belemmeringen doen amper iets af aan de potentie van big data. Op maatschappelijk vlak, zoals in de gezondheidszorg of bij de bestrijding van criminaliteit. Maar ook zakelijkzijn de kansen enorm. Meest voor de hand liggend voorbeeld is Google, waar big data het hart van de business vormt. Eerst alleen met gegevens over zoekgedrag, later ook door input via gmail, Android (gekocht in 2005) en YouTube (gekocht in 2006). Al deze bronnen leveren Google een enorme berg gegevens op. Die kunnen worden geanalyseerd en te gelde gemaakt. Nu nog vooral door het verkopen van advertenties, maar de toepassingsmogelijkheden gaan veel en veel verder. Ook andere grote dataverzamelaars als Facebook en Amazon hebben goud in handen.

Concurrentievoordeel
Maar wat is de impact van big data voor ‘gewone’ bedrijven? Een aantal van de voorbeelden laat de diversiteit van de potentiële meerwaarde zien. Het vermogen om data strategisch in te zetten, zal in sommige gevallen zelfs doorslaggevend zijn voor het voortbestaan van een organisatie. Voor bijna alle sectoren geldt in elk geval dat big data concurrentievoordeel kan opleveren. Bedenk daarbij wel dat het een nieuw onderwerp is in de snel opvolgende reeks ICT-aandachtsvelden. Bedrijven die nog volop bezig zijn om de mogelijkheden van sociale media en mobiele toepassingen te ontdekken, moeten zich voorbereiden op een volgende uitdaging. En dan kondigen experts alweer een volgende stap aan: nanodata, waarbij informatie uit de grote gegevensstroom gebruikt wordt om in te zoomen op de individuele klant. Het houdt niet op.

Leave a Reply

Your email address will not be published. Required fields are marked *