Big Data wordt het nieuwe technologische goud, een force majeure die het toekomstige internetlandschap en zelfs de maatschappij zoals wij die kennen grondig gaat veranderen. Ook voor ondernemers en marketeers opent de groeiende informatiestroom nieuwe poorten. Maar wat is Big Data precies? En hoe kun je die enorme schat aan gegevens effectief inzetten voor gericht marktonderzoek en het verbeteren van je onlinemarketingstrategie?
In dit artikel bespreken we eerst de definitie van Big Data en waar het voornamelijk voor wordt ingezet. Vervolgens behandelen we de verschillende componenten waar Big Data uit kan bestaan, waarna we dieper de materie induiken. Dit begint met de verschillende stappen die je doorloopt bij het gereedmaken van de data voor analyses. Big Data research en data mining zijn hierbij zeer belangrijk. Hierna bespreken we de verschillende onlinemarketingtechnieken die kunnen worden toegepast met behulp van Big Data, aangevuld met enkele voorbeelden. Tot slot, benoemen we de laatste trends op het gebied van Big Data die een goed beeld geven van de mogelijkheden in de toekomst.
Wat is Big Data precies?
Een duidelijke en eensluidende definitie van Big Data bestaat eigenlijk niet. Het begrip kan toegepast worden op een grote verscheidenheid aan datatypen. Video, audio, persoonsgegevens, tekst of cijfers, Big Data kan allerlei vormen aannemen. Ook de precieze omvang die een dataset moet hebben voordat we de term Big Data uit de hoge hoed kunnen toveren is onderwerp van discussie. Sommigen scharen alle data die niet meer op één pc passen onder Big Data, terwijl anderen de term pas in de mond nemen als de bulk aan gegevens het niveau van meerdere servers ontstijgt. De definitie die Wikipedia geeft is vermoedelijk de meest werkbare. Wiki spreekt over een of meer datasets die te groot zijn om met reguliere databasemanagementsystemen te worden onderhouden. IT-onderzoeksbureau Gartner linkt het predicaat Big Data aan de hoeveelheid data, de snelheid waarmee de informatie opgevraagd kan worden en de diversiteit van de gegevens.Oneindige datastroom
Wat wel duidelijk terugkomt in de diverse omschrijvingen van Big Data is het tweeledige karakter van het begrip. Enerzijds beschrijft de term de omvang van een verzameling data. Volgens Gartner stromen er tegenwoordig jaarlijks vele honderden miljoenen gigabytes door de leidingen van het internet. Foto’s op Flickr, Instagram en Facebook, video’s op Netflix, het geklets en gemopper op Twitter, de accounts die mensen aanmaken op webshops: het is tezamen goed voor een oneindige stroom data waar bedrijven zich de vingers bij aflikken. De hoeveelheid digitale informatie groeit enerzijds sterk omdat internetgebruikers en consumenten zelf steeds meer gegevens opslaan in de vorm van tekstbestanden, foto’s en films. Aan de andere kant komen er ook meer apparaten op de markt die zelf data opslaan, verzamelen en uitwisselen.Big Data als ontwikkeling
Maar Big Data staat voor meer dan alleen datavolume. Het begrip omschrijft ook een ontwikkeling die bestaat uit twee elementen. Allereerst is er natuurlijk de snel voortschrijdende computertechnologie. De steeds slimmere en krachtigere hard- en software maakt het verzamelen, bewerken en opslaan van grote datasets steeds gemakkelijker. Het tweede component van de Big Data-ontwikkeling wordt gevormd door de statistiek. Betere algoritmen en statistische modellen stellen databeheerders in staat om verzamelingen losse gegevens te segmenteren en te analyseren. Zo wordt het mogelijk om betekenis en samenhang te vinden in een grote verzameling data die op het eerste gezicht willekeurig lijkt.Big Data als conversieverhoging voor Google Adwords
De hierboven beschreven Big Data-ontwikkeling kan in de praktijk ook worden aangewend voor het verhogen van de conversie met Google AdWords. Door te spelen met gegevens en inzichten over het zoek- en klikgedrag van prospects en hier goede software en algoritmes op los te laten, wordt het mogelijk om na te gaan welke advertenties in AdWords goed (of juist matig) worden bekeken en veel (of weinig) conversie opleveren. Omdat de hoeveelheid aan beschikbare gegevens te groot is om alleen te behappen, biedt speciale Big Data-software uitkomst. Denk bijvoorbeeld aan het toepassen van gerichte klantsegmentatie en actuele productfeeds. Een dergelijke aanpak heeft een aantal belangrijke voordelen.- Het wordt mogelijk om de ideale boodschap voor de gesegmenteerde klant te creëren. Hierbij kun je onder meer kijken naar de locatie, demografische gegevens, het koopgedrag en de gebruikte apparaten van de beoogde prospect.
- Nauwkeurige rendementsberekeningen leiden tot meer winst.
- Bedrijfskosten worden verminderd met behulp van Big Data-analyses op willekeurige samenhang.
- Een betere diversificatie van kansen en mogelijke risicofactoren ligt binnen handbereik.
- Het toepassen van splittests voor benchmarking wordt gemakkelijker. Vergelijk meerdere versies van een advertentie op AdWords op performance en conversiedichtheid. De uitvoering die de meeste conversie oplevert is het winnende design.
- Predictive bidding linkt een aanbieding aan de waarschijnlijkheid dat een product door bepaalde prospects ook daadwerkelijk wordt gekocht. Met behulp van Big Data-software wordt het gemakkelijk om de kracht van predictive bidding direct te vertalen naar extra omzet.
Big Data is niet helemaal nieuw
Helemaal nieuw is het fenomeen Big Data natuurlijk niet, want grote bedrijven en wetenschappelijke instellingen zijn altijd al gulzige dataverzamelaars geweest. De Amerikaanse supermarktketen WalMart verwerkte en analyseerde bijvoorbeeld reeds in de jaren negentig van de vorige eeuw zo’n zeven miljard transacties per jaar. Het doel spreekt voor zich: marktonderzoek dat de wensen, behoeften en koopgewoonten van klanten en prospects beter in kaart moest brengen. De ontwikkeling is dus niet helemaal revolutionair, maar heeft inmiddels wel een schaal en complexiteit zonder precedent bereikt.Big Data als toekomstvoorspeller
Big Data vormt een prima hulpmiddel voor het accurater maken van toekomstvoorspellingen, een strategie die in het Engels bekendstaat als predictive analysis. Big Data helpt namelijk om correlaties te vinden tussen personen, fenomenen en gebeurtenissen. Door die relaties in kaart te brengen, kunnen risicoprofielen en concurrentieanalyses worden opgesteld of marketingcampagnes worden geoptimaliseerd. Verzekeraars gebruiken bijvoorbeeld bergen informatie om risico’s van individuele klanten in te schatten. Ook banken gebruiken Big Data Finance om meer inzicht te krijgen in bepaalde markten. Daarnaast maken beurshandelaren gretig gebruik van Big Data. Ze voeden hun modellen met tientallen, soms zelfs duizenden datastromen om handelsrisico’s en buitenkansjes vroeg op het spoor te komen. Big Data, concurrentieanalyse en goed marktonderzoek gaan tegenwoordig hand in hand.Business intelligence en data science
Omdat Big Data Research (dit behandelen we verderop in dit artikel) zich vooral richt op het vinden van patronen en verbanden in grote datasets, biedt deze vorm van data science ongekende mogelijkheden om vooruit te kijken en betrouwbare voorspellingen te doen over zaken als consumentengedrag en markttrends. Dat is ook het grote verschil met business intelligence (BI), een manier van datavergaring die meer draait om terugkijken. Traditionele BI-toepassingen geven managers en business intelligence-specialisten bijvoorbeeld inzicht in zaken zoals de productie die een bedrijf in de loop der jaren heeft gedraaid of de gerealiseerde capaciteitsbezetting. Big Data geeft vooraf inzicht in zulke processen en is dus prima te vertalen naar gericht marktonderzoek. Hierdoor zijn organisaties en business intelligence-specialisten beter in staat om hun prestaties en dienstverlening aan klanten te verbeteren. Bovendien kun je met de hulp van Big Data ook betere concurrentieanalyses uitvoeren of flink besparen op bedrijfskosten.Online-benchmarks en concurrentieanalyse
Door het uitvoeren van online-benchmarks (vergelijkend marktonderzoek waarbij de prestaties van organisaties, producten, diensten of programma’s worden onderzocht en met elkaar worden vergeleken), kan Big Data ook inzicht geven in de prestaties en activiteiten van branchegenoten. Een online-benchmark verschaft informatie over de kwaliteit die een bedrijf biedt en laat zien wat andere organisaties met een vergelijkbaar product- of dienstenaanbod leveren. Die gegevens helpen bij het optimaal positioneren van diensten en producten binnen het eigen marktsegment. Bovendien leveren ze het benodigde materiaal voor het opstellen van een gedegen concurrentieanalyse, een belangrijk onderdeel van elk marktonderzoek. Dankzij Big Data wordt het mogelijk om inzicht te krijgen in belangrijke onderdelen van een concurrentieanalyse zoals het assortiment, prijs- en reclamebeleid en de doelgroep van jouw zakelijke rivalen.Voordelen van business intelligence
Hoewel het verschillende methoden zijn, vullen business intelligence en data science elkaar op het gebied van marktonderzoek, databasemarketing en concurrentieanalyse goed aan. Door het inzetten van business intelligence beschikt iedereen binnen uw organisatie standaard over juiste en actuele informatie. Een aantal voordelen van business intelligence op een rij:- Business intelligence stelt managers in staat om beslissingen te nemen op basis van betrouwbare en actuele informatie.
- De belangrijkste informatie kan op een relatief eenvoudige manier toegankelijk worden gemaakt voor elk lid van de organisatie.
- Data kan gevisualiseerd worden met dashboards en scorecards.
- Business intelligence maakt de actuele en historische prestaties van een bedrijf inzichtelijker.
- Het verruimde inzicht plaveit de weg naar minder kosten en meer omzet.
Business intelligence combineren met data science
Door business intelligence te combineren met data science, verenig je het beste van twee werelden. Data science biedt namelijk extra voordelen die prima aansluiten op de mogelijkheden van business intelligence.- Er ontstaan meer mogelijkheden voor personalized marketing. Leer de klant beter kennen en pas jouw boodschap hier actief op aan.
- Met behulp van clickstream-analyses is het mogelijk om het surfgedrag van klanten en prospects nauwgezet te analyseren.
- Middels predictive maintenance kunnen onderhoudskosten worden teruggeschroefd.
- Lever maatwerk. Door de doelgroep te segmenteren en analyseren, kunnen producten en diensten op maat worden ontwikkeld.
- Leer trends op tijd te spotten om bedrijfsrisico’s te verminderen.
Big Data Research
Omdat Big Data enorme hoeveelheden gegevens behelst, is research een belangrijk onderdeel van de doelgerichte toepassing ervan. De informatie moet namelijk eerst gefilterd en geanalyseerd worden voordat je er in de marketingpraktijk iets mee kunt beginnen. Gelukkig zijn er diverse Big Data-platforms, tools en programma’s die kunnen helpen bij het segmenteren en ordenen van gegevens.Webcrawlers
Webcrawlers zijn bots die op een geautomatiseerde en methodische manier het internet doorbladeren. De webscrapers maken meestal kopieën van gevonden pagina’s om die later te kunnen verwerken en indexeren. Het voordeel van webcrawlers is dat ze pagina’s veel sneller kunnen opvragen en verwerken dan een mens. Webscraping is een goede manier om het wereldwijde web doelgericht te doorzoeken op praktische informatie die van pas kan komen bij gericht marktonderzoek.1. Management van Big Data
Voordat je aan de slag gaat met Big Data, moeten die gegevens natuurlijk eerst ergens worden opgeslagen. Tegenwoordig zijn er diverse Big Data-platforms die uitkomst bieden bij het bewaren van grote datasets.- Hadoop: dit open source-framework maakt het mogelijk om enorme datasets op te slaan in computerclusters. Hadoop is geschikt voor diverse datatypen en bezit een indrukwekkend processievermogen.
- MongoDB: dit Big Data-platform is ideaal voor het managen van data die ongestructureerd is of vaak van verschijningsvorm wisselt. Denk bijvoorbeeld aan mobiele apps of productcatalogussen.
- Talend: Talend is ook een open source-platform. Het is gratis en dus ook interessant voor bedrijven die zich nog in de opstartfase bevinden. Talend is ook gemakkelijker te gebruiken dan veel andere Big Data-platforms.
2. Data cleaning
Om verbanden tussen data vast te kunnen stellen, moeten gegevenssets eerst opgeschoond worden. Het is vaak een ondoenlijke taak om dat allemaal handmatig te doen. Gelukkig is er speciale Big Data-software die helpt bij het ordenen van informatie. Voorbeelden van zulke Big Data-cleaningtools zijn OpenRefine en DataCleaner.3. Het analyseren van Big Data
Ook voor de volgende stap in het proces, de statistische analyse, bestaat prima software. Goede voorbeelden zijn Oracle, Qubole, BigML en Statwing. Analyse stelt je in staat om specifieke vragen te stellen aan gegevens. De antwoorden kunnen tijdens het doen van marktonderzoek worden omgezet in concrete strategieën en toepassingen die het langjarige bedrijfssucces verbeteren.4. Visualiseren van data
Dé uitdaging voor menig Big Data Scientist is het visualiseren van dataverbanden. Het is immers wel handig als ook de overige medewerkers binnen het bedrijf weet hebben van de materie. Hier komt de Big Data-software om de hoek kijken die zich richt op het toonbaar maken van statistische gegevens. Met behulp van tools als Tableau, Silk, CartoDB en Chartiois wordt het mogelijk om data te presenteren in de vorm van kaarten, allerhande grafieken en diagrammen of tabellen.Het belang van Big Data-specialisten
Om de kansen die Big Data biedt optimaal te benutten, heb je naast goede hard- en software ook mensen nodig die statistische verbanden kunnen ontleden. Iemand die de knopen in de gigantische kluwen van ongeordende gegevens kan ontwarren dus. Die taak is weggelegd voor Big Data Scientists, meestal professionals met een technische en/of wiskundige achtergrond. Hoe groot de impact van een Big Data Scientist op het marktonderzoek van een bedrijf kan zijn, blijkt uit een op de website Master’s in Data Science gepubliceerd interview met datawetenschapper Lisa Qian (Airbnb): “Als dataspecialist ben ik betrokken bij de complete levenscyclus van een product. Ik werk mee aan het ontwerpen ervan en doe marktonderzoek om de impact van een product te meten. Die inzichten neem ik vervolgens mee bij het creëren van nieuwe producten en het bedenken, uitstippelen en optimaliseren van marketingstrategieën.”Taken van een Big Data Scientist
Een Big Data-specialist heeft een uitgebreid, complex en variabel takenpakket. Data-analisten moeten bijvoorbeeld grote hoeveelheden gegevens uit diverse bronnen (zowel interne als externe) kunnen halen. Vervolgens gaan ze met behulp van analytische programma’s en statistische methodes op zoek naar verbanden. Die correlatie tussen individuele gegevens wordt vervolgens omgezet in concrete bedrijfsmodellen, producten en marketingstrategieën die zijn afgestemd op individuele voorkeuren van prospects.Data mining
Om de berg aan beschikbare klantinformatie effectief in te zetten voor concreet marktonderzoek, is het zaak om gegevens te ordenen en te koppelen aan concrete doelstellingen, onderzoeksvragen en prospects. Dan komt al snel het begrip data mining in beeld. De naam data mining slaat op de vergelijking tussen het zoeken naar belangrijke statistische verbanden in grote datasets en het graven (mining) naar iets waardevols in een fysieke berg. In digitaal opzicht wordt de berg gevormd door een warehouse. Dit is een collectie databases die het ruwe materiaal voor het extractieproces levert. Middels speciale Big Data-software en de wiskundige algoritmes waarvan data mining gebruikmaakt, kan een organisatie uit deze enorme bak met informatie verbanden halen die belangrijk zijn voor het optimaliseren van haar marktonderzoek. Een warehouse maakt het mogelijk om informatie uit verschillende databases te integreren. Op die manier ontstaan legio nieuwe en waardevolle inzichten die helpen bij het ontwerpen van marketingstrategieën of maken van concurrentieanalyses.Technieken voor data mining
Er zijn diverse technieken die ingezet kunnen worden om het proces van data mining gestalte te geven. De belangrijkste worden hieronder kort besproken.- Beslissingsbomen: een beslissingsboom is een voorspellend model. De input wordt geleverd door een reeks beslissingen. Het model neemt de vorm aan van een boom, waarbij elke tak een classificatie vormt. De bladeren stellen de partities van de dataverzameling voor. Een groot voordeel van een beslissingsboom is dat hij eenvoudig te begrijpen is. Beslissingsbomen blinken uit in complexe algoritmes die leiden tot praktische inzichten. Een nadeel is dat ze niet toepasbaar zijn op simpele problemen en dat er soms storende gegevens worden meegenomen die tot onjuiste inzichten kunnen leiden.
- Neurale netwerken: neurale netwerken zijn opgebouwd naar analogie van het menselijk brein. Ze bestaan uit knooppunten (neuronen) en koppelingen (de verbindingen tussen neuronen). Neurale netwerken zijn nauwkeurig en kunnen toegepast worden op een breed en divers scala aan problemen.
- Rule induction: deze techniek bestaat uit het blootleggen van voorheen onopgemerkte verbanden binnen databases. Denk bijvoorbeeld aan voorspellende patronen in het koopgedrag van mensen. Rule induction wordt gekenmerkt door een automatische werkwijze; het haalt patronen uit een database die op het eerste gezicht gemakkelijk over het hoofd worden gezien. Hoewel de techniek efficiënt is, is er vaak nog een tweede ronde van data mining nodig om de lijst van patronen om te zetten in concrete bevindingen. Hierdoor kunnen simpele voorspellingen uiteindelijk toch vrij complex worden.
- Case based redeneren: dit houdt in dat je vooral gegevens uit het verleden gebruikt om bepaalde patronen te identificeren.
- Intelligente agenten: bij deze vorm van data mining wordt informatie van het internet en uit op infranet gebaseerde databases gehaald.