Wat zijn big data?
NieuwsHoewel de oorsprong van de term ongrijpbaar is en zelfs besproken, zijn big data een van die concepten waar velen van weten, maar het tart een eenvoudige definitie. De kern van big data is, zoals de term direct suggereert, een extreem grote hoeveelheid gegevens. Dit wordt vaak ontleend aan verschillende bronnen en zelfs verschillende soorten gegevens, die vervolgens worden verwerkt in geavanceerde analytische technieken die hopelijk patronen uitkiezen die tot bruikbare conclusies kunnen leiden..
Big data leidt ook de drie V's af: Volume, Variety en Velocity. Volume verwijst naar de grootte van de gegevens, variëteit geeft aan dat de gegevenssets niet-homogeen zijn, en snelheid is de snelheid waarmee de analyse plaatsvindt, vaak met het doel real-time analyse te bereiken.
De betrokken datasets zijn inderdaad erg groot - we hebben het over terabytes naar zettabytes (1ZB komt overeen met 909.494.701TB, voor nieuwsgierigen). Naast de omvang van deze gegevenssets kunnen de gegevens van verschillende typen zijn: gestructureerd, semi-gestructureerd en ongestructureerd, plus het kan uit meerdere bronnen worden gehaald.
Dit doet de vraag rijzen waar al deze gegevens vandaan komen. Het komt van allerlei soorten plaatsen, waaronder internet, sociale media, netwerken, logbestanden, videobestanden, sensoren en vanaf mobiele apparaten.
Dit laatste is vooral belangrijk omdat de meesten van ons onze telefoons bij ons houden en 24/7 aan staan, en ze hebben een hele reeks sensoren, waaronder GPS, camera's, een microfoon en een bewegingssensor. Verder is het grootste deel van het gebruik van smartphones geen spraakcommunicatie, maar eerder andere activiteiten, waaronder e-mails, games, surfen op het web en sociale apps - wat uiteindelijk neerkomt op 90% gebruik als mobiele apps. Een grote aanjager van big data zijn deze mobiele gegevens, die in een razend tempo worden gegenereerd.
Datamining
Maar gegevens zonder analyse zijn nauwelijks waard, en dit is het andere deel van het big data-proces. Deze analyse wordt data mining genoemd en probeert binnen deze grote datasets naar patronen en anomalieën te zoeken. Deze patronen genereren vervolgens informatie die voor verschillende doeleinden wordt gebruikt, zoals het verbeteren van marketingcampagnes, het verhogen van de verkoop of het verlagen van de kosten. De big data- en datamining-aanpak heeft niet alleen de kracht om hele industrieën te transformeren, maar heeft dit ook al gedaan.
Trainline is bijvoorbeeld een toonaangevende Europese onafhankelijke treinkaartdetailhandelaar, die binnenlandse en grensoverschrijdende tickets verkoopt in 173 landen, met ongeveer 127.000 dagelijkse ritten door klanten. Het bedrijf gebruikte big data om zijn benadering van reizen te moderniseren, met een focus op het verbeteren van de klantervaring via innovatie via de app.
De resultaten zijn dat klanten nu verbeterde storingsmeldingen ontvangen via de app. Meer dan alleen meldingen van vertragingen, deze verbeterde meldingen zijn specifiek voor de reis van elke reiziger, een primeur voor de Britse spoorwegindustrie. Het bedrijf heeft ook geïnnoveerd op het gebied van voorspellende prijzen, die kunnen voorspellen wanneer voorverkoopprijzen zullen stijgen van de initiële korting, waardoor passagiers tegen lagere prijzen kunnen kopen.
Big data is ook gebruikt in restaurants, en in het bijzonder in de fastfoodindustrie. McDonald's is 's werelds grootste restaurantketen op basis van omzet en serveert dagelijks meer dan 69 miljoen klanten op meer dan 36.900 locaties in meer dan 100 landen.
Vanwege het enorme volume alleen al worden er heel veel gegevens gegenereerd en daarom heeft McDonald's een gegevensgestuurde cultuur aangenomen, met als doel het begrip op het niveau van elke afzonderlijke locatie te verbeteren, met het algemene doel van een betere keten van restaurants.
Door middel van big data heeft McDonald's de drive-through-ervaring geoptimaliseerd, bijvoorbeeld door rekening te houden met de grootte van de auto's die doorkomen en zich voor te bereiden op een piek in de vraag wanneer grotere auto's in de rij komen.
Een andere big data-innovatie waren die digitale menuschermen die menupunten flexibel kunnen weergeven op basis van een realtime analyse van de gegevens. De menu's verplaatsen de gemarkeerde items op basis van gegevens zoals het tijdstip van de dag en het weer buiten, met name het promoten van koude dranken als het buiten warm is en meer comfortvoedsel op koelere dagen. Deze aanpak heeft de verkoop op Canadese locaties gestimuleerd met een gerapporteerde 3% tot 3,5%.
Gezondheid is belangrijk
Deze big data-benadering is ook toegepast op de gezondheidszorg. Een voor de hand liggend voorbeeld is de grote verschuiving van 'pen en papier' in kaart brengen van de gegevens van uw arts in een archiefkast op kantoor, naar Electronic Health Records (EPD), die nu alle patiëntinformatie netjes in een computerdatabase hebben ingevoerd , klaar om te worden gedolven.
Deze aanpak belooft ontwrichtend te zijn, met een recente publicatie in het European Heart Journal waarin de “potentieel om ons begrip van ziekteveroorzaking en classificatie relevant voor vroegtijdige vertaling te verbeteren en om bruikbare analyses te leveren om de gezondheid en de gezondheidszorg te verbeteren”.
De voordelen van big data in de gezondheidszorg zullen verder gaan dan data mining van het EPD. Een belangrijke uitdaging voor ziekenhuizen is personeel, dat te allen tijde toereikend moet zijn, met het potentieel om op te klimmen tijdens piekuren.
In een groep van vier Parijse ziekenhuizen die de Assistance Publique-Hôpitaux de Paris (AP-HP) vormen, proberen ze de flexibiliteit in personeel te verbeteren. Ze gebruikten een dataset van 10 jaar opnames van ziekenhuisopnamen, tot een gedetailleerd niveau van het aantal opnames per dag, evenals het uur van de dag, en combineerden het met weergegevens, grieppatronen en feestdagen.
Met behulp van machine learning verbeterden ze hun algoritmen voor toekomstige trends om het aantal aankomende opnames voor verschillende dagen en tijden te voorspellen. Het resultaat is dat ze nu beschikken over een eenvoudig te gebruiken, browsergebaseerde interface voor ziekenhuisadministratie, evenals klinisch personeel dat de toelatingstarieven in de komende 15 dagen kan voorspellen, wat wordt gebruikt om extra personeel te krijgen op tijdstippen waarop een grotere aantal opnames wordt verwacht.
Met data, en in het bijzonder mobiele data die met een belachelijk snel tempo worden gegenereerd, is de big data-benadering nodig om deze enorme hoeveelheid informatie om te zetten in bruikbare informatie. In de voorbeelden die we hierboven hebben aangehaald, is aan de uitdaging voldaan en naarmate er nog meer gegevens worden verzameld, zullen er meer kansen zijn om de kwaliteit en efficiëntie in een aantal verschillende industrieën te verbeteren via snellere en betere analyse van deze uiteenlopende verspreide gegevenssets.
- We vragen ook: is big data een grote mislukking?