Big data is een term die voortdurend rond de IT-sector wordt geboeid, maar in hoeverre heb je er echt grip op gekregen? Het verdiepen van ons collectieve begrip van het onderwerp is Dr. Andrew Jennings, de chief analytics officer bij FICO en hoofd van FICO Labs, in onze speciale vraag en antwoord.

Wat waren de belangrijkste mijlpalen in de geschiedenis van voorspellende analyses?

Veel van de vroege mijlpalen kwamen van militaire toepassingen in de jaren 1930 en 1940. Alan Turing en IJ Good ontwikkelden bijvoorbeeld baanbrekend werk over het toewijzen van bewijsgewichten aan specifieke variabelen toen ze betrokken waren bij het decoderen van Duitse codes in de Tweede Wereldoorlog.

De jaren 1950 en 1960 zagen de ontwikkeling van methodologieën voor het modelleren, zoals het werk gedaan door Bill Fair en Earl Isaac op credit scoring.

Aan het eind van de jaren negentig zette de opkomst van internetzoekopdracht en personalisatie door eBay, Amazon en Google zeker het toneel voor de opkomst van big data. U kunt meer mijlpalen zien in de recente infographic van FICO.

Wat zijn enkele van de veelvoorkomende toepassingen van voorspellende analyses vandaag?

Voorspellende analyses worden veel gebruikt in de reisindustrie, zowel om vliegroutes en ticketprijzen in te stellen als om consumenten te helpen de beste prijzen te vinden. In de kredietsector staat het centraal in zowel risicobeoordeling als fraudedetectie.

En, natuurlijk, gebruiken marketeers in veel branches het om de beste aanbiedingen voor elk individu te identificeren.

Big data is op dit moment ongetwijfeld een hot topic, maar zijn er veel bedrijven die al big data-inzichten gebruiken in hun dagelijkse activiteiten??

Ja, en sommige bedrijven hebben hun hele bedrijfsmodel gebaseerd op analyse van big data. Een voorbeeld is Farecast, een bedrijf dat is opgericht om consumenten te helpen bepalen wanneer ze vliegtickets kopen om de beste prijs te krijgen.

Hoe heeft de opkomst van big data invloed gehad op het gebruik van analyses??

Meer bedrijven beseffen tegenwoordig dat ze niet concurrerend zullen zijn als ze de gegevens niet aan het werk kunnen zetten.

Waar voorheen de meeste analyses business intelligence waren, gericht op rapportage, begrijpen bedrijven tegenwoordig dat personalisatieniveaus die vereist zijn om te concurreren met online reuzen zoals Amazon, alleen mogelijk zijn als u uw klanten veel beter kunt begrijpen en op basis van dat inzicht kunt handelen met meer persoonlijke service.

Dit heeft de vraag naar analytics enorm doen toenemen - de sector van de software voor de analyse van software groeide van $ 11 miljard (£ 7,2 miljard) in 2000 naar $ 35 miljard (£ 23 miljard) in 2012.

Wat voor impact hebben tekstanalyses?

Tekstanalyse en zijn tegenhanger, spraakanalyse, zullen een enorme impact hebben. Om voorspellende analysemodellen te bouwen, moet informatie in een numerieke vorm worden verstrekt.

Natuurlijke taalverwerking zorgt ervoor dat tekst en spraak kunnen worden omgezet in een gedigitaliseerd formaat dat kan worden gebruikt bij het modelleren. Aangezien de meeste menselijke communicatie taalgebaseerd is, zullen we een veel grotere set gegevens hebben om in modellen te gebruiken, waardoor we nieuwe problemen echt kunnen kraken.

Zo worden de termen die mensen gebruiken wanneer ze online zoekopdrachten uitvoeren, geanalyseerd om de uitbraak van een ziekte in een specifieke regio te identificeren.

Wat betekent 'putting analytics' in een cloud computing-infrastructuur voor de industrie??

De cloud verlaagt de barrière voor toegang tot Analytics. Meer dan ooit zullen bedrijven toegang krijgen tot analyses, zonder veel geld te hoeven besteden aan softwaretools en hardware.

Ten eerste kunnen bedrijven "inbouwen in de cloud" met behulp van modelleertools.

Ten tweede kunnen bedrijven toegang krijgen tot analytische services die vooraf zijn ontwikkeld voor specifieke bedrijfsproblemen, of analytische services snel aanpassen aan hun bedrijf.

Ten derde kan een geavanceerde cloud bedrijven in contact brengen met een gemeenschap van analytische experts. Ten vierde creëren sommige clouds een 'analytics-marktplaats': een app-exchange of app store voor analyses die is ontwikkeld door derden.

Aan de ene kant wordt gedacht dat big data een oplossing is voor veel urgente economische en maatschappelijke uitdagingen. Anderzijds beweren privacyverdedigers dat wanneer gegevens zijn verzameld, we geen controle hebben over wie deze gebruikt of hoe deze wordt gebruikt. Hoe kunnen organisaties deze negatieve perceptie overwinnen en bestaat er zoiets als een grote datacode voor ethiek?

Er is geen ethische code met grote gegevens, maar er zijn zeker controles over wie toegang heeft tot welke gegevens, niet alleen privacyregels op nationaal niveau, maar ook op sectorniveau..

De financiële gegevens van een persoon, zoals de gegevens die aan een kredietbureau worden gerapporteerd, hebben bijvoorbeeld zeer strikte regels. De uitdaging is dat nieuwe gegevensbronnen snel online komen en in sommige gevallen kan er een vertraging zijn tussen wanneer gegevens beschikbaar komen en wanneer de voorschriften worden ingevoerd.

Het is belangrijk voor elk bedrijf dat gegevens gebruikt om de geest van privacyregels na te leven, en om te overwegen of hun gebruik de individuele privacy schaadt.

Zijn er voldoende experts in analytics om aan de explosie in de zakelijke vraag te voldoen??

Nee, en dit is een probleem. Tussen 2011 en 2012 stegen de vacatures voor 'data scientists' met 15.000%. Er is wereldwijd een tekort aan talenten, en mensen die zijn opgeleid in analytics, statistieken en operations research zijn veel gevraagd.

Helaas betekent de wereldwijde vraag dat we zien dat een aantal mensen zichzelf analytische experts noemen die niet zo goed zijn opgeleid als de professionals die het werk al doen.

De meeste analysebedrijven en de meeste analytische teams binnen bedrijven worden echter geleid door analisten die kunnen zien of een sollicitant over de nodige vaardigheden beschikt. De ideale analist heeft de wiskundige vaardigheden, de mindset van een probleemoplosser en goede communicatievaardigheden.

Er zijn zeker enkele sterke universiteiten in Azië die wereldberoemd zijn vanwege hun analyseprogramma's en afgestudeerden, waaronder RenMin University, de University of International Business and Economics, het Indian Statistical Institute en het Indian Institute of Technology..

The Harvard Business Journal heeft data scientist de 'meest sexy baan van de 21ste eeuw' genoemd, dus dit is een uitstekend moment om analist te worden!

  • Dr. Andrew Jennings is chief analytics officer bij FICO en hoofd van FICO Labs. Hij blogt op de FICO Banking Analytics-blog en de FICO Labs Blog.