Advanced analytics (Data Science)

Overal om ons heen is variatie. Een bestuurder heeft variatie bij het inparkeren van zijn auto; de aankomsttijden van treinen hebben variatie; het menselijk ras vertoont variatie en producten die uit een proces komen, zijn nooit hetzelfde. Elk proces vertoont variatie.

Wat is Big Data nu eigenlijk precies? Er bestaat geen algemeen geaccepteerde definitie. Uiteraard heeft het te maken met een grote hoeveelheid data, maar de omvang van de data zelf is niet waar het om gaat. Een verschil tussen een normale grote dataset en big data is dat in het laatste geval er meerdere bronnen aanwezig zijn die onderling niet direct gekoppeld zijn in dezelfde database.

Enerzijds genereren consumenten privé steeds meer data in de vorm van documenten, foto’s en films (Facebook, YouTube, etc.) Anderzijds is er steeds meer data beschikbaar in bedrijven doordat apparaten operationele data en sensordata genereren en uitwisselen. In de fabrieken van de toekomst zijn alle apparaten, machines en ERP-systemen met elkaar verbonden. Dit wordt het ‘Internet of Things’ (IoT) genoemd. Er wordt een dermate grote hoeveelheid data gegenereerd op het gebied van operationele prestatie, logistiek, supply chain, productkwaliteit en marketing, dat dit door mensen niet meer te bevatten is.

Dankzij breedband, wireless internet en dataservers in de cloud, is de data altijd en overal toegankelijk. De aandacht verschuift dan naar data analytics, waaronder algoritmes die het mogelijk maken dat machines en systemen autonoom beslissingen nemen, zoals het opstarten van productie en het bestellen van grondstoffen.

“Big data analytics is het destilleren van zinvolle betekenis
uit een omvangrijke, complexe en ongestructureerde dataset”.

Gordon Moore stelde in 1965 dat het aantal transistors in een geïntegreerde schakeling elke twee jaar verdubbelt. Dit wordt de wet van Moore genoemd. De hoeveelheid data die wordt gegenereerd volgt een vergelijkbare trend. De opslagcapaciteit van data verdubbelt ongeveer elke 40 maanden en sinds 2012 wordt er dagelijks 2,5 exabytes (2,5 × 1018) aan data gegenereerd.

Lean Six Sigma Green Belts en Black Belts weten hoe ze data moeten analyseren en visualiseren. Maar wat het verschil tussen normale data en big data? Een belangrijk kenmerk is dat big data niet-gestructureerde data is en vaak verschillende interne en externe bronnen kent. Conventionele analysemethoden werken dan niet meer. De uitdaging is om deze verschillende bronnen te koppelen en real time verbanden te leggen en hieruit zinvolle informatie te verkrijgen.

Deze enorme groei in de hoeveelheid data vraagt de nodige uitdagingen, maar biedt tegelijkertijd ook kansen. Data is het ‘nieuwe goud’. Partijen die in staat zijn om data te verzamelen en hier zinvolle betekenis uit te destilleren, kunnen hiermee een voorsprong opbouwen ten opzichte van anderen.

Vraag informatie of een offerte aan