KPMG komt met Big Data-tool Eskapade

KPMG introduceert een nieuwe tool om de voordelen van Big Data beter te benutten. De tool, Eskapade, stelt data scientists in staat om hun werk verder te professionaliseren en het gebruik van Big Data naar een hoger niveau te brengen.

Eskapade biedt open source bouwstenen voor het helpen ontwikkelen van data-analyses, biedt een grote mate van herbruikbaarheid van de software code en stelt data scientists in staat ontwikkelde analyses snel in productie te nemen. “Eskapade kan zorgen voor een doorbraak in het vakgebied,” zegt Sander Klous, partner bij KPMG en verantwoordelijk voor Data & Analytics bij KPMG. Klous: “Een doorbraak die essentieel is. Beslissingen worden steeds meer ondersteund door data en analyses, variërend van voorspellend onderhoud van spoorwegwissels tot diagnose van patiënten door huisartsen. In alle gevallen is het zaak dat de onderliggende data analyse kan worden vertrouwd.”

Professionele benadering soms ver te zoeken

Klous constateert dat de opkomst van het internet aan het eind van de vorige eeuw gelijkenissen vertoont met de opkomst van Big Data nu. Klous: “Vergeleken met het internet staat data analyse nu weliswaar nog enigszins in de kinderschoenen, maar veel organisaties zijn er volop mee bezig. Bovendien raakt de samenleving verslaafd aan data en nemen we steeds meer beslissingen op basis van data analyses. Dat stelt hoge eisen aan de wijze waarop data scientists de onderliggende algoritmes ontwikkelen. Een professionele aanpak hierbij is soms ver te zoeken. Data scientists opereren in het algemeen vaak met de noodzakelijke kennis van zaken, maar laten ook nogal eens steken vallen als het gaat om belangrijke randvoorwaarden. Zo is bijvoorbeeld het versiebeheer vaak niet goed geregeld en is het ontwikkeltempo laag omdat onvoldoende wordt voortgebouwd op beschikbare modules van collega’s die zich al in de praktijk hebben bewezen.”

Wiel opnieuw uitvinden

Geavanceerde data analyses vragen dan ook om goede instrumenten waarmee data scientists kunnen samenwerken en verder kunnen bouwen op elkaars werk. “Daarbij moet het versiebeheer goed geregeld zijn en moeten ook kwaliteitseisen goed zijn geborgd”, zegt Max Baak, chief data scientist bij KPMG. Baak: “Als data scientist bij CERN heb ik te maken gehad met grote teams en de hoogste standaarden in data analyse. Het onderzoek naar het Higgs-boson deeltje is daarvan een voorbeeld. Deze standaarden zouden ook in het bedrijfsleven moeten worden toegepast. Nu is het zo dat data scientists her en der fantastische toepassingen ontwikkelen, maar in wezen vaak opnieuw het wiel aan het uitvinden zijn. Dat is niet alleen inefficiënt, maar leidt er ook toe dat mooie toepassingen maar eenmalig worden gebruikt.”

 

Aanpak verder professionaliseren

Eskapade speelt in op dit issue en maakt het data scientists mogelijk om in teamverband hun aanpak op een eenvoudige wijze te professionaliseren. Een van de voordelen is hergebruik van de code: ontwikkelaars kunnen op elkaars werk voortbouwen volgens de open source principes. Baak: “Vrijwel elk data analytics project kent een aantal standaardonderdelen, zoals het beoordelen van de datakwaliteit of het bouwen en valideren van voorspellende analyses. Met Eskapade beschik je als data scientist over generieke modules waarmee je dat kunt doen. Een ander belangrijk voordeel is versiebeheer van analyses, een domein wat in dit nog jonge vakgebied veel minder ver ontwikkeld is dan in bijvoorbeeld de ontwikkeling van IT-systemen. Dit alles vraagt om een professionele analyse code die in productie kan draaien. En dat is precies wat Eskapade biedt.”