Big Data: Vier verse governance- en control-uitdagingen

Voor je je aan Big Data waagt, moet je eerst je gegevensbeheer op orde én op een hoger plan brengen.
De meeste organisaties zijn inmiddels wel bekend met de basisprincipes van net gegevensbeheer. Je moet vaststellen om welke gegevens het gaat, wat de risico’s zijn, wie de eigenaar is, hoe de beveiliging geregeld is, wie welke rechten heeft voor inzien, bewerken en opslaan, of er een betrouwbare audit-trail te reconstrueren is enzovoorts.
Dat wil overigens niet zeggen dat ook elke organisatie een en ander inmiddels ook goed geregeld heeft – zeker niet wat de toegangsrechten betreft. 
Hoe dat zij, die basisprincipes gelden nog steeds, maar met Big Data ontstaan nieuwe uitdagingen en risico’s. Big Data governance heeft veel meer en verder reikende implicaties dan de governance van gegevens in een ouderwets databasesysteem – waar deze vaak ook nog niet op orde was en is.
Bij Big Data is alles grootser en anders – de context, de herkomst, de snelheid, de massa, de schaal en de juistheid, tijdigheid en accuraatheid. 
Vier problematische governance-aspecten: 
Data-rollen: misschien lijkt het op het eerste gezicht duidelijk wie de eigenaar is van alle data in een ‘enterprise app’-  maar de eindverantwoordelijkheid ligt bijvoorbeeld bij miljarden ‘klikgegevens’  vaak niet zo eenduidig vast. De rollen rond een bepaalde dataset kunnen gedurende de levenscyclus best verschuiven en veranderen.
Betrokkenheid van de hele business: Big Data is altijd een exercitie van de totale organisatie, niet langer van (IT en) een afzonderlijke business unit. Hoe lang moet je web logs bewaren? Moet je alle social media data bewaren of alleen een subset? Data governance is niet langer de exclusieve verantwoordelijkheid van een gedefinieerd groepje individuen.
En daarom moet ook de hele organisatie erachter staan. In de eerste fasen kun je het nog redden met adequate ‘support van de directie’, maar een stap verder moet ook het middenkader erachter gaan staan. En die zijn altijd sceptisch.
En dan is er nog het aspect ‘technologie’. Je bent eraan gewend dat zaken als metadata-management ‘automatisch’ verzorgd wordt door de oude relationele database, bij Big Data analyse komt meer handwerk kijken. Tagging, koppelingen en kwaliteitsbewaking  als interne datasets samengevoegd worden met externe blijft voorlopig een ingewikkelde zaak. Ook qua compliance trouwens. 
Gerelateerde artikelen