Eerder schreef Emerce over de resultaten van het jaarlijkse DDMO onderzoek door de DDMA. Eén van de belangrijkste uitkomsten van dit onderzoek is dat datakwaliteit en -beschikbaarheid voor veel organisaties nog een hoofdpijndossier is.
Iets meer dan de helft van de ondervraagde organisaties geeft aan dat data en insights beschikbaar en makkelijk vindbaar zijn. Dat betekent dus dat in bijna de helft van de organisaties data en insights slechts beperkt of niet beschikbaar zijn. Datakwaliteit wordt hierbij gezien als één van de grootste uitdagingen. Data governance, wat nodig is om die datakwaliteit te verbeteren, wordt door slechts 14% van de organisaties toegepast. Slechts 14%! Hier valt voor veel organisaties dus nog veel winst te behalen.
Nu is data governance naast een belangrijk ook een omvangrijk thema wat voor veel managers nog ver van de dagelijkse praktijk staat. Daarom hierbij een pragmatische aanpak om data governance in de praktijk op te pakken en zo de datakwaliteit te verbeteren.
In het kort, wat is data governance?
Data governance is het proces van beheren, beveiligen en optimaliseren van data binnen een organisatie. Het omvat daarnaast ook het vaststellen van beleid, procedures, en verantwoordelijkheden om data accuraat, toegankelijk en beveiligd te houden. Het verschilt daarin van data management, wat zich vooral richt op techniek en wat daardoor zonder governance nooit je datakwaliteitsproblemen gaat oplossen.
Voor de implementatie van data governance zijn diverse ‘frameworks’ beschikbaar. Deze variëren van zeer beknopt (Deloitte) tot zeer uitgebreid (DAMA-DMBOK), en van alles daar tussenin. De keuze van het framework is vooral afhankelijk van de organisatie. Ondanks dat ik een fan ben van DAMA-DMBOK hanteer ik voor dit artikel het onderstaande framework van de Eckerson Group omdat zich dat hiervoor beter leent.
Dit framework bestaat uit 6 lagen en 39 componenten. Idealiter vul je al die componenten volledig in voor al je doelen (Goals) maar in de praktijk kan je er bij dit framework voor kiezen om te beginnen met één of enkele doelen in de bovenste Goals laag en vervolgens de componenten in de lagen daaronder hiervoor in te vullen.
Voorbeeld data governance aanpak t.b.v. verbeteren datakwaliteit
Datakwaliteit wordt volgens het DDMO onderzoek door de DDMA gezien als één van de grootste uitdagingen, dus laten we het verbeteren van datakwaliteit in dit voorbeeld als doel stellen bij het toepassen van dit framework.
1. Goals
Datakwaliteit is ook een lekker abstract begrip dus laten we eerst eens concreet maken wat we hiermee willen bereiken. En dat dan wel SMART (Specifiek, Meetbaar, Acceptabel, Realistisch en Tijdgebonden), graag.
Twee voorbeelden van SMART datakwaliteitsdoelstellingen zijn:
- 95% van de klantprofielen in het CRM-systeem dient binnen 14 dagen na invoerdatum voorzien te zijn van NAWE gegevens en date/time stamp, categorie en inhoud van minimaal het laatste beschikbare contactmoment
- 90% van de producten in het e-commerce back-end dient binnen 10 werkdagen na invoer van de productgegevens voorzien te zijn van zowel de kortst mogelijke als de gemiddelde levertijd, berekend op basis van alle bij klanten afgeleverde orders die in deze periode zijn geplaatst en weergegeven in dagen
2. Methods
Vervolgens bepaal je hoe je dit gaat doen. Hoe ga je die data beheren? Beleid, richtlijnen, vangrails en poorten die nodig zijn voor preventie, interventie en handhaving zijn je primaire methoden. Cureren en coachen zijn ondersteunende methoden om je medewerkers hierbij te helpen. Naast een gedragscode houd je hierbij uiteraard ook rekening met interne richtlijnen en met wet- en regelgeving.
In het voorbeeld van datakwaliteitsdoelstelling 1 (volledigheid van klantprofielen in het CRM-systeem) zullen deze methoden waarschijnlijk gericht zijn op onder andere het op het juiste moment vragen om en verkrijgen van de NAWE gegevens van klanten, vastlegging in het CRM systeem, verwijdering uit andere systemen, voorkomen van datalekken, en methoden die nodig zijn om te voldoen aan de privacy wetgeving (AVG).
3. People
Hoe graag we apps en tools ook zouden willen zien als wondermiddelen die alle problemen als sneeuw voor de zon laten verdwijnen, het succes van data governance -en dus ook de kwaliteit van data- is afhankelijk van de mensen die dit uitvoeren. Daarom dienen binnen je data governance aanpak een aantal rollen ingevuld te worden, zie de afbeelding. Deze rollen zijn geen functies maar kunnen door verschillende mensen worden uitgevoerd, voor verschillende datadomeinen (marketing, sales, finance etc.) en/of databronnen.
Naast de voor de hand liggende rollen van Stakeholder (belanghebbende(n)) en Consumer (gebruiker(s)) zijn Owner en Steward binnen data governance belangrijke rollen. De Owner is de eigenaar van en verantwoordelijke voor de betreffende data, de Steward houdt zich vooral bezig met het toezien op de correcte uitvoering van de methoden. In dit voorbeeld (CRM data) zou de Owner de marketing/sales director kunnen zijn en de Steward een sales of marketing coördinator of de klantenservice manager.
Voor elk van deze rollen definieer je binnen je data governance aanpak de taken, verantwoordelijkheden en bevoegdheden die nodig zijn om de betreffende rol voor de geselecteerde goal(s) te vervullen.
4. Processes
Processen zijn de reeks acties die worden ondernomen om specifieke resultaten te behalen, om problemen op te lossen, om veranderingen te coördineren, om de datakwaliteit te waarborgen, om data en datasets te catalogiseren, om die datacatalogus (of datacatalogi) toegankelijk te maken voor de gebruikers van de data, en om de impact van data governance te meten en te bewaken.
In het CRM datakwaliteit voorbeeld zijn voor de hand liggende processen die voor invoer en wijzigen van klantgegevens, het automatisch meten en monitoren van de volledigheid van deze data, rapportage van afwijkingen van het gestelde doel (95% correcte profielen binnen 14 dagen) en afwijkingen in de data, processen en werkwijzen voor het voorkomen en verhelpen van afwijkingen in de data, en het bijhouden van een datacatalogus waarin gebruikers actuele beschrijvingen van de inhoud van de klantprofielen kunnen vinden (meta data).
5. Technology
Veel van de eerder gedefinieerde processen (maar niet alle!) kunnen worden geautomatiseerd met technologie. Denk aan tools die data extractie, loading, transformatie, opslag, analyse en rapportage mogelijk maken. Tools als ETL en data integratieplatformen, databases en data warehouses, business intelligence tools en een datacatalogus. Deze maken dit mogelijk maar (let op!) vallen zelf ook onder beheer en dus onder governance.
In ons voorbeeld bevat de technologie niet alleen het CRM systeem maar ook het e-commerce of ordersysteem, het data integratieplatform wat de interne en externe (leveranciers, distributeurs) systemen met elkaar verbindt, het ETL platform wat data via pipelines uit het CRM systeem naar onder andere een datamart in het data warehouse stuurt, een business intelligence tool waarin de datakwaliteit wordt gerapporteerd, en een datacatalogus waarin de definities en mogelijke waarden van de variabelen in het klantprofiel vastgelegd zijn.
6. Culture
En dan het moeilijkste, de cultuur. Data governance (en in ons voorbeeld daarmee ook de kwaliteit van de CRM data) zal gewicht moeten krijgen door onder andere samenwerking, het delen van ervaringen, leren van elkaar, en een positieve en constructieve voorbeeldhouding en -gedrag van het management.
Conclusie
Wil jij niet behoren tot de helft van de DDMA doelgroep die in het DDMO 2025 gaat aangeven een probleem met datakwaliteit te hebben, start dan nu met data governance. Heb je vragen of opmerkingen? Neem dan contact met mij op of reageer onder dit artikel.