Inleiding
Data gedreven werken is erg van deze tijd door de grote beschikbaarheid van big data en door druk op uitvoeringmiddelen van een organisatie. Het is belangrijk om de huidige situatie te schetsten met de motivaties, de doelstellingen en met voorbeelden van analyse. De bestuurlijke en judiciële overweging van databronnen en van databewerking is nodig voor het halen van doelen, voor de samenwerking met andere organisaties en voor de toekomstige wensen.
De doelstellingen en motivaties
De datatoepassingen voor een bepaalde organisatie bevatten het analyseren van data(bestanden) en met als doel risico’s te kunnen vaststellen. Verder, het data gedreven werken kan beheerstrategieën, huidige praktijken en bedrijfsresultaten efficiënter maken. In het eerste jaar maken we ‘proof of concepts’ data gedreven uitvoering met databehandelingstechnieken. Vervolgens kan de analyse besproken worden met de betrokkenen voor een eventuele uitbreiding.
Bestuurlijke en judiciële overweging
Het fungeren van organisaties en systemen rond data-analyse en vervolgens controle op de toepassing van de systemen eisen bestuurlijk en politiek inzicht. Het bestuur moet overwegen om 1. grenzen van data-analyse, 2. sensitiviteit van het gebruiken van algoritmes en 3. kosten die erbij horen.
Bij judiciële overweging horen het zoeken naar project specifieke AVG kaders en het gebruiken van persoonsgegevens en van algoritmes. De aandachtspunten zijn hindernissen bij de data-analyse toepassingen en grenzen van datagebruik met de nadruk op de privacywetgeving en mening de Autoriteit Persoonsgegevens (AP) ervan.
Databronnen, bewerking en visualisaties
De eerste stap is het inventariseren van databronnen met interne en externe bestanden en domeinen. De wisselbaarheid van digitale producten met metagegevens tussen verschillende platforms dient in kaart gebracht te worden. Het is handig te weten hoe andere organisaties en data wetenschappers omgaan met soortgelijk werkzaamheden qua beleid en technieken. Indien mogelijk, (open)databronnen van die organisaties koppelen.
Er moet een softwareomgeving zoals anaconda en Github/Gitlab aanschaffen om de analysetalen R en Python te gebruiken met een vorm van versiebeheer. De toegang kan via de werklaptop met een virtuele machine of via een laptop bedoeld voor data-analyse.
Het verlenen van toegang aan medewerkers met betrekking tot data-analyse en tot officiële publicaties wordt een integraal onderdeel van dit beleid. Een grafiekuserinterface (GUI) voor medewerkers is gepland om de gewenste analyse zelf uit te voeren. De communicatie over deze analyse en promoten kunnen via de website met een nieuwsbrief.
Toekomstige wensen en verwachtingen
Een datawarehouse en ‘infrastructure as a service (IAAS)’ cloud system is gewenst om volledig naar een automatische controle te gaan. Daar hoort bestuurlijke afstemming, langdurig planning en financiële support bij.