Minder Excel, Meer Python

De steentijd is niet ten ondergegaan omdat er weinig stenen waren. Die ging ten onder omdat er een betere technologie was: brons. Dat kun je ook zeggen wat betreft data analyse over de ondergang van Microsoft Excel met Visual Basic en met de opkomst van Python.

Flexibiliteit

De kracht van Python ligt in zijn flexibiliteit: data schoonmaken, data bundelen, analyses uitvoeren en visualiseren. Wat Python een flexibele programmeertaal maakt, is de enorme set aan modules voor analyse (Pandas), webinterface (Tkinter) en voor grafieken (Seaborn, Plotly, Matplotlib). Je beschikt over verschillende algoritmes voor Natural language processing (NLP) van Portable Document Format (PDF).

Leesbaarheid

Een Excelbestand met ‘Visual Basic for Application’ (VBA) waarin je een analyse uitvoert, is bijna niet leesbaar voor de anderen. Anderen weten niet welke stappen genomen zijn om het gewenste resultaat te behalen. Binnen Python kan je makkelijk aangeven wat je precies met jouw script bedoelt en waarom je een bepaald proces hebt uitgevoerd.

Data behandeling

Zodra de hoeveelheid van data toeneemt, zal de analyse in Excel meer tijd gaan kosten. Je loopt ook gevaar dat het bestand beschadigd raakt. Met Python heb je zulke problemen niet want de Python bestanden zijn klein. Je kan data van externe organisaties naar de pythonomgeving slepen via een Application programming interface (API).

Uitwisselbaarheid

Met Excel werk je voor data analyse elke keer opnieuw in een Excelsheet. En de achterliggende programmeertaal, Visual Basic is traag en is moeilijk te leren. Maar de pythonscripts, die al geschreven zijn door iemand anders, kan je gebruiken om verschillende taken te doen. De Excelbestanden die je graag wil bewerken, kunnen worden neergezet in een pythonomgeving. Python gebruik je wanneer de analyses ingewikkeld zijn of wanneer herhalende taken in verschillende rondes uitgevoerd moeten worden. Je gebruikt dan diezelfde script, maar met de nieuwe data uit een datawarehouse.

Open en gratis

Excel is een product van Microsoft. Daardoor ligt de realisatie van de updates niet in jouw handen. Met Python heb je dat probleem niet. Je kan makkelijk in je eentje de updates uitvoeren. Er zijn verschillende visualisatieprogramma’s beschikbaar op de markt; Power BI, Tableau (desktop versies en online) en Flourish (online). Je moet echter betalen. Met Python krijg je de vrijheid om zelf te kiezen welke module past bij jouw werk. Er zijn verschillende bronnen op het internet voor Python; als je hierover vragen hebt zoals: ‘hoe kan je Python op jouw laptop installeren?’ en ‘hoe haal je databestanden binnen in de werkruimte van Python?’.