Agile software testen – hoe doe je dat?

De term agile is tegenwoordig vrij bekend. Het is een populaire manier van werken, meestal binnen de softwareontwikkeling, waarbij je werkt met zogenaamde sprints. Eén van de meest bekende agile methodes is Scrum. Bij agile wordt de nadruk gelegd op werkende software: in elke vastgestelde periode moet er iets werkends worden opgeleverd. Het spreekt natuurlijk voor zich dat hierbij het in een vroeg stadium testen van de opgeleverde software erg belangrijk is. Maar hoe doe je dat?

Om de tests op een goede en betrouwbare manier te kunnen uitvoeren, heb je de juiste test data nodig. Deze agile test data moet in ieder geval voldoen aan een de volgende criteria:

De test data mag geen privacygevoelige informatie bevatten
De datasets mogen niet te groot zijn qua omvang

Privacygevoelige data

De Algemene verordening gegevensbescherming (AVG) heeft vastgesteld dat privacygevoelige informatie alleen mag worden gebruikt waarvoor het bedoeld is, waarvoor toestemming is gegeven door de persoon in kwestie. Het testen van software valt hier niet onder en dus mag er niet getest worden met productiedata waarin privacygevoelige data voorkomt. Dat betekent dat je je test data moet anonimiseren, ook wel maskeren genoemd, alvorens je het kunt gebruiken. Door data te maskeren zorg je ervoor dat eventuele privacygevoelige gegevens (zoals ziekte, schulden, seksuele geaardheid, etc.) niet herleidbaar zijn naar een natuurlijke persoon.

Omvang van de test data

Wat veel bedrijven nog doen is een kopie maken van hun productiedata om die vervolgens te gebruiken voor het testen van software. Dit is niet alleen onverstandig vanwege de wet- en regelgeving omtrent privacy, het drukt ook erg op de opslagkosten. Als je elk testteam een eigen, volledige, kopie van productie geeft dan lopen de kosten voor dataopslag zeer snel op. Daarnaast kost het verversen van zo’n volledige kopie veel tijd, wat uiteraard ongewenst is in een agile werkomgeving.

Om kosten te drukken en om snelheid te bewerkstelligen, worden soms virtuele databases ingezet. Met virtuele databases is er snelle toegang tot test data. Echter, data virtualisatie heeft ook behoorlijke nadelen met betrekking tot belasting van de server en de bijkomende kosten. Daarom wordt er vaker gekozen voor het subsetten van test data; alleen de benodigde cases en alle bijhorende data worden geselecteerd. Zo heeft ieder team zijn eigen (gemaskeerde) referentieel intacte dataset, is de verversing van de test data snel gerealiseerd en blijven de opslagkosten beperkt.

Meer weten? Neem gerust contact op.

Auteur

Nynke Hogeveen
DATPROF – Test Data Simplified