Datamaskering

Datamaskering erstatter følsomme data med fiktive men realistiske værdier. Teknikken gør det muligt at bruge data til test, udvikling og analyse uden at eksponere rigtige personoplysninger eller forretningskritiske oplysninger.

Tilbage til ordbog

Hvad er datamaskering?

Datamaskering (data masking) er en teknik, hvor følsomme data erstattes med fiktive men strukturelt korrekte værdier. Et CPR-nummer kan f.eks. erstattes med et tilfældigt nummer i samme format, og et navn kan erstattes med et genereret navn. De maskerede data ligner ægte data, men kan ikke spores tilbage til den oprindelige person.

Maskering adskiller sig fra kryptering, som omdanner data til ulæselig tekst, der kan dekrypteres. Det adskiller sig også fra pseudonymisering, hvor koblingen til den rigtige identitet kan genskabes. Datamaskering er typisk en envejsproces.

I en verden, hvor persondata bruges i testmiljøer, udviklingsprojekter og analyser, er maskering en praktisk måde at reducere risikoen for datalæk. Det er også en vigtig del af dataklassifikation, der hjælper med at afgøre, hvilke data der kræver maskering.

Maskeringsmetoder

Der findes flere teknikker til datamaskering, og den rette metode afhænger af datatypen og formålet:

Substitution: Erstatter værdier med tilfældige men realistiske alternativer fra en referencebase. Et rigtigt navn erstattes med et andet navn.
Shuffling: Blander værdier inden for en kolonne, så tilknytningen mellem rækker brydes. Løn-kolonnen randomiseres, men de faktiske lønværdier bevares i datasættet.
Nulling: Erstatter værdier med tomme felter eller null. Enkelt men begrænser datatestens realisme.
Variansbaseret maskering: Ændrer numeriske værdier med en tilfældig offset. En alder på 34 kan blive til 31 eller 38.
Tokenisering: Erstatter følsomme data med et token, der refererer til den oprindelige værdi i et sikkert vault. Bruges ofte til betalingskortdata.

Statisk maskering anvendes på databaser, der kopieres til testmiljøer. Dynamisk maskering sker i realtid, når brugere tilgår data, og viser forskellige niveauer af data baseret på brugerens rolle og adgangsrettigheder.

Praktiske anvendelser

Datamaskering er relevant i flere scenarier:

Test og udvikling: Udviklere har brug for realistiske data for at teste applikationer. Maskering gør det muligt at bruge produktionslignende datasæt uden at eksponere rigtige persondata. Det understøtter sikker udvikling og applikationssikkerhed.

Analyse og rapportering: Dataanalytikere kan arbejde med maskerede data for at identificere mønstre og tendenser uden adgang til følsomme oplysninger.

Outsourcing: Når tredjeparter har brug for adgang til data, reducerer maskering risikoen. Sammen med DLP sikrer det, at følsomme data ikke forlader organisationen i klar tekst.

Træning: Nye medarbejdere kan træne i systemer med maskerede data, hvilket bygger sikkerhedsbevidsthed fra dag ét.

Uanset scenariet bør maskering kombineres med logning og overvågning for at sikre, at maskeringspolitikker overholdes.

Regulativer og standarder

GDPR nævner datamaskering som en mulig teknisk foranstaltning. Artikel 25 om databeskyttelse by design og by default opfordrer til at minimere brugen af persondata, og maskering er en direkte måde at opnå det på.

ISO 27001 og Annex A inkluderer kontroller for beskyttelse af testdata (A.8.33), der specifikt nævner maskering som teknik. Et ISMS bør definere, hvornår maskering er påkrævet.

DORA og NIS2 stiller krav til beskyttelse af data i IKT-systemer, og maskering er en anerkendt metode til at opfylde disse krav i test- og udviklingsmiljøer.

Ofte stillede spørgsmål om datamaskering

Hvad er forskellen på datamaskering og kryptering?

Kryptering omdanner data til en ulæselig form, der kan dekrypteres med den rette nøgle. Datamaskering erstatter data permanent med fiktive værdier, der ikke kan tilbageføres. Kryptering bruges til data i transit og hvile, mens maskering bruges til testmiljøer og analyser.

Hvad er forskellen på datamaskering og pseudonymisering?

Pseudonymisering erstatter identificerende data med et pseudonym, men gør det muligt at genskabe koblingen via en separat nøgle. Datamaskering er typisk irreversibel. Under GDPR er pseudonymiserede data stadig persondata, mens korrekt maskerede data ikke er det.

Hvornår bør man bruge datamaskering?

Datamaskering er relevant, når du har brug for realistiske data til test, udvikling, træning eller analyse, men ikke må bruge rigtige persondata. Det er også nyttigt ved outsourcing eller deling af data med tredjeparter.