Digitalisering & Teknik

Syntetisering av data för snabbare digitalisering

Avbruten

Syntetisering av data för snabbare digitalisering

Vad?

För att kunna effektivisera offentlig sektorn, erbjuda våra invånare individanpassade tjänster och skapa möjlighet för nya företag och förmågor att blomstra så behöver vi som offentlig aktör tillgängliggöra vår data.

Varför?

Många idéer till förbättringar inom välfärden kräver tillgång till sekretessbelagd individ-data, men möjligheterna till att dela eller jobba med denna typ av data är begränsad pga. svensk lagstiftning.

Hur?

I många fall kräver inte en idé eller tillämpning att man behöver veta exakt vem personen är för att realisera den. Det finns olika sätt att ”avpersonifiera” data men en av de bättre metoderna för vidare bearbetning & delning av informationen är syntetisering.

Syntetiserad data är en blandning av data från olika personer. Man kan alltså skapa en syntetisk individ med slumpade egenskaper i en kombination som gör att det ser ut som en riktig person utan att vara det. Data bibehåller sitt statistiska värde men det är längre inte möjligt att urskilja personerna som den data kom från.

En utforskande fas håller på att slutföras (januari 2023) och sammanfattningsvis är slutsatsen att syntetisering är bra på flera sätt men det är inte den silverkula som vi hade hoppats på då det inte går att garantera att en AI-modell tränad på verklig data inte producerar ny data med artefakt av originaldata och på så sätt innehåller någon personuppgift. Däremot är syntetisering, om utfört korrekt, en av de bästa anonymiseringsmetoder som finns och syntetisering kan även användas till andra fördelar.

Genom de möten och utbildningar vi har haft tillsammans med vård och omsorgsförvaltningen och arbetsmarknadsförvaltningen så vill båda förvaltningarna gå vidare och testa syntetisering. Under våren 2023 kommer detta test konkretiseras och genomföras.

Lärdomar

Det går inte att garantera att syntetisering som anonymiseringsmetod skapar helt anonyma data men metoden, om utförd korrekt, är oftast bättre än andra anonymiseringsmetoder på så sätt att den syntetiska data är mer anonym och mer användbar. Är det lite oklart rent juridiskt hur syntetisering kan användas som anonymiseringsmetod. Denna oklarhet medför en begränsning hos syntetisering som en lösning på de datadelningsproblem kommuner står inför idag.

Det finns dock redan idag vissa fördelar med syntetisering. Bland annat kan metoden öka skyddet av personliga data och metoden kan även användas för att minska bias i den data som finns för att skapa mer rättvisa AI-modeller. En nackdel är dock att syntetisering är en mer komplicerad metod jämfört med andra anonymiseringsmetoder och därmed kräver mer resurser.

Just nu sker det mycket utveckling när det kommer till syntetisering, både i allmänhet och som anonymiseringsmetod. Användningen av syntetiska data spås öka ordentligt och det finns en enorm potential. Tekniken kommer med stor sannolikhet bara bli bättre framöver och det juridiska spelrummet kan komma att ändras.

Sveriges kommuner och regioner behöver ställa högre krav på regeringen i allmänhet när det kommer till att möjliggöra nyttjandet av invånares data till invånares nytta. Syntetisering som anonymiseringsmetod är fortfarande en potentiell lösning som bör lyftas fram och diskuteras mer i detta sammanhang, men även andra lösningar är välkomna.

Publicerad: 29 juni, 2022
Senast uppdaterad: 20 juni, 2024

Effektmål

Höja den interna kunskapsnivån kring syntetisering av data

Effektmål

Bygga ny infrastruktur för syntetisering av data som passar in i nuvarande arkitektur,

Effektmål

Ta fram juridisk arbetsprocess för syntetisering av sekretessbelagd data & syntetisera

Effektmål

Pilota utvald sekretessbelagd data och tillgängliggöra denna som öppna data

Kontakt

Namn: Magnus Lindhe
E-post: magnus.lindhe@helsingborg.se