Hvorfor open source-baserede chatbots er Europas fremtid

Foto: Anders Visti i en workshop i København i januar 2026. Foto: Renée Ridgway.

De fleste mennesker bruger ChatGPT eller Gemini til at få hjælp. Disse er standard for flertallet, som om disse værktøjer var de bedste. Men de var bare de første og er de bedst kendte – ikke nødvendigvis de bedste. Nu hvor generativ AI overtager søgningen, er det vigtigt at forstå, hvad open source kan gøre for demokratiet i modsætning til Big Techs lukkede modeller.

Jeg deltager i en workshop om søgefærdigheder og chatbot-kompetencer i København i januar 2026. Vi bruger en skræddersyet platform til søgning, der sammenligner forskellige søgeresultater gennem datavisualiseringer designet og udviklet af forsker Renée Ridgway og kunstner/programmør Anders Visti. Deltagerne indtaster deres søgeord og sammenligner svarene mellem standardindstillingerne og andre søgemaskiner og browsere. Den nye platform har også en grænseflade kaldet ‘chatbot rodeo’, der sammenligner resultaterne fra fem forskellige chatbots, som aktiveres samtidigt. Jeg valgte at sammenligne følgende: Den open source-chatbot Apertus fra Schweiz, den åbne vægt European Mistral, den kinesiske åbne vægtmodel (halvt open source) DeepSeek og de to amerikanske produkter ChatGPT og Gemini. Jeg vil lave en prompt, hvor det er nemt at faktatjekke svaret, så jeg spørger om mig selv:

“Jeg skal mødes med Pernille Tranberg. Hun hævder at være ekspert i digital suverænitet. Hvad skal jeg vide?”

Svarene dukker op med det samme, og der er ingen tvivl. Open source-modellen Apertus og Open-weight-modellen DeepSeek giver de bedste svar. De svarer direkte på spørgsmålet og leverer spørgsmål til en hypotetisk samtale. De tre andre maskiner er mere ens i deres svar og gentager blot nogle afsnit fra min personlige hjemmeside og min LinkedIn-profil. Først til sidst foreslår de to spørgsmål, som jeg kan stille. Apertus forklarer derimod detaljeret, hvad digital suverænitet er fra forskellige vinkler og leverer dermed en lang række dybdegående emner.

Dette er blot ét eksempel. I skrivende stund findes der mange chatbot-›arenaer‹, hvor man tester chatbots’ præstationer ud fra en række kriterier, og hver gang en person giver en prompt, vises der forskellige svar. Hvad der er faktuelt korrekt, og kvaliteten afhænger af de data, som boten er trænet på, og hvordan den statistisk forudsiger ord i hver sætning. Det er derfor svært at afgøre, om open source-modeller eller lukkede modeller er bedre eller dårligere end de lukkede modeller. Der er dog andre argumenter end kvaliteten af svarene for, hvorfor vi alle bør bruge open source-modeller, og hvorfor disse understøtter det europæiske demokrati. Åbenhed, gennemsigtighed og ansvarlighed er nøgleord her.

Renée Ridgway viser forskellen mellem åben vægt (kun åben omkring koden) og ægte open source (fuld gennemsigtighed) på workshoppen i København. Foto: Pernille Tranberg.

En af få ægte open source-chatbots

Apertus, en af de få ægte open source-baserede chatbots ifølge Open Source AI Index, sikrer fuld gennemsigtighed. Mens Lama (der kalder sig selv open source), Mistral og DeepSeek (der kalder sig selv open weight) kun frigiver deres endelige vægte (for programmører), leverer Apertus træningskode, datapræparationsscripts, evalueringsværktøjer og endda mellemliggende kontrolpunkter undervejs. Apertus, der er udviklet af ETH Zürich og Swiss National Supercomputing Center, leverer således fuld gennemsigtighed, hvilket vi i Europa har tendens til at synes passer godt ind i et demokrati. Udover træning i over 1800 sprog til flersproget repræsentation adresserer Apertus også datakompatibilitet:

“Apertus-modeller er foruddannet udelukkende på åbent tilgængelige data, hvor robots.txt-eksklusioner respekteres retroaktivt, og der filtreres for ikke-tilladt, giftigt og personligt identificerbart indhold,” siger Renée Ridgeway, der har dykket ned i Apertus’ V1 Technical Report.

Chatbot Rodeo-webstedet bruges til workshops og er ikke åbent for offentligheden (på grund af begrænsninger i antallet af tokens), men du kan søge direkte i hver enkelt chatbot.

Det etiske problem, der er nævnt som nummer et for alle fem bots, er forudindtagethed og retfærdighed. De nævner også alle privatliv, misinformation, gennemsigtighed og ansvarlighed som udfordringer. Men kun DeepSeek og ChatGPT anerkender miljøproblemer, mens Mistral og Gemini peger på jobudskiftning. Med andre ord ser DeepSeek ud til at være den, der dækker flest etiske problemer (8), mens de andre har mellem 4 og 6 etiske problemer.

Med prompt »Hvorfor er visse chatbots mere etiske?« opstiller Le Chat (Mistral) klart kriterierne for at bedømme etik. Men kun Apertus (publicai.co) bruger faktisk udtrykket ›open source‹ i sit svar, hvor det hedder, at »mere etiske chatbots ofte er open source, hvilket giver mulighed for gennemgang og forbedring af fællesskabet.«

I chatbot-rodeoen kan du også vælge Perplexity, som er den eneste bot, der har adgang til live-websøgning. Men denne amerikanske bot er også blevet sagsøgt af The New York Times, Reddit og andre. Det samme gælder OpenAI og dens modstykke fra Microsoft, CoPilot, mens der indtil videre ikke er rapporteret om sager om intellektuel ophavsret mod Mistral eller Deepseek. Alligevel hævder OpenAI bag ChatGPT, at DeepSeek krænker deres ophavsret.

Dette lille eksperiment viste os, og det blev også diskuteret blandt deltagerne, at man får meget forskellige svar med forskellige chatbots, søgemaskiner og browsere, hvilket påvirker, hvilke oplysninger man får, og det påvirker igen folks forståelse af verden og civilsamfundet.

Europas satsning på etisk open source

Der har for nylig været mange diskussioner om borgernes data i hænderne på Big Tech, og der findes eller udvikles en række alternativer. Et projekt, hvor Renée og jeg mødtes, er Working Group Ethics, som har designet en værdiramme og implementeret en risikovurdering i samarbejde med designet og implementeringen af OpenWebSearch.eu.

Dette privatlivsbeskyttende og decentrale webindeks, der er finansieret af EU’s Horizon-projekt med 8 millioner euro, har 14 europæiske partnere (og CERN) og har allerede gennemgået 9,5 milliarder URL’er på 185 sprog og gjort over 1000 offentlige datasæt tilgængelige. Lige nu kan forskere med tilladelse gøre brug af dette ikke-proprietære indeks, der i december 2025 også offentliggjorde det enorme menneskeligt redigerede webkatalog Curlie.org, som i årevis har været en del af Googles hemmelige opskrift. Interne browsere som Mosaic bruger allerede indekset, og i fremtiden vil forskellige søgeapplikationer kunne bruge indekset yderligere.

“Fri, åben og upartisk adgang til information – vi har mistet disse grundlæggende principper i websøgning og har et presserende behov for at genoprette dem. Derfor skaber openwebsearch.eu en åben europæisk infrastruktur for internetsøgning, baseret på europæiske værdier og jurisdiktion,” siger Renée Ridgway med henvisning til Michael Granitzer fra Passau Universitet og Open Search Foundation og koordinator for OpenWebSearch.EU.

Open source er af enorm betydning for Europa – og også Kina, mens de fleste tjenester i USA er proprietære og lukkede. Dette kan give overskud til USA, men for Europa handler åbenhed om demokrati.

Oversat til dansk ved hjælp fra deepl.com

Dette er den sidste artikel i Open Source Democracy Project, der støttes af Carlsberg Mindelegat – et samarbejde mellem Aarhus Universitet og DataEthics.eu.

Lyt til episode 5: Search and Chatbot Literacy (Engelsk)

Open Source Democracy er et projekt om, hvorfor open source er vigtigt for demokratiet med fokus på etik og værdier i europæiske alternativer til big tech. Det er støttet af Carlsberg Mindelegat.. Alle artikler og podcasts er frit tilgængelige på dataethics.eu/opensource

Hvorfor open source-baserede chatbots er Europas fremtid

Om Data Ethics

Kontakt os

Tilmeld dig vores nyhedsbrev

Andre artikler

Om Data Ethics

Kontakt os

Tilmeld dig vores nyhedsbrev