Skip links

Dansk chatbot lover digital suverænitet

Med en meget kraftig server importeret til Odense, med lagring af data i danskejet datacenter og med databehandleraftaler lover Ordbogen.ai at deres chatbot er digitalt suveræn. 

Hvis du stadig bruger amerikanske chatbots og har lyst til at skifte en europæisk, så prøve chat.dk. Det er en relativ ny chatbot udviklet af Ordbogen.ai, og den er overraskende god – ikke mindst på dansk, som de satser på at excellere i. 

Ifølge CEO for Ordbogen A/S Peter Revsbech kan deres chatbot måle sig med de amerikanske pendenter. 

“Vi er den første virksomhed i Norden, der fik lov til at købe en HGX B300-server, som vi har hentet i Holland. Alt hos os er compliant, vi ejer hele tech stakken og værdikæden, og har ingen underleverandører,” siger Peter Revsbech. “Vi kan faktisk måle os en-til-en med de amerikanske techgiganter. Samtidig med at vi kan tilbyde digital suverænintet, der handler om, at vi i EU og Danmark har kontrol over vores egen digitale skæbne.”

Ordbogen A/S arbejder sammen med AI-eksperter, professorer, PhD-studerende og specialstuderende fra især Sydansk Universitet for at vedligeholde deres sprogmodel. Det er de samme folk, som Dansk Sprogkonsortium samarbejder med for at bygge en dansk sprogmodel. Ordbogen A/S kom dog først, men har også selv adgang til utrolig megen data i deres 150 digitale opslagsværker. De har købt alt, hvad der har med online ordbøger at gøre og sidder også på grammatip.com. Med deres model ODIN-LLM tilbyder en færdig API-løsning som kommuner og andre offentlige instanser kan bruge fremfor f.eks. Microsofts CoPilot eller ChatGPT.

Chat.dk er gratis at bruge for individer. Virksomheden tjener penge på deres ordbøger og løsninger til offentlige og private organisationer. 

Bjarni Norddahl, der er CTO og partner i Ordbogen A/S vil ikke oplyse hvilke grundmodeller, de har trænet ODIN-LLM på. Men det  er alle tilgængelige såkaldte open weight (tæt på open source) i både USA, Europa og Kina, siger han. 

“Vi bruger det hele og er ligeglade med, hvorfra de kommer. Men der må ikke være bias i. Den skal kunne svare på, hvad der skete på en fredsplads og på amerikanske følsomme emner. Grundmodellerne kan jo bruges politisk, og det er vigtigt at få det inkorporede bias pillet ud af dem,” siger Bjarni Norddahl. 

Kan man kalde det dig suverænt når de er trænet på amerikanske og kinesiske grundmodeller?

“Ja, det handler om at være i kontrol og uafhængig. Vi skal ikke opfinde den dybe tallerken igen. Vi kan sagtens bygge videre på andres,” siger Bjarni Norddahl, der påpeger, at både Google og OpenAI lancerer open weight modeller, som er langt bagefter, mens de kinesiske open weight modeller er de bedste og mest opdaterede.

Ophavsretsproblemer

Norddahl erkender, at der er en uafklaret ophavsretsproblematik, da så godt som alle store grundmodeller er trænet på data fra internettet, som de ikke har fået tilladelse til.

“Ophavsrettigheder er en uafklaret ting i hele branchen. Vi vil gerne respektere ophavsretten så godt som muligt, men det er også en balancegang, og vi kan helt spænde ben for os selv i Europa,” siger han og påpeger, at “alt det, vi selv selv træner med er der fuld tilladelse til.”

Man krænker også andres ophavsret ved at uplade indhold på de forskellige chatbots, f.eks. for at få et resumé. Ifølge Norddahl bliver al data, brugerne  uploader, som udgangspunkt ikke gemt, for de data er ganske enkelt ikke gode nok til at træne modellen på.

“Hvis jeg var en stat eller en kommune eller Vestas eller Novo, ville det ikke træningen på deres data hos en amerikanske sprogmodel, som jeg ville være bekymret for, men meget mere, hvem der eventuelt kigger med,” siger Bjarni Norddahl og fortsætter: “Det er ikke tilfældigt, vi laver det her. Vi brænder for det, og personligt gør jeg det også pga Trump. Det er ganske enkelt nødvendigt.”

Ordbogen A/S forsøger at ligne ChatGPT så meget som muligt (det er den meste brugte i Danmark), og påpeger, at chat.dk er lige så god som ChatGPT, bl.a. fordi de nyeste kinesiske open weight modeller overgår OpenAI på de fleste benchmarks. Men fuldkommen lige som med alle andre sprogmodeller, døjer de med hallucinationer. Bjarni Norddahl: 

“Heldigvis er der færre hallucinationer med de større modeller som vores. Men man kommer aldrig uden om dem. Man skal altid faktatjekke.”

Fotocollage: Bjarni Norddahl tv og Peter Revsbech th.