Norske språkmodeller

Norge har et aktivt miljø for åpne språkmodeller — fra Nasjonalbibliotekets Borealis-serie til NorwAI fra NTNU og NORA.LLM-initiativet. Denne siden gir oversikt over modeller som finnes i dag og hva som er på vei. Sist oppdatert: 23. mai 2026.

📢 Nytt mai 2026

NB-Llama-3.2 (1B og 3B) fra NbAiLab — optimalisert for bokmål, nynorsk og nordiske språk. Lansert april, nå i aktiv bruk.
NorMistral-11B-long — utvidet kontekstvindu for lengre dokumentbehandling.
NorwAI 7B og 45B fra NTNU er i aktiv produksjonsdrift i Norden.
Borealis-familien fra NbAiLab er under løpende utvikling med nye modellstørrelser.
Gemma 4 27B (Apache 2.0) — relevant for norsk med flerspråklig trening, kan kjøres lokalt og kommersiellt.

Eksisterende norske modeller

Borealis (NbAiLab)

Nasjonalbiblioteket (NbAiLab) utvikler Borealis som en serie åpne språkmodeller for norsk og samisk. Modellene bygger videre på Gemma-familien, lanseres i flere størrelser med åpen lisens, og kan fintrenes og driftes på egen infrastruktur.

Støtter bokmål, nynorsk og samiske språk
Åpen lisens — egnet for forskning og produksjon
Basert på Gemma-arkitekturen fra Google
Kan fintrenes på domenespesifikke norske data

Utforsk Borealis og NbAiLab-modeller på Hugging Face →

NB-Llama-3.2 (NbAiLab)

Nye Llama 3.2-baserte modeller i 1B og 3B-størrelse, lansert april 2026. Optimalisert spesifikt for norsk tekst med bred nordisk språkdekning.

1B-varianten kjører på CPU og enkle edge-enheter
3B-varianten gir godt kompromiss for chatbot og klassifisering
Sterk flerspråklig støtte på nordiske språk
Bygget på Meta Llama 3.2-arkitekturen

Last ned fra NbAiLab på Hugging Face →

NorMistral (NORA.LLM)

NorMistral er en serie norsk-tilpassede modeller i NORA.LLM-initiativet. Finnes i 7B-warm og 11B-varianter. NorMistral-11B-long har utvidet kontekstvindu for lengre dokumenter.

NorMistral-7B-warm: praktisk størrelse for produksjon og eksperimentering
NorMistral-11B: sterkere kapasitet med utvidet kontekst
Kontinuerlig trent på store norske tekstkorpus
Åpne vekter via Hugging Face

NORA.LLM-modeller på Hugging Face →

NorwAI (NTNU)

NorwAI er et modellspor fra NTNU, tilgjengelig i Llama 2- og Mistral-arkitekturer. 7B og 45B-varianter er i produksjonsdrift for forskning og nordisk bedriftsbruk.

7B: god balanse for egenhosting på standard server-GPU
45B: høyere kapasitet for krevende norske oppgaver
Rettet mot akademia og nordiske industrimiljøer
Åpent tilgjengelig for forskning

NorwAI på Hugging Face →

NorBLOOM og NorGPT

Tidligere norske modellspor som la grunnlaget for dagens initiativ. NorBLOOM er en norsk tilpasning av BLOOM-arkitekturen. NorGPT-3 var en tidlig GPT-3-basert norsk modell.

Historisk viktige for å bygge norsk treningsdata-infrastruktur
Fortsatt tilgjengelige for forskning og sammenligning
Grunnlag for nyere og mer kapable modeller

Se alle NORA.LLM-modeller →

Scandi-modeller og nordisk samarbeid

Norsk KI-utvikling skjer ikke i isolasjon. Skandinaviske samarbeidsmodeller som ScandEval-benchmarks og nordiske tekstkorpus styrker hele regionen.

Delte evalueringsrammeverk for nordiske språk
Felles datasett og korpus på tvers av landegrenser
Norsk deltagelse i europeiske KI-initiativ (HPLT, OPUS)

Hva er på vei

Borealis neste generasjon

NbAiLab arbeider med nye og større Borealis-varianter. Fokusområder inkluderer multimodal støtte, lengre kontekstvindu og bedre dekning av norske dialekter og samiske språk.

Større modellstørrelser (13B+) under utvikling
Potensielt multimodal støtte for norsk tekst og bilde
Utvidet samisk språkdekning

Fintrening og domenespesialisering

Det norske fagmiljøet jobber med fintrente varianter for helse, jus og offentlig forvaltning — der fagspråk og nøyaktighet er kritisk.

Norsk medisinsk NLP (Helse Sør-Øst og NTNU)
Juridisk norsk fra lovdata og domstolssystemet
Offentlig forvaltningsspråk (NAV, Skatteetaten)

Infrastruktur og compute

Tilgang på norsk og nordisk beregningsinfrastruktur er en forutsetning for å trene og drifte konkurransedyktige modeller i Europa.

LUMI-supercomputeren (Finland) brukes av norske forskningsmiljøer
Sigma2/NRIS gir norske akademikere tilgang til GPU-ressurser
Europeisk EuroHPC-initiativ styrker nordisk kapasitet

Digital suverenitet som drivkraft

Offentlig sektor og regulerte bransjer etterspør modeller som kan driftes innenfor norsk/europeisk jurisdiksjon. Dette driver investeringer i norske og nordiske modellspor fremover.

GDPR og personvernkrav favoriserer lokal drift
Offentlige anskaffelsesregler presser mot åpne modeller
Helsesektoren trenger suverene løsninger for pasientdata

Hvorfor små modeller er viktige

De presterer ofte svært godt på avgrensede språkoppgaver med skreddersydde data.
De gir bedre kontroll over dataflyt, jurisdiksjon og personvernkrav.
De har lavere kostnad, lavere latens og kan kjøre på enklere maskinvare.
De fungerer godt som komponenter i større KI-systemer sammen med større modeller.

Strukturerte språkoppgaver

Små modeller er godt egnet for klassifisering, NER for norske navn, sentimentanalyse, oppsummering og uttrekk av nøkkelinformasjon.

De er også nyttige for oversettelse mellom bokmål og nynorsk, og på sikt mellom norske og samiske språkressurser.

Domenespesifikke fagsystemer

Fintrente modeller kan bli svært presise innen jus, helse, offentlig forvaltning, finans og teknisk dokumentasjon.

Når språkmodellen trenes på relevant fagspråk, øker treffsikkerhet og nytte i daglige arbeidsprosesser.

Digital suverenitet og personvern

Lokal drift gjør det mulig å behandle sensitive data uten å sende informasjon til utenlandske skytjenester.

Dette er særlig relevant for helsesektor, rettsvesen, forsvar, offentlig sektor og kritisk infrastruktur.

Kostnad og volum

Små modeller har lavere driftskostnad og responstid, noe som gjør dem egnet for høyvolumoppgaver som tagging, metadata-generering og batch-prosessering av store tekstsamlinger.

De passer også godt i chatboter, kundeservice og produkter der eksterne API-kall blir for dyrt eller for tregt.

Rolle i større KI-arkitektur

RAG-pipelines

Spørsmålsomskriving, reranking og svarvalidering på norsk før endelig respons sendes til brukeren.

Agentflyt

Ruting av forespørsler, verktøyvalg og enkel resonnering i flertrinns systemer med krav om rask respons.

Kvalitet på norsk

Kontroll av språkføring, klart språk og målform for bokmål og nynorsk i generert tekst.

Kulturarv, forskning og utdanning

Forbedret søk og gjenfinning i digitaliserte samlinger hos kulturinstitusjoner.
OCR-etterbehandling, transkribering og automatisk metadata for store historiske tekstkorpus.
Åpne modeller gir forskere og studenter mulighet til å eksperimentere, inspisere og reprodusere resultater.
Språkforskning styrkes gjennom tilgang til modeller for dialekter, språkstruktur og språkutvikling over tid.

Edge-distribusjon og bærekraft

De minste modellvariantene kan kjøres lokalt på bærbare maskiner, arbeidsstasjoner og enkelte mobile enheter. Dette gjør løsningene mer robuste i felt, ved ustabil nettilgang eller i isolerte miljøer.

Samtidig gir små modeller betydelig lavere energiforbruk per forespørsel enn svært store modeller, og kan derfor være et mer bærekraftig valg når oppgaven ikke krever en generell frontier-modell.

Oppsummering

Borealis og andre små, spesialiserte norske språkmodeller er ikke en erstatning for alle store modeller. De fyller en komplementær rolle: skreddersydd språkstøtte, lokal kontroll, lavere kostnad og raskere drift i mange praktiske anvendelser.