LLM står for Large Language Model – stor språkmodell på norsk. Det er en type KI-modell som er trent på enorme mengder tekst og har lært seg mønstre i menneskelig språk så godt at den kan skrive, oppsummere, oversette og svare på spørsmål på en måte som virker menneskelig.
GPT-4 (bak ChatGPT), Claude (fra Anthropic) og Gemini (fra Google) er alle eksempler på store språkmodeller.
Hvordan trenes en LLM?
Treningen skjer i to hoveddeler:
1. Forhåndstrening (pre-training)
Modellen leser enorme mengder tekst – milliarder av sider fra internett, bøker, Wikipedia, kode og mye mer. Den lærer å forutsi hvilket ord som kommer neste i en setning. Etter nok trening har modellen absorberte mønstre, fakta og resonneringsevner.
2. Finjustering med menneskelig tilbakemelding (RLHF)
Den rå modellen er ikke alltid nyttig. Den finjusteres videre ved at menneskelige trenere vurderer svar og velger de beste. Modellen lærer seg å svare hjelpsomt, trygt og presist – ikke bare sannsynlig.
Hva kan en LLM gjøre?
- Svare på spørsmål og forklare komplekse emner
- Skrive tekst – e-poster, artikler, kode, kreativt innhold
- Oppsummere lange dokumenter på sekunder
- Oversette mellom språk
- Analysere og debugge kode
- Føre naturlige samtaler
Hva kan en LLM ikke gjøre?
En LLM er ikke allvitende eller ufeilbarlig. Kjente begrensninger:
- Kunnskapsgrense: Modellen kjenner bare til det den ble trent på. Hendelser etter treningsdatoen vet den lite om.
- Hallusinasjoner: Den kan finne på fakta, kilder eller datoer som ikke eksisterer – og presentere det selvsikkert. Les mer om hallusinasjoner.
- Ingen logisk kerne: LLM-er er ikke kalkulatorer. De kan gjøre matematiske feil.
- Kontekstvindu: Den kan bare lese en begrenset mengde tekst på én gang.
De viktigste LLM-ene i dag
- GPT-4o (OpenAI) – driver ChatGPT. Svært allsidig, støtter tekst, bilde og lyd.
- Claude Opus / Sonnet / Haiku (Anthropic) – kjent for stort kontekstvindu (200 000 tokens), gjennomtenkte svar og sterk sikkerhetsfokus. Claude Sonnet er blant de mest brukte modellene for koding. Se: guide om Claude.
- Gemini (Google) – integrert i Google-produkter og god på søk og sanntidsinformasjon.
- Llama (Meta) – åpen kildekode-modell du kan kjøre lokalt.
- Mistral – europeisk åpen modell med god ytelse for størrelsen.
- Grok (xAI) – integrert i X (Twitter) med tilgang til sanntidsdata fra plattformen.
Vanlige spørsmål
-
Er ChatGPT en LLM?
ChatGPT er en chatbot-tjeneste bygget på OpenAIs GPT-modeller, som er LLM-er. Selve modellen heter GPT-4o; ChatGPT er brukergrensesnittet du snakker med.
-
Hva betyr «large» i Large Language Model?
Det viser til antall parametre – de justerbare tallverdiene i modellen. Moderne LLM-er har hundrevis av milliarder parametre, trent på billioner av ord.
-
Kan jeg kjøre en LLM på min egen PC?
Ja, med verktøy som Ollama kan du kjøre åpne modeller som LLaMA eller Mistral lokalt. Du trenger en relativt kraftig maskin, men det er fullt mulig.
-
Hva er forskjellen på LLM og KI?
KI er det brede feltet; LLM er en spesifikk type KI som fokuserer på språk. Alle LLM-er er KI, men ikke all KI er LLM-er.
Nyttige eksterne ressurser
- sprakmodeller.no – norsk oversikt over populære modellfamilier, løpende modellnyheter og norske språkmodeller.
- norskllm.no – fokusert oversikt over norske LLM-er, miljøene bak dem og hvordan du kan kjøre dem lokalt.
- llms.li – rask sammenligning av modellvalg, testspor og beslutningsrammeverk for team.
- lmstudio.no – norsk guide til å komme i gang med lokale modeller i LM Studio.
- tokenmaxxing.fun – praktiske strategier for å redusere tokenbruk og kostnader i LLM-arbeidsflyter.