Hopp til innhold

AI · · 4 min lesing

Hva er en språkmodell (LLM)? Slik fungerer ChatGPT egentlig

En språkmodell som ChatGPT virker som magi, men gjør i grunnen én ting. Her er en enkel forklaring på hva en LLM er, hvordan den fungerer og hvor den feiler.

Av Mediseo

ChatGPT, Claude og liknende verktøy virker nesten som om de tenker. Det de egentlig er, kalles en språkmodell — og når du skjønner den ene tingen den gjør, blir både styrkene og svakhetene plutselig logiske.

Én ting, gjort ekstremt godt

En språkmodell — ofte forkortet LLM, for «large language model» — gjør i bunn og grunn én ting: den gjetter på neste ord.

Det høres nesten for enkelt ut til å være imponerende, men tenk over hva det faktisk innebærer. Hvis et system blir godt nok til å forutsi hvilket ord som naturlig følger, kan det fullføre en setning, svare på et spørsmål, skrive et sammendrag eller oversette en tekst — alt sammen er bare «hva er det mest sannsynlige neste ordet, gitt alt som står foran?», gjentatt om og om igjen.

Modellen lærte denne ferdigheten ved å lese enorme mengder tekst — bøker, artikler, nettsider — og øve på å gjette neste ord milliarder av ganger. Etter nok øving fanget den opp hvordan språk faktisk henger sammen: grammatikk, fakta, tone, til og med resonnement, fordi alt dette ligger som mønstre i teksten den leste.

Hvorfor den virker så smart

Når du stiller et spørsmål, slår ikke modellen opp svaret i en database. Den genererer et svar ett ord om gangen, der hvert ord velges fordi det er det mest sannsynlige som følger gitt spørsmålet ditt og alt den allerede har skrevet.

Det er derfor den kan svare på ting den aldri har sett ordrett før. Den setter ikke sammen ferdige svar — den produserer ny tekst på flekken, basert på mønstrene. Det er også derfor du kan få to litt ulike svar på samme spørsmål: det er gjetning, ikke oppslag.

Og det er nettopp dette som gjør den både kraftig og upålitelig på samme tid.

Hvor en språkmodell feiler

Når du har forstått at modellen gjetter neste ord, gir feilene den gjør plutselig mening:

  • Den finner på ting. Hvis det mest sannsynlige neste ordet danner en setning som høres riktig ut, skriver den det — selv om det ikke stemmer. I bransjen kalles dette «hallusinasjon». Modellen «lyver» ikke; den gjetter på språk, ikke på sannhet.
  • Den vet ikke hva den ikke vet. Den har ingen følelse av egen usikkerhet. En selvsikkert formulert feil ser akkurat lik ut som et korrekt svar.
  • Den har en kunnskapsgrense. Modellen kan bare det som lå i treningsdataene fram til et visst tidspunkt. Spør den om noe som skjedde etterpå, og den vet det rett og slett ikke — med mindre den er koblet til oppdaterte kilder.
  • Den er ikke god på presis regning eller logikk med mange ledd, fordi den jobber med språkmønstre, ikke med en kalkulator.

Ingen av disse er feil i den forstand at noe er ødelagt. De er en direkte konsekvens av hva en språkmodell er. Når du vet det, slutter du å bli overrasket — og begynner å bygge inn kontroll der det trengs.

Hva betyr dette i praksis?

Den enkle regelen: en språkmodell er glimrende til å produsere og bearbeide språk, og bør ikke stå alene som kilde til fakta.

Bruk den til å skrive et utkast, oppsummere et langt dokument, omformulere en tekst, lage forslag, sortere henvendelser eller forklare noe enkelt. Dette er den eksepsjonelt god på, og den sparer reell tid.

Vær mer forsiktig når du ber den om harde fakta, tall eller juridiske detaljer uten en kilde. Da bør den enten kobles til dine egne, pålitelige dokumenter, eller få svaret sjekket av et menneske. Det første er en vanlig og effektiv tilnærming: i stedet for å la modellen gjette fritt, mater man den med de riktige dokumentene den skal svare ut fra. Da gjetter den fortsatt på språket, men holder seg til fakta du faktisk stoler på.

Det er forskjellen mellom en chatbot som av og til finner på ting, og et verktøy du trygt kan la kundene dine møte.

Kort oppsummert

  • En språkmodell (LLM) gjetter, i bunn og grunn, på neste ord — om og om igjen.
  • Det enkle prinsippet gir overraskende kraftige resultater på alt som har med språk å gjøre.
  • Den genererer ny tekst, slår ikke opp ferdige svar — derfor kan den ta feil med stor selvtillit.
  • Best på språkoppgaver; bør kobles til kilder eller menneskelig kontroll når fakta må stemme.

Skal en slik modell møte kundene dine eller jobbe med viktig informasjon, ligger forskjellen i hvordan den kobles til riktige kilder og kvalitetssikres — og det er akkurat den biten vi hjelper bedrifter med å få på plass.

Ofte stilte spørsmål

Hva betyr LLM?

LLM står for «large language model» — stor språkmodell. «Stor» viser til de enorme tekstmengdene den ble trent på, og størrelsen på selve modellen. ChatGPT og Claude er eksempler på LLM-er.

Hvorfor finner språkmodeller på ting?

Fordi de gjetter på det mest sannsynlige neste ordet, ikke på hva som er sant. Hvis en plausibel, men feil setning er den mest sannsynlige ordrekken, skriver modellen den. Derfor bør viktige fakta enten hentes fra en pålitelig kilde eller sjekkes av et menneske.

Kan en språkmodell brukes på min egen bedrifts informasjon?

Ja. En vanlig tilnærming er å koble modellen til dine egne dokumenter, slik at den svarer ut fra dem i stedet for å gjette fritt. Da kan den for eksempel svare på kundespørsmål basert på dine retningslinjer og produktinfo — ikke på tilfeldig kunnskap fra internett.

Hva vi kan gjøre for deg og din bedrift.

Beskriv kort hva du trenger hjelp med — ny nettside, mer synlighet på Google, eller bare en gjennomgang. Vi tar kontakt innen én arbeidsdag, som regel med et konkret forslag.