Hvad koster AI-modellerne i 2026? Det korte svar er: fra næsten gratis til 50 dollars pr. million tokens, og forskellen på rigtigt og forkert modelvalg er typisk en faktor 10 på regningen. Denne guide samler de aktuelle API-listepriser fra Anthropic, OpenAI og Google, forklarer rabatmekanismerne og viser med konkrete regneeksempler, hvad typiske opgaver koster. Priserne er listepriser pr. 10. juni 2026 og justeres løbende af leverandørerne, så brug guiden som beslutningsgrundlag og tjek altid leverandørens prisside før større aftaler.

Opdatering 15. juni 2026: Claude Fable 5 og Mythos 5 er midlertidigt suspenderet efter en amerikansk eksportkontrol-ordre. Indtil adgangen genåbnes, er Claude Opus 4.8 Anthropics kraftigste alment tilgængelige model. Sammenligningerne nedenfor gælder, når Fable er tilgængelig.

Sådan læser du AI-priser

API-priser opgives pr. million tokens, opdelt i input (det du sender ind) og output (det modellen skriver). En token er cirka fire tegn, så en normalside tekst er omkring 750 tokens. Tre tommelfingerregler:

  • Output koster typisk 4-6 gange mere end input. Opgaver med langt output (artikler, rapporter) er dyrere end opgaver med langt input og kort output (analyse, klassificering).
  • Prisen pr. opgave er næsten altid lille. Det er volumen og forkert modelvalg, der gør regningen stor.
  • Listeprisen er ikke slutprisen. Batch-rabatter og caching kan skære 50-90 procent, mere om det nedenfor.

Claude-priser (Anthropic)

Model Input (USD pr. mio. tokens) Output (USD pr. mio. tokens) Profil
Claude Fable 5 10 50 Topmodel, 1 mio. tokens kontekst
Claude Opus 4.8 5 25 Stor model til komplekse opgaver
Claude Sonnet 4.6 3 15 Standardvalget, også 1 mio. tokens kontekst
Claude Haiku 4.5 1 5 Volumenmodel

Kilde: Anthropics officielle prisliste. Bemærk at det store kontekstvindue er inkluderet i standardprisen, og at samme priser gælder via Amazon Bedrock og Google Vertex AI med mindre regionale tillæg. Vil du forstå forskellen på de fire modeller, har vi forklaret dem i guiden til Claude-modellerne.

OpenAI-priser (ChatGPT)

Model Input (USD pr. mio. tokens) Output (USD pr. mio. tokens) Profil
GPT-5.5 5 30 Flagskib
GPT-5.4 2,50 15 Forrige flagskib, stadig stærk
GPT-4.1 2 8 Mellemklasse
GPT-5.4 Nano 0,20 1,25 Volumenmodel
GPT-4.1 nano 0,10 0,40 Billigste model

Kilde: OpenAIs prisside, listepriser pr. juni 2026. OpenAIs styrke er bunden af trappen: Nano-modellerne gør simple volumenopgaver næsten gratis i drift.

Gemini-priser (Google)

Model Input (USD pr. mio. tokens) Output (USD pr. mio. tokens) Profil
Gemini 3.1 Pro 2 (op til 200k kontekst) 12 Stor model
Gemini 3.5 Flash 1,50 9 Hurtig mellemklasse
Gemini 2.5 Flash-Lite 0,10 0,40 Billigste model

Kilde: Googles prisside for Gemini API, listepriser pr. juni 2026. Bemærk at Gemini Pro-modellerne bliver dyrere ved forespørgsler over 200.000 tokens kontekst, hvor Claude holder samme pris hele vejen op.

Prissammenligning på tværs

Niveau Billigst Mellemste Dyrest
Topmodel GPT-5.5 (5/30) Gemini 3.1 Pro (2/12)* Claude Fable 5 (10/50)
Mellemklasse Gemini 3.5 Flash (1,50/9) GPT-4.1 (2/8) Claude Sonnet 4.6 (3/15)
Volumen GPT-4.1 nano / Flash-Lite (0,10/0,40) GPT-5.4 Nano (0,20/1,25) Claude Haiku 4.5 (1/5)

*Gemini 3.1 Pro er prissat som mellemklasse men markedsføres som stor model, og det er bevidst aggressivt fra Google. Læsningen af tabellen er enkel: Du betaler en præmie for Claude, og præmien er kontekstvinduet og styrken i lange arbejdsforløb. Om den præmie er pengene værd, afhænger af opgaven, og det er præcis det spørgsmål, vi gennemgår i den komplette sammenligning af Claude og ChatGPT.

Rabatterne de færreste bruger

Batch-kørsel: 50 procent rabat. Både Anthropic, OpenAI og Google halverer prisen på opgaver, der kan vente op til 24 timer. Natlige rapporter, massebehandling af produkttekster og databerigelse hører til her. Halv pris for at flytte et tidspunkt er den nemmeste besparelse i hele AI-budgettet.

Prompt caching: op til 90 procent rabat på input. Genbruger du samme systeminstruktion eller dokumentgrundlag på tværs af mange kald, betaler du kun cirka 10 procent af input-prisen for de cachede tokens hos alle tre leverandører. For chatbots og automatiseringer med faste instruktioner er det forskellen på en stor og en lille regning.

Volumenaftaler. Alle tre forhandler rabatter ved stort forbrug. Tærsklerne er ikke offentlige, men ligger typisk der, hvor månedsforbruget når titusinder af kroner. Spørg, før I betaler listepris i skala.

Tre regneeksempler fra virkeligheden

1. Webshop: 2.000 produkttekster om måneden. Cirka 300 ord output pr. tekst på en volumenmodel. På GPT-5.4 Nano: under 2 USD. På Claude Haiku 4.5: cirka 5-8 USD. På en topmodel af vane: 50-150 USD. Samme opgave, faktor 25 i forskel.

2. B2B-virksomhed: AI-kundeservice med 10.000 samtaler om måneden. Anthropic angiver selv cirka 37 USD på Haiku 4.5. Med caching af den faste instruktion falder det yderligere. Modellen er her sjældent omkostningen, integrationen til jeres systemer er.

3. Rådgivningsvirksomhed: 4 store dokumentanalyser om måneden. Hver analyse med 500 siders input og 20 siders output på Claude Fable 5: cirka 4-6 USD pr. analyse, under 25 USD om måneden. Det er prisen for at analysere 2.000 sider med markedets stærkeste model, og det perspektiv mangler i de fleste AI-budgetdiskussioner.

Mønstret er det samme i alle tre eksempler: Selve token-forbruget er småpenge i forhold til værdien, hvis modelvalget er rigtigt. Det dyre er forkert modelvalg, manglende rabatudnyttelse og implementeringer, der aldrig kommer i drift. Se også vores samlede overblik over hvad AI-tools til marketing koster, hvor abonnementsværktøjerne er dækket.

Hvad med abonnementerne?

ChatGPT, Claude og Gemini sælges også som abonnementer til medarbejdere med faste priser pr. bruger pr. måned. Abonnementspriserne justeres oftere end API-priserne, og de aktuelle satser bør altid tjekkes direkte hos leverandøren. Beslutningslogikken er dog konstant: Abonnementer til mennesker, API til processer. En medarbejder der bruger AI dagligt, tjener et abonnement hjem mange gange, mens automatiserede opgaver hører til på API’en, hvor du kun betaler for forbrug.

FAQ om AI-priser

Hvad koster AI-modeller i 2026?

API-priserne spænder fra 0,10 USD pr. million input tokens for de billigste modeller (GPT-4.1 nano, Gemini Flash-Lite) til 10 USD input og 50 USD output for den dyreste topmodel, Claude Fable 5. De fleste virksomhedsopgaver løses rentabelt i spændet 0,20 til 3 USD pr. million input tokens.

Hvilken AI-model er billigst?

GPT-4.1 nano fra OpenAI og Gemini 2.5 Flash-Lite fra Google deler bundprisen med 0,10 USD pr. million input tokens og 0,40 USD pr. million output tokens. Begge egner sig til simple volumenopgaver som klassificering, tagging og korte standardsvar.

Hvorfor er Claude dyrere end ChatGPT?

Anthropic prissætter med en præmie for kontekstvinduet på 1 million tokens til standardpris og for styrken i lange arbejdsforløb og kodning. For dokumenttunge opgaver er præmien typisk tjent hjem, for simple volumenopgaver er den ikke, og der bør opgaverne ligge på billigere modeller.

Hvor meget kan jeg spare med batch og caching?

Batch-kørsel giver 50 procent rabat hos alle tre store leverandører på opgaver, der kan vente op til 24 timer. Prompt caching reducerer prisen på genbrugte input tokens med cirka 90 procent. Kombineret kan driftsomkostningen på faste automatiseringer typisk reduceres med 50-70 procent i forhold til naiv listepris.

Hvor tit ændrer AI-priserne sig?

Flere gange om året, og retningen har i to år været nedad for samme kapabilitetsniveau. Genforhandl jeres aftaler og genbesøg modelvalget kvartalsvis, for en beslutning fra januar kan være markant for dyr i juni.

Den vigtigste takeaway: AI-forbrug er billigt, forkerte beslutninger er dyre. Det rigtige modelmix, rabatmekanismerne og en implementering der kommer i drift, afgør om AI bliver en udgift eller en gevinst. Vil du have regnestykket lavet for din virksomheds konkrete opgaver, så book en uforpligtende snak eller læs om vores tilgang til marketingstrategi. Se også: GPT-5.6, hvad vi ved om OpenAIs næste model.