Fine-tuning

Kort definition

Fine-tuning innebär att ta en förtränad språkmodell (t.ex. Llama 4, GPT-5 via OpenAI:s fine-tuning-API, Mistral) och vidareträna den på dina egna exempel. Modellen anpassas mot ett specifikt mönster — ton, format, domänspråk eller uppgiftstyp.

Till skillnad från RAG, som hämtar information vid varje fråga, bakar fine-tuning in mönstret i modellens vikter. Den nya modellen "vet" hur den ska agera utan att få det som kontext varje gång.

Fine-tuning vs RAG vs prompt engineering

Prompt engineering: billigast, snabbast — justera instruktioner och few-shot-exempel i prompten. Räcker förvånansvärt ofta.

RAG: när du behöver att modellen använder specifik extern data som ändras. Ingen träning krävs.

Fine-tuning: när du behöver ändra modellens grundbeteende (ton, stil, struktur) eller förbättra på en smal uppgift där prompt-instruktioner inte är konsekventa nog.

De utesluter inte varandra. Ett produktionssystem kan använda alla tre: en fine-tunad modell för grundbeteendet, RAG för extern data, och promptmönster för ramar.

Vad det kostar

Fine-tuning på OpenAI- eller Anthropic-modeller ligger typiskt på några tusentals till tiotusentals kronor i träningsavgift plus 2–4x högre inferenkostnad per token efter att den är driftsatt. Self-hosted fine-tuning på Llama-modeller kan vara billigare i drift men kräver GPU-kapacitet och kompetens.

För de flesta use cases är RAG eller prompt engineering bättre första val. Fine-tuning är verktyget när de inte räcker.

Använd när

Du behöver en mycket specifik ton eller struktur som prompt-instruktioner inte ger konsekvent
Du har 1000+ kvalitativa exempel på önskad input → output
Uppgiften är smal och upprepas ofta — kostnaden motiveras av volym

Använd inte när

Du har inte prövat prompt engineering eller RAG först
Din data ändras ofta — du får träna om modellen varje gång
Du har färre än ~200 exempel av hög kvalitet

Behöver du hjälp?

Bygger ni system som använder Fine-tuning?

Vi hjälper er bedöma rätt arkitektur, undvika vanliga fallgropar och bygga produktionsklart.

Boka konsultation