Fine-tuning
Även känt som: Finjustering · Modellfinjustering
Fine-tuning är att vidareträna en befintlig språkmodell på en mindre, specialiserad datamängd så att den presterar bättre på en specifik uppgift. Det är oftast dyrare och trögligare än RAG — men i rätt fall ger det märkbart bättre resultat.
Kort definition
Fine-tuning innebär att ta en förtränad språkmodell (t.ex. Llama 4, GPT-5 via OpenAI:s fine-tuning-API, Mistral) och vidareträna den på dina egna exempel. Modellen anpassas mot ett specifikt mönster — ton, format, domänspråk eller uppgiftstyp.
Till skillnad från RAG, som hämtar information vid varje fråga, bakar fine-tuning in mönstret i modellens vikter. Den nya modellen "vet" hur den ska agera utan att få det som kontext varje gång.
Fine-tuning vs RAG vs prompt engineering
Prompt engineering: billigast, snabbast — justera instruktioner och few-shot-exempel i prompten. Räcker förvånansvärt ofta.
RAG: när du behöver att modellen använder specifik extern data som ändras. Ingen träning krävs.
Fine-tuning: när du behöver ändra modellens grundbeteende (ton, stil, struktur) eller förbättra på en smal uppgift där prompt-instruktioner inte är konsekventa nog.
De utesluter inte varandra. Ett produktionssystem kan använda alla tre: en fine-tunad modell för grundbeteendet, RAG för extern data, och promptmönster för ramar.
Vad det kostar
Fine-tuning på OpenAI- eller Anthropic-modeller ligger typiskt på några tusentals till tiotusentals kronor i träningsavgift plus 2–4x högre inferenkostnad per token efter att den är driftsatt. Self-hosted fine-tuning på Llama-modeller kan vara billigare i drift men kräver GPU-kapacitet och kompetens.
För de flesta use cases är RAG eller prompt engineering bättre första val. Fine-tuning är verktyget när de inte räcker.
Använd när
- Du behöver en mycket specifik ton eller struktur som prompt-instruktioner inte ger konsekvent
- Du har 1000+ kvalitativa exempel på önskad input → output
- Uppgiften är smal och upprepas ofta — kostnaden motiveras av volym
Använd inte när
- Du har inte prövat prompt engineering eller RAG först
- Din data ändras ofta — du får träna om modellen varje gång
- Du har färre än ~200 exempel av hög kvalitet
Bygger ni system som använder Fine-tuning?
Vi hjälper er bedöma rätt arkitektur, undvika vanliga fallgropar och bygga produktionsklart.