RAG (Retrieval-Augmented Generation)
Även känt som: Retrieval-Augmented Generation · Hämtningsförstärkt generering
RAG är tekniken som gör att en språkmodell kan svara mot din egen data i realtid — utan att modellen tränas om. Den hämtar relevanta dokument från en vektordatabas och lägger dem som kontext i prompten.
Kort definition
Retrieval-Augmented Generation (RAG) är en arkitekturmönster där en språkmodell kombineras med ett sökindex över externa dokument. När en fråga ställs hämtas först de mest relevanta dokumenten från indexet, och modellen formulerar sitt svar baserat på dem.
Resultatet: modellen svarar mot din specifika data (intern dokumentation, produktinformation, avtal) utan att behöva tränas om — vilket är både dyrt och trögrörligt.
Så fungerar det steg för steg
1. Inbäddning: dina dokument konverteras till vektorer via en embedding-modell. 2. Lagring: vektorerna lagras i en vektordatabas (Pinecone, Qdrant, Cloudflare Vectorize, pgvector). 3. Retrieval: användarens fråga konverteras till en vektor och närmaste grannar hämtas. 4. Generation: de hämtade dokumenten läggs till i prompten och språkmodellen svarar.
Varför RAG är populärt
Alternativen — att träna en egen modell eller att lägga hela kunskapsbasen direkt i varje prompt — är antingen för dyra eller för begränsade. RAG ger en balans: data stannar hos dig, modellen behöver inte tränas om när data uppdateras, och kostnaden per svar är låg.
Använd när
- Du vill att AI ska svara på frågor om interna dokument, produktkatalog eller kunskapsbas
- Din data uppdateras ofta och du vill inte omträna modellen vid varje ändring
- Du behöver spårbarhet — vilka källor användes för ett visst svar
- Du har GDPR-krav som hindrar dig från att skicka rådata till extern träning
Använd inte när
- Du har färre än ~50 dokument som sällan ändras — lägg dem direkt i prompten istället
- Svaren är alltid samma struktur (FAQ med fasta svar) — regelbaserad logik är billigare
- Klassificering eller beslut utan extern kontext — RAG tillför inget värde
Bygger ni system som använder RAG?
Vi hjälper er bedöma rätt arkitektur, undvika vanliga fallgropar och bygga produktionsklart.