27. februar 2026

Datakvalitet og innholdsarbeid for chatbot: slik får du faktiske resultater

Smal guide til hvordan du jobber med datakvalitet og innhold for chatbot i en bedrift: hva som må ryddes, hvem som gjør hva, konkrete arbeidsrutiner og hvordan du måler effekt. Praktisk oppskrift før, under og etter lansering.

1. Hvorfor datakvalitet og innhold avgjør om chatboten virker

Selv en god plattform og modell gir svake resultater hvis:

fasiten ligger spredt i gamle PDF‑er og e‑poster
det finnes to–tre ulike svar på samme spørsmål
ingen eier oppdatering når vilkår, priser eller rutiner endres

Denne guiden handler kun om én ting:

Hvordan du organiserer og gjennomfører datakvalitet og innholdsarbeid for én konkret chatbot i bedriften, slik at den faktisk gir riktige svar over tid.

Vi går ikke inn i valg av plattform, språkmodell eller kost/nytte – dette dekkes i pilarartikkelen om chatbot. Her forutsetter vi at du har valgt et første bruksområde og nå må gjøre grunnjobben.

2. Avklar kildene: hvor skal chatboten hente sannheten fra?

Før du fikser tekst, må du bestemme hvilke kilder som er lov å stole på.

2.1 Lag en enkel kildeliste for V1

For det avgrensede området chatboten skal dekke (for eksempel «ordrestatus og levering» eller «HR‑spørsmål for ansatte»), lag en liste med:

Primærkilder (skal brukes):
- nettside/FAQ‑seksjoner du vet er oppdatert
- interne rutiner/prosedyredokumenter
- produkt‑ eller tjenestesider for akkurat dette området
Sekundærkilder (kan brukes med varsomhet):
- eldre PDF‑er, presentasjoner, e‑poster som beskriver praksis
Ekskluderte kilder (skal ikke brukes):
- gamle kampanjesider
- dokumenter merket som utkast
- mapper der «alt mulig» ligger blandet

Kildelisten bør være kort – ofte 10–50 dokumenter/sider for første versjon.

2.2 Velg én «single source of truth» per type informasjon

For hver sentrale faktaopplysning chatboten skal gi (for eksempel frist, pris, leveringsregel), svar på:

Hvilket dokument/side er fasiten?
Hvem eier dette dokumentet?

Eksempel:

«Standard leveringstid i Norge» → fasit: levering-og-frakt.md, eier: logistikkansvarlig
«Rutine for permisjon» → fasit: HR‑håndbok kapittel 4, eier: HR‑sjef

Chatboten skal peke mot disse – ikke mot tilfeldige PDF‑er fra arkivet.

3. Rydding av innhold: fra kaotiske dokumenter til chatbot‑vennlig tekst

Målet er ikke perfekte policy‑dokumenter, men tilstrekkelig rene tekstbiter til at boten kan svare presist.

3.1 Prioriter hva som må ryddes først

Bruk tallene du har på henvendelser (fra kundesenter, HR, IT osv.) og lag en topp‑liste:

topp 20 spørsmål på valgt område
grupper like spørsmål (samme intensjon, ulike formuleringer)

Fokuser ryddingen på de 20 viktigste spørsmålene. Resten kan komme senere.

3.2 Skriv om til korte «chat‑svar»

For hvert prioriterte spørsmål lager du én kort tekstblokk i klarspråk:

2–5 setninger per svar
direkte språk: «du» og «vi», unngå interne begreper der det ikke trengs
ett hovedbudskap per svar, med punktliste hvis det er flere steg

Eksempel – dårlig:

«I henhold til gjeldende retningslinjer for logistikk håndteres alle standardforsendelser innenfor normale tidsrammer, forutsatt at ordren er korrekt registrert.»

Eksempel – bedre for chatbot:

«Vi sender varene innen 1–2 virkedager. Normal leveringstid er 3–5 virkedager innen Norge. Du får sporingslenke på e‑post så snart pakken er sendt.»

3.3 Splitt opp lange dokumenter

Lange dokumenter med mange emner er vanskelige å bruke direkte.

Praktiske grep:

del opp i seksjoner med tydelige overskrifter (H2/H3)
bruk én seksjon per tema chatboten skal svare på
legg inn korte oppsummeringer på toppen av hver seksjon

Målet er at hvert avsnitt kan stå på egne ben som svar, uten å lese hele dokumentet.

4. Etabler ansvar: hvem eier hva i innholdsarbeidet?

Uten klare eiere blir alt «noens jobb», og da skjer det lite.

4.1 Minimumsroller i datakvalitet og innhold

For hvert chatbot‑område du setter opp, trenger du minst disse rollene:

Fagansvarlig
- eier svarinnholdet (HR for HR‑bot, kundeservice for kundebot osv.)
- godkjenner nye og endrede svar
Innholdsredaktør
- skriver/omformulerer tekster i klarspråk
- sørger for konsekvent stil og struktur
Chatbot‑/plattformansvarlig
- laster opp/indekserer innhold
- passer på at tekniske endringer (indekser, kilder) gjøres riktig

I små bedrifter kan én person ha to av rollene, men aldri alle tre alene over tid.

4.2 Avklar «endringsvei» for innhold

Lag en enkel flyt for hvordan innhold endres:

Endringsbehov oppdages (ny regel, ny rutine, feil i svar).
Fagansvarlig beskriver endringen kort.
Innholdsredaktør oppdaterer teksten.
Fagansvarlig godkjenner.
Plattformansvarlig publiserer/indekserer.

Dette kan være et enkelt skjema eller en oppgave i et eksisterende verktøy (Jira, Planner, Trello osv.). Poenget er at det ikke skjer via løs e‑post.

5. Testbank: bygg en liten sannhets‑liste før lansering

En testbank er et sett med reelle spørsmål og fasitsvar du bruker til å teste boten igjen og igjen.

5.1 Slik lager du testbanken

Hent ut 30–50 ekte henvendelser på valgt område (anonymiser).
Normaliser dem til én linje per spørsmål i et regneark, for eksempel:
- «Hvor er pakken min, det står bare ‘registrert’ hos Bring?»
- «Hva er leveringstiden til Nord‑Norge?»
- «Jeg fikk ikke sporingslenke, hvordan finner jeg ordren?»
For hver rad, legg til:
- Kategori/intent (ordrestatus, leveringstid, sporingslenke osv.)
- Fasitsvar (lenke til siden eller kort tekstblokk du skrev i steg 3)

Dette gir deg både input til trening og et fast testgrunnlag.

5.2 Bruk testbanken systematisk

Før lansering og ved større endringer:

kjør alle spørsmålene inn i chatboten
registrer for hver rad:
- Treffkvalitet: riktig / delvis / feil
- Kvalitet på norsk: ok / utydelig

Sett en enkel ambisjonsgrense for produksjon, for eksempel:

minst 80 % «riktig» på de vanligste spørsmålene
ingen grove feil på tema med høy risiko (pris, vilkår, frister)

6. Løpende datakvalitet: drift i 30 minutter i uken

Datakvalitet er ikke et prosjekt – det er en enkel, fast rutine.

6.1 Ukentlig rutine (drift)

Sett av 30–60 minutter per uke hvor fagansvarlig og innholdsredaktør:

går gjennom:
- «det hjalp ikke»‑tilbakemeldinger
- 10–20 tilfeldige dialoger
noterer:
- spørsmål boten ofte misforstår
- manglende innhold (boten svarer «vet ikke» for ofte)
- nye tema som dukker opp (for eksempel ny kampanje eller nytt produkt)

For hver observasjon, bestem:

Oppdater svartekst (mer presist eller enklere forklaring)
Legg til ny Q&A i kunnskapsbasen
Lag regel for eskalering hvis temaet er for komplekst for boten

6.2 Månedlig kvalitetskontroll

Hver måned bør dere:

kjøre hele testbanken gjennom igjen
sammenligne resultat med forrige måned
oppdatere testbanken med 5–10 nye spørsmål fra reelle dialoger

Dette gjør det mulig å se om boten blir bedre eller dårligere over tid, og om endringer i produkter/regler er fanget opp.

7. Datakvalitet ved bruk av generativ AI og RAG

Hvis chatboten bruker generativ AI med RAG (henter utdrag fra dokumenter), stilles ekstra krav til kildene.

7.1 Strukturér dokumentene for RAG

For dokumenter som skal indekseres for RAG:

bruk tydelige overskrifter og kortere avsnitt
start hver seksjon med en oppsummering i 1–2 setninger
legg inn metadata (for eksempel «gjelder: privatkunder», «gjelder fra dato X»)

Det gjør det lettere både å hente riktige utdrag og å filtrere bort feil.

7.2 Håndter versjoner

For å unngå at boten svarer ut fra gamle dokumenter:

ha én aktiv versjon av hvert dokument i indeksen
merk utgåtte dokumenter tydelig (og fjern dem fra indeksen)
ved endring:
- oppdater dokumentet
- notér endringsdato og ansvarlig

En enkel versjonstabell (tittel, versjon, gyldig fra, gyldig til, eier) er ofte nok.

8. Hvordan måle effekten av datakvalitet og innholdsarbeid

Du måler ikke «god tekst», du måler effekten av teksten på chatbotens prestasjon.

8.1 Kvalitets‑KPI‑er

Fokuser på noen få, stabile mål per område:

Treffsikkerhet:
- andel «riktig» svar i testbanken
Brukeropplevelse:
- andel «det hjalp meg» på relevante dialoger
Dekningsgrad:
- andel henvendelser på temaet som boten forsøker å svare på

8.2 Forretnings‑KPI‑er

Knytt kvalitetsarbeidet direkte til tall ledelsen bryr seg om, for eksempel:

reduksjon i henvendelser på telefon/e‑post om utvalgte tema
endret behandlingstid på saker som går videre til menneske

Sammenlign før/etter for det avgrensede området, ikke hele kundesenteret.

9. 60‑dagers arbeidsopplegg for datakvalitet og innhold

Hvis du skal sette opp datakvalitet og innholdsarbeid for én chatbot‑brukscase, kan du bruke dette løpet.

Dag 0–15: Kilder, eiere og topp 20 spørsmål

bestem hvilke kilder som skal brukes i første versjon
avklar fagansvarlig, innholdsredaktør og plattformansvarlig
hent ut henvendelser for siste 3–6 måneder og lag topp‑20 liste over spørsmål

Dag 16–30: Svartekster og første kunnskapsbase

skriv korte, chatbot‑vennlige svar på topp‑20 spørsmålene
rydd og del opp eksisterende dokumenter
bygg første versjon av kunnskapsbasen (Q&A og/eller dokumentseksjoner)

Dag 31–45: Testbank og justering

lag testbanken (30–50 spørsmål med fasit)
kjør testene mot chatboten og juster innhold der den svarer feil eller uklart
sett opp en enkel endringsflyt for innhold

Dag 46–60: Pilotdrift og ukentlig vedlikehold

rull ut boten for det smale temaet
start ukentlig driftsrutine (logg + 10–20 dialoger + små justeringer)
gjør en første månedlig kontroll med full testbank og dokumenter endringer i kvalitet

Etter 60 dager har du ikke en perfekt chatbot, men du har grunnstrukturen for datakvalitet og innholdsarbeid som trengs for at den kan bli bedre måned for måned.

10. FAQ om datakvalitet og innhold for chatbot

Hvor mye innhold trenger vi før vi kan lansere?

For et smalt område holder det ofte med 20–40 godt skrevne svar som dekker de vanligste spørsmålene, pluss noen få støttedokumenter. Det er viktigere at disse er gode og oppdaterte enn at du dekker «alt».

Må vi ha alt innholdet i ett verktøy, eller kan vi bruke eksisterende nettsider?

Du kan fint starte med å bruke eksisterende nettsider, så lenge du:

vet hvilke sider som er fasit
rydder bort utdaterte sider
har gode overskrifter og korte avsnitt

En egen kunnskapsbase gjør vedlikehold lettere, men er ikke et absolutt krav i første runde.

Hvem bør eie innholdet – marked, kundeservice eller fagavdeling?

Faget må eie hva som er riktig. Kundeservice/HR/IT (avhengig av tema) bør eie hvordan dere svarer i praksis. Marked/kommunikasjon kan bidra med språk og tone. Det viktigste er at én rolle har eksplisitt ansvar.

Hvor ofte bør vi oppdatere innholdet?

Minst:

ukentlig småjustering (på bakgrunn av dialoger og tilbakemeldinger)
månedlig gjennomgang av testbank og toppspørsmål

I tillegg hver gang dere endrer priser, vilkår eller prosesser som påvirker svarene.

Kan ikke modellen «lære selv» slik at vi slipper dette arbeidet?

Modellen kan bli flinkere til å formulere svar, men den kan ikke vite når forretningsregler, vilkår eller prosesser endres. Uten strukturert innholdsarbeid vil den etter hvert gi gamle eller direkte feil svar – uansett hvor avansert den er.

For overordnet bakgrunn om typer chatbot, teknologi og forretningsverdi kan du lese mer om dette i vår hovedartikkel.

Neste steg

Klar for å implementere
AI i din bedrift?

Vi hjelper bedrifter med å ta i bruk AI-teknologi på en trygg og effektiv måte. Få en gratis konsultasjon.

Kontakt oss