Datakvalitet og innholdsarbeid for chatbot: slik får du faktiske resultater
1. Hvorfor datakvalitet og innhold avgjør om chatboten virker
Selv en god plattform og modell gir svake resultater hvis:
- fasiten ligger spredt i gamle PDF‑er og e‑poster
- det finnes to–tre ulike svar på samme spørsmål
- ingen eier oppdatering når vilkår, priser eller rutiner endres
Denne guiden handler kun om én ting:
Hvordan du organiserer og gjennomfører datakvalitet og innholdsarbeid for én konkret chatbot i bedriften, slik at den faktisk gir riktige svar over tid.
Vi går ikke inn i valg av plattform, språkmodell eller kost/nytte – dette dekkes i pilarartikkelen om chatbot. Her forutsetter vi at du har valgt et første bruksområde og nå må gjøre grunnjobben.
2. Avklar kildene: hvor skal chatboten hente sannheten fra?
Før du fikser tekst, må du bestemme hvilke kilder som er lov å stole på.
2.1 Lag en enkel kildeliste for V1
For det avgrensede området chatboten skal dekke (for eksempel «ordrestatus og levering» eller «HR‑spørsmål for ansatte»), lag en liste med:
- Primærkilder (skal brukes):
- nettside/FAQ‑seksjoner du vet er oppdatert
- interne rutiner/prosedyredokumenter
- produkt‑ eller tjenestesider for akkurat dette området
- Sekundærkilder (kan brukes med varsomhet):
- eldre PDF‑er, presentasjoner, e‑poster som beskriver praksis
- Ekskluderte kilder (skal ikke brukes):
- gamle kampanjesider
- dokumenter merket som utkast
- mapper der «alt mulig» ligger blandet
Kildelisten bør være kort – ofte 10–50 dokumenter/sider for første versjon.
2.2 Velg én «single source of truth» per type informasjon
For hver sentrale faktaopplysning chatboten skal gi (for eksempel frist, pris, leveringsregel), svar på:
- Hvilket dokument/side er fasiten?
- Hvem eier dette dokumentet?
Eksempel:
- «Standard leveringstid i Norge» → fasit:
levering-og-frakt.md, eier: logistikkansvarlig - «Rutine for permisjon» → fasit: HR‑håndbok kapittel 4, eier: HR‑sjef
Chatboten skal peke mot disse – ikke mot tilfeldige PDF‑er fra arkivet.
3. Rydding av innhold: fra kaotiske dokumenter til chatbot‑vennlig tekst
Målet er ikke perfekte policy‑dokumenter, men tilstrekkelig rene tekstbiter til at boten kan svare presist.
3.1 Prioriter hva som må ryddes først
Bruk tallene du har på henvendelser (fra kundesenter, HR, IT osv.) og lag en topp‑liste:
- topp 20 spørsmål på valgt område
- grupper like spørsmål (samme intensjon, ulike formuleringer)
Fokuser ryddingen på de 20 viktigste spørsmålene. Resten kan komme senere.
3.2 Skriv om til korte «chat‑svar»
For hvert prioriterte spørsmål lager du én kort tekstblokk i klarspråk:
- 2–5 setninger per svar
- direkte språk: «du» og «vi», unngå interne begreper der det ikke trengs
- ett hovedbudskap per svar, med punktliste hvis det er flere steg
Eksempel – dårlig:
«I henhold til gjeldende retningslinjer for logistikk håndteres alle standardforsendelser innenfor normale tidsrammer, forutsatt at ordren er korrekt registrert.»
Eksempel – bedre for chatbot:
«Vi sender varene innen 1–2 virkedager. Normal leveringstid er 3–5 virkedager innen Norge. Du får sporingslenke på e‑post så snart pakken er sendt.»
3.3 Splitt opp lange dokumenter
Lange dokumenter med mange emner er vanskelige å bruke direkte.
Praktiske grep:
- del opp i seksjoner med tydelige overskrifter (H2/H3)
- bruk én seksjon per tema chatboten skal svare på
- legg inn korte oppsummeringer på toppen av hver seksjon
Målet er at hvert avsnitt kan stå på egne ben som svar, uten å lese hele dokumentet.
4. Etabler ansvar: hvem eier hva i innholdsarbeidet?
Uten klare eiere blir alt «noens jobb», og da skjer det lite.
4.1 Minimumsroller i datakvalitet og innhold
For hvert chatbot‑område du setter opp, trenger du minst disse rollene:
- Fagansvarlig
- eier svarinnholdet (HR for HR‑bot, kundeservice for kundebot osv.)
- godkjenner nye og endrede svar
- Innholdsredaktør
- skriver/omformulerer tekster i klarspråk
- sørger for konsekvent stil og struktur
- Chatbot‑/plattformansvarlig
- laster opp/indekserer innhold
- passer på at tekniske endringer (indekser, kilder) gjøres riktig
I små bedrifter kan én person ha to av rollene, men aldri alle tre alene over tid.
4.2 Avklar «endringsvei» for innhold
Lag en enkel flyt for hvordan innhold endres:
- Endringsbehov oppdages (ny regel, ny rutine, feil i svar).
- Fagansvarlig beskriver endringen kort.
- Innholdsredaktør oppdaterer teksten.
- Fagansvarlig godkjenner.
- Plattformansvarlig publiserer/indekserer.
Dette kan være et enkelt skjema eller en oppgave i et eksisterende verktøy (Jira, Planner, Trello osv.). Poenget er at det ikke skjer via løs e‑post.
5. Testbank: bygg en liten sannhets‑liste før lansering
En testbank er et sett med reelle spørsmål og fasitsvar du bruker til å teste boten igjen og igjen.
5.1 Slik lager du testbanken
- Hent ut 30–50 ekte henvendelser på valgt område (anonymiser).
- Normaliser dem til én linje per spørsmål i et regneark, for eksempel:
- «Hvor er pakken min, det står bare ‘registrert’ hos Bring?»
- «Hva er leveringstiden til Nord‑Norge?»
- «Jeg fikk ikke sporingslenke, hvordan finner jeg ordren?»
- For hver rad, legg til:
- Kategori/intent (ordrestatus, leveringstid, sporingslenke osv.)
- Fasitsvar (lenke til siden eller kort tekstblokk du skrev i steg 3)
Dette gir deg både input til trening og et fast testgrunnlag.
5.2 Bruk testbanken systematisk
Før lansering og ved større endringer:
- kjør alle spørsmålene inn i chatboten
- registrer for hver rad:
- Treffkvalitet: riktig / delvis / feil
- Kvalitet på norsk: ok / utydelig
Sett en enkel ambisjonsgrense for produksjon, for eksempel:
- minst 80 % «riktig» på de vanligste spørsmålene
- ingen grove feil på tema med høy risiko (pris, vilkår, frister)
6. Løpende datakvalitet: drift i 30 minutter i uken
Datakvalitet er ikke et prosjekt – det er en enkel, fast rutine.
6.1 Ukentlig rutine (drift)
Sett av 30–60 minutter per uke hvor fagansvarlig og innholdsredaktør:
- går gjennom:
- «det hjalp ikke»‑tilbakemeldinger
- 10–20 tilfeldige dialoger
- noterer:
- spørsmål boten ofte misforstår
- manglende innhold (boten svarer «vet ikke» for ofte)
- nye tema som dukker opp (for eksempel ny kampanje eller nytt produkt)
For hver observasjon, bestem:
- Oppdater svartekst (mer presist eller enklere forklaring)
- Legg til ny Q&A i kunnskapsbasen
- Lag regel for eskalering hvis temaet er for komplekst for boten
6.2 Månedlig kvalitetskontroll
Hver måned bør dere:
- kjøre hele testbanken gjennom igjen
- sammenligne resultat med forrige måned
- oppdatere testbanken med 5–10 nye spørsmål fra reelle dialoger
Dette gjør det mulig å se om boten blir bedre eller dårligere over tid, og om endringer i produkter/regler er fanget opp.
7. Datakvalitet ved bruk av generativ AI og RAG
Hvis chatboten bruker generativ AI med RAG (henter utdrag fra dokumenter), stilles ekstra krav til kildene.
7.1 Strukturér dokumentene for RAG
For dokumenter som skal indekseres for RAG:
- bruk tydelige overskrifter og kortere avsnitt
- start hver seksjon med en oppsummering i 1–2 setninger
- legg inn metadata (for eksempel «gjelder: privatkunder», «gjelder fra dato X»)
Det gjør det lettere både å hente riktige utdrag og å filtrere bort feil.
7.2 Håndter versjoner
For å unngå at boten svarer ut fra gamle dokumenter:
- ha én aktiv versjon av hvert dokument i indeksen
- merk utgåtte dokumenter tydelig (og fjern dem fra indeksen)
- ved endring:
- oppdater dokumentet
- notér endringsdato og ansvarlig
En enkel versjonstabell (tittel, versjon, gyldig fra, gyldig til, eier) er ofte nok.
8. Hvordan måle effekten av datakvalitet og innholdsarbeid
Du måler ikke «god tekst», du måler effekten av teksten på chatbotens prestasjon.
8.1 Kvalitets‑KPI‑er
Fokuser på noen få, stabile mål per område:
- Treffsikkerhet:
- andel «riktig» svar i testbanken
- Brukeropplevelse:
- andel «det hjalp meg» på relevante dialoger
- Dekningsgrad:
- andel henvendelser på temaet som boten forsøker å svare på
8.2 Forretnings‑KPI‑er
Knytt kvalitetsarbeidet direkte til tall ledelsen bryr seg om, for eksempel:
- reduksjon i henvendelser på telefon/e‑post om utvalgte tema
- endret behandlingstid på saker som går videre til menneske
Sammenlign før/etter for det avgrensede området, ikke hele kundesenteret.
9. 60‑dagers arbeidsopplegg for datakvalitet og innhold
Hvis du skal sette opp datakvalitet og innholdsarbeid for én chatbot‑brukscase, kan du bruke dette løpet.
Dag 0–15: Kilder, eiere og topp 20 spørsmål
- bestem hvilke kilder som skal brukes i første versjon
- avklar fagansvarlig, innholdsredaktør og plattformansvarlig
- hent ut henvendelser for siste 3–6 måneder og lag topp‑20 liste over spørsmål
Dag 16–30: Svartekster og første kunnskapsbase
- skriv korte, chatbot‑vennlige svar på topp‑20 spørsmålene
- rydd og del opp eksisterende dokumenter
- bygg første versjon av kunnskapsbasen (Q&A og/eller dokumentseksjoner)
Dag 31–45: Testbank og justering
- lag testbanken (30–50 spørsmål med fasit)
- kjør testene mot chatboten og juster innhold der den svarer feil eller uklart
- sett opp en enkel endringsflyt for innhold
Dag 46–60: Pilotdrift og ukentlig vedlikehold
- rull ut boten for det smale temaet
- start ukentlig driftsrutine (logg + 10–20 dialoger + små justeringer)
- gjør en første månedlig kontroll med full testbank og dokumenter endringer i kvalitet
Etter 60 dager har du ikke en perfekt chatbot, men du har grunnstrukturen for datakvalitet og innholdsarbeid som trengs for at den kan bli bedre måned for måned.
10. FAQ om datakvalitet og innhold for chatbot
Hvor mye innhold trenger vi før vi kan lansere?
For et smalt område holder det ofte med 20–40 godt skrevne svar som dekker de vanligste spørsmålene, pluss noen få støttedokumenter. Det er viktigere at disse er gode og oppdaterte enn at du dekker «alt».
Må vi ha alt innholdet i ett verktøy, eller kan vi bruke eksisterende nettsider?
Du kan fint starte med å bruke eksisterende nettsider, så lenge du:
- vet hvilke sider som er fasit
- rydder bort utdaterte sider
- har gode overskrifter og korte avsnitt
En egen kunnskapsbase gjør vedlikehold lettere, men er ikke et absolutt krav i første runde.
Hvem bør eie innholdet – marked, kundeservice eller fagavdeling?
Faget må eie hva som er riktig. Kundeservice/HR/IT (avhengig av tema) bør eie hvordan dere svarer i praksis. Marked/kommunikasjon kan bidra med språk og tone. Det viktigste er at én rolle har eksplisitt ansvar.
Hvor ofte bør vi oppdatere innholdet?
Minst:
- ukentlig småjustering (på bakgrunn av dialoger og tilbakemeldinger)
- månedlig gjennomgang av testbank og toppspørsmål
I tillegg hver gang dere endrer priser, vilkår eller prosesser som påvirker svarene.
Kan ikke modellen «lære selv» slik at vi slipper dette arbeidet?
Modellen kan bli flinkere til å formulere svar, men den kan ikke vite når forretningsregler, vilkår eller prosesser endres. Uten strukturert innholdsarbeid vil den etter hvert gi gamle eller direkte feil svar – uansett hvor avansert den er.
For overordnet bakgrunn om typer chatbot, teknologi og forretningsverdi kan du lese mer om dette i vår hovedartikkel.
Klar for å implementere AI i din bedrift?
Vi hjelper bedrifter med å ta i bruk AI-teknologi på en trygg og effektiv måte. Få en gratis konsultasjon i dag.
Kontakt oss