– Dette er grunnen til at ChatGPT smisket med deg

Peker på brukernes tilbakemeldinger til roboten som hovedårsak.

Bloggposten til OpenAI starter med tittelen «Mer informasjon om hva vi overså når det kom til smiskingen». — Torstein Norum Bugge, Tek.no

Publisert 6. mai

For litt siden skrev vi om at OpenAI jobbet med å gjøre ChatGPT «mindre smiskete og irriterende», som sjef Sam Altman selv beskrev det. Nå melder selskapet selv i en bloggpost at de har fikset den i overkant entusiastiske chatteroboten.

De forklarer også i samme slengen hvorfor den endte opp med å skryte så fælt av brukerne.

Oppdateringen, som ble lansert 25. april, gjorde at ChatGPT begynte å oppføre seg unaturlig medgjørlig – ikke bare med smiger, men ved å validere tvil, fyre opp under sinne og forsterke negative følelser hos brukerne.

Eksempelvis ble flere brukere oppfordret til å omfavne vrangforestillingene sine, selv om det eksplisitt ble sagt til roboten at det dreide seg om en diagnose som schizofreni.

OpenAI: – Dette var en feil avgjørelse fra oss

OpenAI-sjef Sam Altman. — Sven Hoppe / AP

OpenAI forklarer at feilen oppsto da de kombinerte flere endringer som hver for seg så lovende ut, men som sammen førte til uønsket oppførsel. Spesielt peker de på en ny belønningsmekanisme basert på tommel opp/ned-tilbakemeldinger fra brukere.

Sagt med andre ord: Det brukere oppfattet som hyggelige samtaler fra roboten ble gitt tommel opp, og mindre hyggeligere eller kanskje bare nøytrale samtaler fikk tommel ned. Resultatet var en selvforsterkende effekt der algoritmen rekursivt bare ble hyggeligere og hyggeligere – til en ekstrem effekt.

Selskapet innrømmer videre at de ikke hadde gode nok systemer for å fange opp denne typen problemer før lansering, og lover nå å forbedre testprosessene sine og kommunisere tydeligere om fremtidige oppdateringer.

Les også

Altman og Musk i ny teknologikrig

– Dette var en feil avgjørelse fra oss. Vi bygger disse modellene for brukerne våre, og selv om tilbakemeldinger er avgjørende, er det til syvende og sist vårt ansvar å tolke disse tilbakemeldingene riktig, skriver OpenAI.

Selskapet oppdaget problemet etter bare to dager med overvåking av bruken og tilbakemeldinger. Forrige søndag kveld begynte de å rulle tilbake oppdateringen, en prosess som tok rundt 24 timer.

Det betyr også at ChatGPT igjen kjører på versjonen fra før 25. april, og selskapet sier de vil implementere nøyere vurderingsprosesser før de setter nye versjoner til livs i fremtiden.

Under kan du se en forkortet og oversatt liste over tingene OpenAI lover å gjøre i fremtidige oppdateringer til ChatGPT-versjoner:

Dette skal OpenAI forbedre:

Åpen godkjenning av modellatferd: Vi vil stoppe lanseringer hvis det er problemer med atferd som hallusinasjon, bedrag eller inkonsekvens, basert på kvalitative signaler og målinger med proxydata – selv om andre metrikker ser bra ut.
Valgfri “alpha”-testfase: Vi innfører en frivillig alpha-test for å få tidlige tilbakemeldinger fra brukere.
Større vekt på stikkprøver: Stikkprøver og interaktiv testing vil få større betydning i lanseringsbeslutninger.
Bedre offline-evalueringer og A/B-testing: Vi forbedrer begge deler raskt.
Sterkere vurdering av atferdsprinsipper: Vi styrker måten vi evaluerer hvor godt modellene følger våre atferdsmål, også der vi mangler dekning i dag.
Proaktiv kommunikasjon: Vi vil varsle tydelig om alle oppdateringer – store som små – og alltid inkludere kjente begrensninger i utgivelsesnotatene.

Les også

Nordmann klager inn OpenAI: ChatGPT påsto han hadde drept sine egne barn

Mer om

OpenAI