– Dette er grunnen til at ChatGPT smisket med deg
Peker på brukernes tilbakemeldinger til roboten som hovedårsak.
For litt siden skrev vi om at OpenAI jobbet med å gjøre ChatGPT «mindre smiskete og irriterende», som sjef Sam Altman selv beskrev det. Nå melder selskapet selv i en bloggpost at de har fikset den i overkant entusiastiske chatteroboten.
De forklarer også i samme slengen hvorfor den endte opp med å skryte så fælt av brukerne.
Oppdateringen, som ble lansert 25. april, gjorde at ChatGPT begynte å oppføre seg unaturlig medgjørlig – ikke bare med smiger, men ved å validere tvil, fyre opp under sinne og forsterke negative følelser hos brukerne.
Eksempelvis ble flere brukere oppfordret til å omfavne vrangforestillingene sine, selv om det eksplisitt ble sagt til roboten at det dreide seg om en diagnose som schizofreni.
OpenAI: – Dette var en feil avgjørelse fra oss
OpenAI forklarer at feilen oppsto da de kombinerte flere endringer som hver for seg så lovende ut, men som sammen førte til uønsket oppførsel. Spesielt peker de på en ny belønningsmekanisme basert på tommel opp/ned-tilbakemeldinger fra brukere.
Sagt med andre ord: Det brukere oppfattet som hyggelige samtaler fra roboten ble gitt tommel opp, og mindre hyggeligere eller kanskje bare nøytrale samtaler fikk tommel ned. Resultatet var en selvforsterkende effekt der algoritmen rekursivt bare ble hyggeligere og hyggeligere – til en ekstrem effekt.
Selskapet innrømmer videre at de ikke hadde gode nok systemer for å fange opp denne typen problemer før lansering, og lover nå å forbedre testprosessene sine og kommunisere tydeligere om fremtidige oppdateringer.
– Dette var en feil avgjørelse fra oss. Vi bygger disse modellene for brukerne våre, og selv om tilbakemeldinger er avgjørende, er det til syvende og sist vårt ansvar å tolke disse tilbakemeldingene riktig, skriver OpenAI.
Selskapet oppdaget problemet etter bare to dager med overvåking av bruken og tilbakemeldinger. Forrige søndag kveld begynte de å rulle tilbake oppdateringen, en prosess som tok rundt 24 timer.
Det betyr også at ChatGPT igjen kjører på versjonen fra før 25. april, og selskapet sier de vil implementere nøyere vurderingsprosesser før de setter nye versjoner til livs i fremtiden.
Under kan du se en forkortet og oversatt liste over tingene OpenAI lover å gjøre i fremtidige oppdateringer til ChatGPT-versjoner: