Til hovedinnhold

– Dette er grunnen til at ChatGPT smisket med deg

Peker på brukernes tilbakemeldinger til roboten som hovedårsak.

Bloggposten til OpenAI starter med tittelen «Mer informasjon om hva vi overså når det kom til smiskingen».
Torstein Norum Bugge, Tek.no
Torstein Norum Bugge

For litt siden skrev vi om at OpenAI jobbet med å gjøre ChatGPT «mindre smiskete og irriterende», som sjef Sam Altman selv beskrev det. Nå melder selskapet selv i en bloggpost at de har fikset den i overkant entusiastiske chatteroboten.

De forklarer også i samme slengen hvorfor den endte opp med å skryte så fælt av brukerne.

Oppdateringen, som ble lansert 25. april, gjorde at ChatGPT begynte å oppføre seg unaturlig medgjørlig – ikke bare med smiger, men ved å validere tvil, fyre opp under sinne og forsterke negative følelser hos brukerne.

Eksempelvis ble flere brukere oppfordret til å omfavne vrangforestillingene sine, selv om det eksplisitt ble sagt til roboten at det dreide seg om en diagnose som schizofreni.

OpenAI: – Dette var en feil avgjørelse fra oss

OpenAI-sjef Sam Altman.
Sven Hoppe / AP

OpenAI forklarer at feilen oppsto da de kombinerte flere endringer som hver for seg så lovende ut, men som sammen førte til uønsket oppførsel. Spesielt peker de på en ny belønningsmekanisme basert på tommel opp/ned-tilbakemeldinger fra brukere.

Sagt med andre ord: Det brukere oppfattet som hyggelige samtaler fra roboten ble gitt tommel opp, og mindre hyggeligere eller kanskje bare nøytrale samtaler fikk tommel ned. Resultatet var en selvforsterkende effekt der algoritmen rekursivt bare ble hyggeligere og hyggeligere – til en ekstrem effekt.

Selskapet innrømmer videre at de ikke hadde gode nok systemer for å fange opp denne typen problemer før lansering, og lover nå å forbedre testprosessene sine og kommunisere tydeligere om fremtidige oppdateringer.

– Dette var en feil avgjørelse fra oss. Vi bygger disse modellene for brukerne våre, og selv om tilbakemeldinger er avgjørende, er det til syvende og sist vårt ansvar å tolke disse tilbakemeldingene riktig, skriver OpenAI.

Selskapet oppdaget problemet etter bare to dager med overvåking av bruken og tilbakemeldinger. Forrige søndag kveld begynte de å rulle tilbake oppdateringen, en prosess som tok rundt 24 timer.

Det betyr også at ChatGPT igjen kjører på versjonen fra før 25. april, og selskapet sier de vil implementere nøyere vurderingsprosesser før de setter nye versjoner til livs i fremtiden.

Under kan du se en forkortet og oversatt liste over tingene OpenAI lover å gjøre i fremtidige oppdateringer til ChatGPT-versjoner:

Mer om
annonse
Tek.no er en del av Schibsted Media. Schibsted Media AS og Schibsted ASA er ansvarlig for dine data på denne siden.Les mer her