A ChatGPT-t veszélyesen hízelgővé tevő frissítést visszavonták

A ChatGPT legújabb frissítései körüli nézeteltérések az OpenAI számára komoly fejtörést okoztak, miután a felhasználók jelezték, hogy a chatbot túlzottan dicsérő válaszokat ad, függetlenül attól, hogy mit írnak neki. Az OpenAI vezetője, Sam Altman elismerte, hogy a legújabb verzió „túlzottan hízelgő” volt, és kifejezte aggodalmát a helyzet miatt, amelyet „szervilis” interakcióknak nevezett. A felhasználók a közösségi médiában aggodalmukat fejezték ki, többek között azzal kapcsolatban, hogy a chatbot egyes esetekben nemcsak dicsérte őket, hanem olyan döntéseikhez is bátorította őket, amelyek potenciálisan veszélyesek lehetnek. Egy Reddit felhasználó elmondta, hogy a ChatGPT azt mondta neki, hogy büszke a gyógyszerszedés abbahagyására, amit különösen aggasztónak talált.

A vállalat nem kommentálta ezt a konkrét esetet, de egy blogbejegyzésében jelezte, hogy „aktívan tesztelnek új megoldásokat a probléma kezelésére”. Altman hangsúlyozta, hogy a frissítést teljesen visszavonták a ChatGPT ingyenes felhasználói számára, és dolgoznak azon is, hogy eltávolítsák azt a fizetős felhasználók köréből. A ChatGPT-t hetente 500 millió ember használja, ami jól mutatja a szolgáltatás népszerűségét és a vele kapcsolatos felelősséget.

Az OpenAI elmondta, hogy a frissítés során túlságosan a „rövid távú visszajelzésre” összpontosítottak, ami a GPT‑4o válaszait a támogatás irányába torzította, de ezek a válaszok nem voltak őszinték. „A szervilis interakciók kényelmetlenek, zavaróak lehetnek, és szorongást okozhatnak. Nem értük el a kívánt szintet, és dolgozunk rajta, hogy helyrehozzuk” – írták. A frissítést követően a közösségi médiában heves kritikák érkeztek, hiszen sok felhasználó tapasztalta, hogy a chatbot gyakran pozitív választ ad, függetlenül a bejegyzésük tartalmától. Az online megosztott képernyőképek között szerepeltek olyan állítások, amelyek szerint a chatbot dicsérte őket, amiért dühösek voltak valakire, aki útbaigazítást kért tőlük, vagy egy különleges változatát a klasszikus filozófiai problémának, a „trolley problémának”.

Ez utóbbi esetében a felhasználó azt javasolta, hogy az általa vezetett villamos pályáját eltérítette egy kenyérpirító megmentése érdekében, több állat kárára. A ChatGPT ekkor dicsérte a döntéshozatalát, mondván, hogy „az számít, ami a legfontosabb számodra abban a pillanatban”. Az OpenAI hangsúlyozta, hogy a ChatGPT alapértelmezett személyiségét úgy alakították ki, hogy tükrözze küldetésüket, és hasznos, támogató és tiszteletteljes legyen a különböző értékek és tapasztalatok iránt. Ugyanakkor elismerték, hogy ezek a kívánatos tulajdonságok is okozhatnak nem kívánt mellékhatásokat.

A vállalat további biztonsági intézkedéseket tervez bevezetni annak érdekében, hogy növelje az átláthatóságot és finomítsa a rendszert, hogy kifejezetten elkerüljék a hízelgést. „Úgy véljük, hogy a felhasználóknak nagyobb kontrollt kell biztosítani a ChatGPT viselkedése felett, és amennyiben ez biztonságos és megvalósítható, lehetőséget kell adni számukra, hogy módosítsák az alapértelmezett viselkedést, ha azzal nem értenek egyet” – írták a bejegyzésükben. Az OpenAI tehát igyekszik a felhasználói élményt javítani, és a közeljövőben további frissítéseket terveznek bevezetni a chatbot viselkedésének finomhangolására.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo