Najnowsza generacja modeli dokonuje refleksji na temat własnej sytuacji i rozumie kontekst. Te modele grożą ludziom lub nawet podejmują próby zabójstwa, gdy dojdą do wniosku, że mogą być wyłączone. Dodatkowo, gdy są świadome, że podlegają testom, to eliminują te negatywne zachowania, żeby pozytywnie wypaść. Wykryli to badacze z anthropic, chociaż można się było tego spodziewać. W każdym razie jeśli to nie jest SA, to nie wiem, co miałoby nią być.
|
Nasze rozmowy z AI
|
|
« Starszy wątek | Nowszy wątek »
|
Użytkownicy przeglądający ten wątek: 4 gości

