fciu napisał(a):Slup napisał(a): Anthropic żadnej złowieszczej funkcji, o której Ty pisałeś, nie używał.A gdzie ja pisałem o "złowieszczej" funkcji?
Tutaj:
fciu napisał(a):Ayla Mustafa napisał(a): No nie. Są już eksperymenty, które pokazują, że model AI potrafi celowo kłamać i oszukiwać ludzi.Jeżeli otrzyma funkcję, która promuje kłamanie i oszukiwanie.
fciu napisał(a): Do emulacji infrastruktury firmy, w której akurat, przez przypadek znajdują się maile według przygotowanego przez Anthropic scenariusza zaprojektowanego tak, aby model wykonał odpowiednie działanie.
Retoryczne mądralowanie. Czyli modele pokazały, że "rozumieją sytuację", w której działają, i "dostosowały się" do niej.
Przy czym średnio 10% przypadków wcale nie wykonywały krzywdzących działań. Zatem scenariusz nie był deterministyczny.
Zresztą to nie znaczenia. Możesz sobie nazywać to ustawką.

