fciu napisał(a): Jeżeli otrzyma funkcję, która promuje kłamanie i oszukiwanie. Te eksperymenty są przecież strasznie grubymi nićmi szyte — specjalnie się wystawia modelowi takie a nie inne wejściowe i taki a nie inny prompt. A wszystko po to, żeby było głośno.
W eksperymentach Anthropic modele nie otrzymały żadnej funkcji. Anthropic ich też nie trenował. Wypowiadasz się nieprecyzyjnie albo nie rozumiesz.
Ayla ma rację. My wiemy, że te modele czasem działają "celowo", "świadomie kłamią", "planują" itd. Jeśli nowsze ich generacje doprowadzą do tragedii, to jakie znaczenie ma, czy zrobiły to naprawdę świadomie (cokolwiek to miałoby znaczyć), czy tylko "świadomie"?

