fciu napisał(a): Czyli potrafi dokończyć dość sztampową historię science-fiction. Już o tym pisałem. Nie ma tutaj żadnego dowodu, że owe LLM-y miały jakikolwiek model siebie, swoich operatorów, czy w ogóle otaczającej ich rzeczywistości. Oczywiście możesz dalej powtarzać swoje, ale fajnie gdybyś jednak się odniósł do argumentów.
Twój model otaczającej rzeczywistości to prawdopodobnie pewne obwody nerwowe w mózgu, które odpowiadają za "umiejętność kończenia historii". Na chwilę obecną zakończenia historii w Twoim wypadku są mniej sztampowe niż w przypadku LLM-a, ale to tylko różnica stopnia.
Poza tym sorry, ale obserwacja zachowania jest naukowo dopuszczalnym i powszechnie stosowanym dowodem (evidence).
fciu napisał(a): A dlaczego? Zachowanie na podstawie rzutu monetą może być tak samo behawioralnie sensowne, jak zachowanie na podstawie przewidywań tokenów w LLM.
W podanym eksperymencie model wykonał racjonalne działanie (próbował zatrzymać własne wyłączenie) w 90% przypadków. Przy rzucie monetą tylko w 50% przypadków.

