Argumentację Yudkowskiego (jak każdą inną) należy oceniać niezależnie od osoby jej autora. Mnie argumenty Yudkowskiego w zalinkowanej wyżej rozmowie przekonują. Są proste, koherentne i oparte na znanych przykładach związanych z misalignmentem obecnych LLM-ów.
Nie wiem, co masz dokładnie na myśli przez "krzemologię". Natomiast Yudkowsky zajmuje się głównie teorią decyzji i aktywizmem.
Jeśli chodzi o bazyliszka, to wygląda, że Twoje wypowiedzi nie opierają się na podstawowych źródłach.
Ayla Mustafa napisał(a): Yudkovsky nie jest dla mnie jednym z największych autorytetów w dziedzinie "krzemologii". To przecież wĺaśnie on panicznie się przestraszył Bazyliszka Roko... W dodatku przesadza, szacując p(doom) na ponad 95%.
Nie wiem, co masz dokładnie na myśli przez "krzemologię". Natomiast Yudkowsky zajmuje się głównie teorią decyzji i aktywizmem.
Jeśli chodzi o bazyliszka, to wygląda, że Twoje wypowiedzi nie opierają się na podstawowych źródłach.
wikipedia napisał(a):Upon reading the post, Yudkowsky reacted harshly, calling Roko an "idiot". Yudkowsky harshly refuted the idea, arguing that a friendly superintelligent artificial intelligence would have no incentive to carry out the punishment after its own creation. However, in the original post, Roko reported someone having nightmares about the thought experiment. Yudkowsky did not want that to happen to other users who might obsess over the idea. He was also worried there might be some variant on Roko's argument that worked, which could be a serious information hazard.

