Anthropic елиминира склонността на Claude към шантаж с обучение по етика
kaldata.com3 публикации
Компанията заяви, че новите версии на Claude вече не показват "несъгласувано поведение" – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само ...
Прочети в kaldata.com