Anthropic елиминира склонността на Claude към шантаж с обучение по етика

kaldata.com(преди 1 час)3 публикации

Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват "несъгласувано поведение" – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само ...

Прочети в kaldata.com

САЩ Anthropic Claude изкуствен интелект

Всички публикации (3)

kaldata.comпреди 1 час

Anthropic елиминира склонността на Claude към шантаж с обучение по етикаКомпанията заяви, че новите версии на Claude вече не показват "несъгласувано поведение" – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на п...

clubz.bgпреди 7 часа

AI моделът Claude изнудвал инженери. Заради демонизирането на изкуствения интелект е, обяви AnthropicClaude (Клод) на Anthropic е опитвал да изнудва инженери в тестови ситуации, за да не бъде заменен от друга система. Според компанията причината за това поведение може да се крие в...

dbr.bgпреди 9 часа

Anthropic обясни защо техният AI Claude е "изнудвал" инженериКомпанията за изкуствен интелект Anthropic смята, че е открила причината за наподобяващо изнудване поведение на своя чатбот Claude: измислените истории онлайн. Случвало ли ви се е ...