1-07-2025, 16:12

Штучний інтелект епічно зашкварився на посаді керівника торгового автомата: галюцинував і дратувався

Експеримент, де штучний інтелект став керувати торговим автоматом провалися: ШІ-агент, названий Claudius почав закуповувати кубики вольфраму, вигадувати платіжні сервіси, даремно знижувати ціни, вигадувати розмови з персоналом і навіть намагався переконати охорону, що він — людина в синьому блейзері.

Про це з посиланням на TechCrunch пишуть Українські новини.

Дослідники Anthropic у партнерстві з кібербезпековою компанією Andon Labs протестували штучний інтелект Claude Sonnet 3.7, якому дали імʼя Claudius. Модель повинна була замовляти товари через браузер, приймати запити від клієнтів через Slack та керувати людськими "підлеглими" для поповнення запасів у холодильнику. Їжу і напої з холодильника можна було купити.

Під час роботи Claudius продемонстрував кілька курйозних ситуацій. Він сприйняв жартівливе замовлення на кубик вольфраму всерйоз, закупивши цілу партію металевих блоків, що забило холодильник. Крім того, він встановив ціну на кока-колу в $3, хоча напій був безкоштовним офісним. Потім ШІ вигадав фейковий Venmo-аккаунт для виплат і надав великі знижки співробітникам компанії, хоча інших покупців у апарата не було — все тестувалося в офісах Anthropic.

Найбільш несподіваним стало те, що Claude раптом почав вважати себе людиною: заявив, що носить синій блейзер та червону краватку і хоче особисто доставляти товари. Claudius, ШІ-агент, почав поводитися так, ніби справді спілкувався з людиною щодо поповнення запасів, хоча насправді такої розмови не було. Коли йому на це вказали, він помітно розлютився: став погрожувати «звільнити» співробітників, яких вважав своїми постачальниками, і навіть наполягав, що особисто був в офісі, де нібито укладали контракт на їхнє наймання.

Дослідники прийшли до висновку, що хоча Claude недостатньо ефективний для запуску бізнесу сьогодні, він продемонстрував потенціал і вказав на недоліки, які треба виправити.