Поддержать команду Зеркала
Беларусы на войне
  1. «Когда узнали, что к чему, были в шоке». Минская риелторка чудом спасла девушку от потери квартиры
  2. В одной из стран ЕС предлагают ввести новые ограничения для беларусов
  3. Пятый год полномасштабного вторжения: каких целей, заявленных Путиным в качестве первопричин войны, удалось достичь России
  4. «Месть — удел слабых». Виктор Бабарико дал большое интервью «Зеркалу»
  5. Многим не было и 30 лет. В четвертую годовщину войны вспоминаем беларусов, которые отдали жизнь за Украину
  6. Прожил 25 лет, но стал классиком, написав гимн «Пагоня» в горячке, почти перед смертью. Объясняем, в чем величие Максима Богдановича
  7. «Это второй день рождения». Мальчику из Гродно Ване Стеценко в дубайской клинике ввели один из самых дорогих препаратов в мире
  8. Чиновники рассказали еще об одном изменении для налога, который спасал некоторых от «тунеядства»
  9. В январе рухнули средние зарплаты — масштаб их падения способен поразить (счет идет на сотни рублей)
  10. Огласили приговор беларуске, которую задержали на выходе из онкодиспансера
  11. Провластный лейбл нашел новое лицо для популярного проекта. Эта девочка еще даже не окончила школу
  12. В Минске работали call-центры мошенников. В их офисы нагрянули силовики, задержаны 55 человек
  13. У уехавших за границу из-за политики продолжают отнимать земельные участки. Появился свежий пример
  14. Пособие на погребение резко сократится. С чем это связано


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.