Поддержать команду Зеркала
Беларусы на войне
  1. Налоговая грозит беларусам финансовыми санкциями. Кто может получить такие проблемы
  2. Провластный лейбл нашел новое лицо для популярного проекта. Эта девочка еще даже не окончила школу
  3. В одной из стран ЕС предлагают ввести новые ограничения для беларусов
  4. В январе рухнули средние зарплаты — масштаб их падения способен поразить (счет идет на сотни рублей)
  5. Многим не было и 30 лет. В четвертую годовщину войны вспоминаем беларусов, которые отдали жизнь за Украину
  6. Аналитики назвали населенные пункты, которые ВСУ освободили во время февральского наступления на юге — ISW
  7. В Минске работали call-центры мошенников. В их офисы нагрянули силовики, задержаны 55 человек
  8. «Это второй день рождения». Мальчику из Гродно Ване Стеценко в дубайской клинике ввели один из самых дорогих препаратов в мире
  9. ЕРИП ввел очередное новшество
  10. Пособие на погребение резко сократится. С чем это связано
  11. У уехавших за границу из-за политики продолжают отнимать земельные участки. Появился свежий пример
  12. «Когда узнали, что к чему, были в шоке». Минская риелторка чудом спасла девушку от потери квартиры


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.