Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Отвечала на математике, внезапно извинилась и упала. В польской Лодзи умерла беларусская студентка
  2. Новый министр информации Дмитрий Жук рассказал, когда могут заблокировать YouTube в Беларуси
  3. Более 800 профессий убрали из списков на досрочную пенсию в Беларуси
  4. В деревне под Минском продали дом за рекордные 2,4 млн долларов
  5. Появилось очередное пенсионное новшество — оно вряд ли порадует людей. Чиновники рассказали подробности
  6. Кочанова придумала, за что еще можно наказывать беларусов
  7. Мошенники начали рассылать опасные «пасхальные открытки». Вот как это работает
  8. «Задерживают всех, кого вчера не было». Силовики опять пришли в офис ZROBIM architects
  9. Мобильные операторы вводят изменения — один из них запустил новую услугу. Ее могут оценить те, кто хочет получить «чистый» номер телефона
  10. В список «экстремистских» материалов добавили аккаунт известного беларусского путешественника, объехавшего весь мир
  11. На рынке труда в Минске наблюдаются перемены. Каких работников они затрагивают
  12. В минский офис известной архитектурной студии ZROBIM architects пришли силовики. Задержаны около 50 сотрудников


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.