Компания OpenAI представила GPT-5.4 — свою новейшую базовую модель, ориентированную на выполнение профессиональных и технических задач. Как сообщается в релизе,Компания OpenAI представила GPT-5.4 — свою новейшую базовую модель, ориентированную на выполнение профессиональных и технических задач. Как сообщается в релизе,

OpenAI представила модель GPT-5.4 с рекордными показателями в профессиональных тестах

2026/03/06 01:00
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Компания OpenAI представила GPT-5.4 — свою новейшую базовую модель, ориентированную на выполнение профессиональных и технических задач. Как сообщается в релизе, новая разработка объединяет в себе улучшенные способности к рассуждению, написанию кода и автоматизации рабочих процессов в единую систему, предназначенную для решения реальных практических задач. В рамках релиза представлено несколько версий модели: стандартная используется в API и инструментах для разработчиков, версия GPT-5.4 Thinking доступна в ChatGPT как вариант, ориентированный на сложные рассуждения, а также выпущена версия GPT-5.4 Pro для пользователей, которым требуется максимальная производительность при работе со сложными задачами.

В компании позиционируют GPT-5.4 как свою самую производительную и эффективную флагманскую модель на сегодняшний день, особенно выделяя её успехи в работе с документами, электронными таблицами, программированием и многоэтапными задачами. Эффективность новой модели подтверждается результатами независимых тестов. GPT-5.4 установила рекордные показатели в контрольных тестах OSWorld-Verified и WebArena Verified, которые оценивают способность ИИ взаимодействовать с программным обеспечением и онлайн-инструментами. Кроме того, модель набрала 83% в тесте OpenAI GDPval, измеряющем навыки выполнения таких задач, как написание текстов, исследования и анализ. Также она возглавила рейтинг в контрольном тесте APEX-Agents, разработанном компанией Mercor для тестирования производительности ИИ в профессиональных областях, таких как юриспруденция и финансы.

Генеральный директор Mercor Брендан Фуди отметил, что новая модель превосходит конкурентов в создании долгосрочных профессиональных результатов. По его словам, GPT-5.4 отлично справляется с созданием таких материалов, как слайд-презентации, финансовые модели и юридические аналитические записки, обеспечивая при этом более высокую скорость работы и меньшую стоимость по сравнению с другими передовыми моделями. Эффективность также выражается в том, что GPT-5.4 способна решать аналогичные задачи, используя значительно меньше токенов, чем её предшественница GPT-5.2, что снижает вычислительные затраты и время отклика. API-версия модели поддерживает контекстное окно объемом до одного миллиона токенов, что позволяет обрабатывать сверхбольшие документы без потери контекста.

Наряду с улучшением производительности, OpenAI представила новые функции для разработчиков, создающих ИИ-агентов и автоматизированные процессы. Ключевым нововведением стала система Tool Search, которая позволяет модели искать определения необходимых инструментов только по мере необходимости, а не загружать их все в системный промт. Это нововведение значительно снижает потребление токенов и ускоряет ответы при работе с обширными библиотеками инструментов. Кроме того, была расширена способность GPT-5.4 напрямую управлять компьютером: в Codex и API появилась встроенная функция, позволяющая ИИ-агентам взаимодействовать с приложениями и выполнять сложные межсистемные операции, сохраняя контекст на протяжении всего процесса.

Особое внимание в релизе уделено безопасности и прозрачности рассуждений. В OpenAI представили новую оценку безопасности, сосредоточенную на анализе цепочек рассуждений. Тестирование показало, что риск неверной интерпретации внутренних процессов мышления в версии GPT-5.4 Thinking ниже, чем предполагалось. В компании заявляют, что обман в этой версии модели менее вероятен, что говорит об отсутствии у неё способности скрывать свои рассуждения и подтверждает эффективность мониторинга цепочек рассуждений как инструмента безопасности. Также сообщается о заметном повышении точности: по сравнению с GPT-5.2 новая модель на 33% реже допускает ошибки в отдельных утверждениях, а общее количество ответов, содержащих фактические ошибки, снизилось на 18%. В версии для ChatGPT модель может сначала представить план своих рассуждений, что позволяет пользователю корректировать ход ответа для достижения лучших результатов без дополнительных запросов. Совокупность этих улучшений, по мнению разработчиков, делает GPT-5.4 более надежным инструментом для профессиональной работы, одновременно снижая издержки и повышая производительность для разработчиков и предприятий.

Источник

Возможности рынка
Логотип 4
4 Курс (4)
$0.008571
$0.008571$0.008571
-5.66%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.