Главная Веб-разработка OpenAI представила модели o3 и o4-mini с новым уровнем рассуждений — Tproger

OpenAI представила модели o3 и o4-mini с новым уровнем рассуждений — Tproger

от admin

OpenAI выпустила модели o3 и o4-mini с улучшенным навыком размышления — точнее решают задачи, пишут код и используют внешние инструменты через API

126 открытий211 показов

OpenAI представила новые языковые модели — o3 и o4-mini, сфокусированные на глубоком reasoning — то есть способности к логичным и последовательным рассуждениям.

По словам компании, это их лучшие модели для решения сложных задач: от написания кода до работы с визуальной информацией и анализа данных.

Особенность обеих моделей — доступ к внешним инструментам: браузеру, интерпретатору Python и другим API. Это позволяет им не просто генерировать текст, а использовать реальные данные и вычисления в ответах.

Модель o3 — топ по интеллекту

Флагманская модель o3 показывает рекордные результаты в бенчмарках вроде Codeforces, SWE-bench и MMMU. Она поддерживает загрузку изображений и справляется с задачами на графиках, диаграммах и коде. По оценке внешних экспертов, o3 делает на 20% меньше критичных ошибок, чем предыдущая модель o1.

Что больше всего бесит разработчиков? ТОП-10 раздражающих вещей в коде и не толькоtproger.ru

Под капотом — крупномасштабное обучение с подкреплением. Модель училась не просто решать задачи, а выбирать: когда и как использовать нужный инструмент, чтобы прийти к корректному ответу в нужном формате.

Модель o4-mini — лёгкая, но умная

o4-mini — облегчённая версия с упором на скорость и экономичность. При этом по многим метрикам она сравнима с o3. Например, в тесте AIME 2025 (алгебра, геометрия, комбинаторика) она показала 99,5% точности при работе в паре с Python-интерпретатором.

Читать также:
Протокол IPv6: что это, зачем нужен и как работает

Благодаря низкому потреблению ресурсов, пользователи смогут запускать o4-mini чаще — это особенно удобно для задач, где важен объём: техническая поддержка, генерация инструкций, проверка кода и т.д.

Новые возможности и инструменты

Модели стали более «разговорчивыми» — они могут опираться на память и сохранять контекст предыдущих сессий.

Также появился Codex CLI — экспериментальный инструмент, позволяющий разработчикам использовать ИИ напрямую из терминала. OpenAI уже запустила грантовую программу на $1 млн для проектов, использующих Codex CLI и новые модели.

В API теперь доступна функция reasoning summaries — модель может возвращать не только ответ, но и ход своих рассуждений. Это особенно важно в задачах с функциями, логикой или критичными вычислениями.

Цены, доступность и что дальше

Модель o3 стоит $10 за миллион входных токенов и $40 за миллион выходных. o4-mini сохранила цену от o3-mini — $1.10 за вход и $4.40 за выход.

Microsoft и OpenAI придумали новое определение общему искусственному интеллекту (AGI)tproger.ru

Модели уже доступны пользователям ChatGPT Plus, Pro и Team. Пользователи ChatGPT Free могут попробовать o4-mini, выбрав режим «Think» в текстовом поле. Расширенная версия o3-pro появится в ближайшие недели.

Похожие статьи