Логотип OpenAI. Джерело: NurPhoto
Генеральний директор OpenAI Сем Альтман (Sam Altman) в останній день заходу "12 днів OpenAI" анонсував нові моделі штучного інтелекту o3 і o3-mini, що базуються на попередніх моделях o1. Ці моделі використовують метод "приватного ланцюжка думок", що дає їм змогу планувати свої відповіді заздалегідь, що називається симульованим міркуванням (SR).
Що відомо
Модель o3 досягла рекордних результатів у бенчмарку ARC-AGI, набравши 75,7% в умовах низьких обчислювальних ресурсів і 87,5% в умовах високих обчислювальних ресурсів, що можна порівняти з людською продуктивністю. Також модель o3 набрала 96,7% на Американському запрошувальному іспиті з математики 2024 року і 87,7% на тесті GPQA Diamond, який містить питання з біології, фізики та хімії на рівні магістратури. У бенчмарку Frontier Math від EpochAI o3 вирішила 25,2 відсотка завдань, у той час як жодна інша модель не перевищила 2%.
Модель o3-mini включає функцію адаптивного часу мислення, пропонуючи низьку, середню і високу швидкість обробки. OpenAI заявляє, що більш високі налаштування обчислень дають кращі результати. Ці моделі будуть доступні для тестування дослідниками безпеки. Запуск o3-mini планують на кінець січня, а o3 – незабаром після цього.
Джерело: OpenAI