Середа, 23 Липня, 2025
spot_img
More

    Цікаве

    Alibaba представила Qwen3-Coder з підтримкою ШІ-агентів, здатних самостійно ухвалювати рішення

    Alibaba представила Qwen3-Coder з підтримкою ШІ-агентів, здатних самостійно ухвалювати рішення Ілюстративне зображення. Джерело: DALL-E

    Команда Qwen офіційно представила Qwen3-Coder — свій найпотужніший на сьогодні кодогенератор із підтримкою «агентного» підходу. Головна зірка лінійки — Qwen3-Coder-480B-A35B-Instruct. Це гібридна модель Mixture-of-Experts із 480 мільярдами параметрів (35 млрд активних одночасно), яка вміє працювати з контекстом до 256 000 токенів нативно та до 1 млн токенів з екстраполяцією. У тестах вона демонструє рекордні результати серед відкритих моделей у завданнях Agentic Coding, Agentic Browser-Use та Agentic Tool-Use — на рівні Claude Sonnet 4.

    Що таке «агентне» кодування

    Qwen3-Coder створювався не тільки для генерації коду, а й для повноцінної роботи як «агент», який може планувати, використовувати інструменти, отримувати зворотний зв’язок і ухвалювати рішення. У реальних завданнях (наприклад, SWE-Bench) він взаємодіє з середовищем у кілька кроків, що вимагає складного навчання з довгим горизонтом (Long-Horizon RL). Для цього команда Qwen підняла масштабовану систему з 20 000 паралельних середовищ на базі Alibaba Cloud.

    Можливості Qwen3-Coder

    • Навчений на 7.5 трильйонах токенів, де 70% складає код
    • Підтримка гігантського контексту до 1 млн токенів (з YaRN)
    • Використання reinforcement learning (Code RL) на реальних задачах для підвищення успішності виконання коду
    • Інтеграція з інструментами розробників — Qwen Code (CLI), Claude Code та навіть OpenAI SDK
    • Можливість роботи як через API, так і в локальному середовищі

    Інструменти та API

    Разом із моделлю доступний CLI-інструмент Qwen Code, створений на основі Gemini Code. Він дозволяє легко використовувати Qwen3-Coder у власних проєктах, з підтримкою кастомних промптів і функцій. Також передбачено роботу через Claude Code та прямий API-доступ через Alibaba Cloud Model Studio.

    Навіщо все це

    Qwen3-Coder позиціонується як універсальний агент для кодування — від генерації вебсайтів до складних багатокрокових завдань у розробці. Команда Qwen планує випустити більше розмірів моделей, щоб знизити витрати на розгортання, та досліджує можливості для «самоудосконалення» агентів.

    Про Qwen

    Qwen — це серія великих мовних моделей та агентних рішень команди Alibaba (Qwen Team), створена для генерації тексту, коду, аналізу даних та багатокрокових сценаріїв з використанням інструментів. Остання версія, Qwen3-Coder, побудована за архітектурою Mixture-of-Experts з 480 млрд параметрів (35 млрд активних), підтримує до 256 000 токенів контексту нативно та до 1 млн із екстраполяцією, і демонструє результати на рівні закритих моделей як Claude Sonnet 4 у завданнях SWE-Bench, Agentic Coding, Browser-Use та Tool-Use. Модель інтегрується з OpenAI SDK, CLI-інструментами (Qwen Code, Claude Code), API Alibaba Cloud та підтримує екосистеми GitHub і Hugging Face, використовуючи reinforcement learning на реальних кодових завданнях для підвищення точності та ефективності.

    Джерело: qwenlm.github.io/blog/qwen3-coder/

    Latest Posts

    Останні новини

    Stay in touch

    To be updated with all the latest news, offers and special announcements.