28 квітня 2025 року китайський технологічний гігант Alibaba анонсував випуск нової серії моделей штучного інтелекту – Qwen3. Ця лінійка великих мовних моделей (LLM) включає 8 моделей різного розміру – від компактних з 0.6 мільярда параметрів до потужного флагмана Qwen3-235B-A22B з 235 мільярдами параметрів. Головною особливістю нової серії стала інноваційна гібридна здатність до “міркування”, яка дозволяє моделям адаптуватися до завдань різної складності, забезпечуючи баланс між швидкістю та глибиною аналізу.
Що таке Qwen3 і чому це важливо?
Qwen3 – це еволюція попередньої серії Qwen2.5 від Alibaba, яка вже здобула визнання у світі штучного інтелекту. Нова серія включає два типи моделей: щільні (dense) та моделі з “мікстурою експертів” (MoE). Наприклад, флагманська модель Qwen3-235B-A22B має 235 мільярдів параметрів, з яких 22 мільярди активно використовуються під час роботи. Менша MoE-модель, Qwen3-30B-A3B, з 30 мільярдами параметрів і 3 мільярдами активних, демонструє вражаючу ефективність, перевершуючи попередні моделі, такі як QwQ-32B, у 10 разів за кількістю активованих параметрів.
Однією з ключових інновацій Qwen3 є гібридний підхід до “міркування”. Моделі можуть працювати у двох режимах:
– “Міркування” (thinking mode) – для складних завдань, що потребують глибокого аналізу, наприклад, розв’язання математичних задач чи написання коду;
– “Без міркування” (non-thinking mode) – для швидких відповідей на прості запити.
Ця гнучкість дозволяє користувачам налаштовувати моделі залежно від потреб, оптимізуючи витрати обчислювальних ресурсів без втрати якості.
Вражаючі результати тестування
Alibaba оприлюднила результати бенчмарків, які демонструють переваги Qwen3 над конкурентами, такими як DeepSeek-R1, OpenAI o1, o3-mini, Grok-3 від xAI та Gemini-2.5-Pro від Google. Зокрема, флагман Qwen3-235B-A22B показав такі результати:
– ArenaHard: 95.6% (DeepSeek-R1 – 93.2%, OpenAI o1 – 92.1%);
– AIME’24 (математика): 85.7% (Grok 3 Beta – 83.9%, OpenAI o1 – 74.3%);
– Codeforces (кодування): рейтинг 2056 (Gemini-2.5-Pro – 2001, DeepSeek-R1 – 2029);
– LiveBench: 77.1% (Gemini-2.5-Pro – 82.4%, OpenAI o1 – 75.7%).

Менші моделі, такі як Qwen3-32B та Qwen3-4B, також показали вражаючі результати. Наприклад, Qwen3-4B за продуктивністю наближається до Qwen2.5-72B-Instruct, що робить її ідеальним вибором для користувачів з обмеженими обчислювальними ресурсами.
Підтримка 119 мов та нові можливості
Qwen3 підтримує 119 мов і діалектів, що відкриває широкі перспективи для міжнародних застосувань. Від англійської та китайської до рідкісних мов, таких як суахілі чи кхмерська, модель забезпечує точну обробку тексту та переклад. Це робить її ідеальним інструментом для глобальних компаній, які прагнуть автоматизувати клієнтську підтримку чи контент-маркетинг.
Окрім цього, Qwen3 отримала значні покращення у сфері кодування та агентських можливостей. Модель оптимізована для роботи з інструментами (tool-calling), що дозволяє їй ефективно взаємодіяти із зовнішніми системами. Наприклад, вона може автоматично отримувати дані з GitHub і створювати графіки, як показано у демонстраційних прикладах від Alibaba.
Відкритий доступ та інструменти для розробників
Однією з найбільших переваг Qwen3 є її відкрита вага (open-weight) під ліцензією Apache 2.0, що дозволяє розробникам безкоштовно використовувати моделі для комерційних і дослідницьких цілей. Моделі доступні на популярних платформах, таких як Hugging Face, GitHub, ModelScope та Kaggle.
Для розгортання Qwen3 Alibaba рекомендує використовувати фреймворки SGLang і vLLM, які сумісні з API OpenAI. Для локального використання підходять інструменти, такі як Ollama, LMStudio, MLX, llama.cpp та KTransformers. Це дозволяє легко інтегрувати моделі у різні робочі процеси – від досліджень до промислових застосувань.
Вплив на ринок штучного інтелекту
Запуск Qwen3 є важливим кроком для китайського AI-сектору, який дедалі більше конкурує з американськими лідерами, такими як OpenAI та Google. Гібридний підхід до міркування, висока продуктивність і відкритий доступ роблять Qwen3 привабливим вибором для розробників і компаній, які шукають потужні, але доступні рішення.
Експерти вважають, що Qwen3 може змінити правила гри у сфері штучного інтелекту, адже вона не лише пропонує передові технології, а й знижує бар’єри для їх використання. Це може прискорити розвиток AI-додатків у різних галузях – від освіти до програмування.
Джерело: Alibaba на платформі X: Alibaba Qwen.