Qwen3.6 вышел как open-weight модель для кодинга и агентов

Qwen3.6 делает упор на агентский кодинг, сохранение reasoning-контекста и локальный запуск через Hugging Face, ModelScope, llama.cpp, MLX, SGLang и vLLM.

Qwen опубликовал Qwen3.6 - open-weight серию моделей от Alibaba. В репозитории выделены две свежие версии: Qwen3.6-35B-A3B от 16 апреля 2026 и Qwen3.6-27B от 22 апреля 2026.

Зачем тебе

Если нужен запасной coding model без западного API, Qwen3.6 стоит добавить в тесты. Для первого прогона логичнее брать 27B, а 35B-A3B смотреть там, где нужны сложнее правки по репозиторию и агентские задачи.

Если ты не разработчик: это показатель, что китайские open-weight модели все сильнее закрывают практический кодинг, а не только чат и бенчмарки.

Что произошло

Qwen3.6 делает упор на два пункта.

Agentic Coding: модель лучше работает с frontend-сценариями и рассуждением на уровне репозитория.
Thinking Preservation: новый режим сохраняет reasoning-контекст из истории, чтобы итеративная работа не начиналась заново на каждом шаге.

Модели опубликованы на Hugging Face Hub и ModelScope. В репозитории также описан локальный запуск через transformers serve, llama.cpp, MLX, SGLang и vLLM.

Почему важно

Для команд в России Qwen интересен по двум причинам. Во-первых, это open-weight линейка: модель можно пробовать локально или в своей инфраструктуре. Во-вторых, есть ModelScope - китайская альтернатива Hugging Face для загрузки моделей, когда доступ к западным сервисам нестабилен.

Практический смысл не в том, что Qwen “лучше всех”. Смысл в запасном контуре: если coding assistant нужен каждый день, нельзя зависеть от одного провайдера и одного API.

Кому полезно

разработчикам, которые хотят локальный или резервный coding model;
командам, сравнивающим Qwen, DeepSeek, OpenAI и Anthropic на своих репозиториях;
фаундерам, которым важны цена, доступность и контроль данных;
инженерам, запускающим модели через vLLM, SGLang, llama.cpp или MLX.

Что проверить

тянет ли ваше железо 27B или 35B-A3B;
как модель правит ваш реальный репозиторий, а не игрушечные задачи;
держит ли reasoning-контекст в длинной итерации;
можно ли скачать веса через ModelScope, если Hugging Face недоступен.

Ограничения

Open-weight не значит “бесплатно и просто”. Нужны железо, память, настройка сервинга и собственные тесты качества. Для русскоязычных задач обязательно проверяй на своих промптах, документах и кодовой базе.

Первоисточник

QwenLM на GitHub: Qwen3.6.