Qwen опубликовал Qwen3.6 - open-weight серию моделей от Alibaba. В репозитории выделены две свежие версии: Qwen3.6-35B-A3B от 16 апреля 2026 и Qwen3.6-27B от 22 апреля 2026.
Зачем тебе
Если нужен запасной coding model без западного API, Qwen3.6 стоит добавить в тесты. Для первого прогона логичнее брать 27B, а 35B-A3B смотреть там, где нужны сложнее правки по репозиторию и агентские задачи.
Если ты не разработчик: это показатель, что китайские open-weight модели все сильнее закрывают практический кодинг, а не только чат и бенчмарки.
Что произошло
Qwen3.6 делает упор на два пункта.
- Agentic Coding: модель лучше работает с frontend-сценариями и рассуждением на уровне репозитория.
- Thinking Preservation: новый режим сохраняет reasoning-контекст из истории, чтобы итеративная работа не начиналась заново на каждом шаге.
Модели опубликованы на Hugging Face Hub и ModelScope. В репозитории также описан локальный запуск через transformers serve, llama.cpp, MLX, SGLang и vLLM.
Почему важно
Для команд в России Qwen интересен по двум причинам. Во-первых, это open-weight линейка: модель можно пробовать локально или в своей инфраструктуре. Во-вторых, есть ModelScope - китайская альтернатива Hugging Face для загрузки моделей, когда доступ к западным сервисам нестабилен.
Практический смысл не в том, что Qwen “лучше всех”. Смысл в запасном контуре: если coding assistant нужен каждый день, нельзя зависеть от одного провайдера и одного API.
Кому полезно
- разработчикам, которые хотят локальный или резервный coding model;
- командам, сравнивающим Qwen, DeepSeek, OpenAI и Anthropic на своих репозиториях;
- фаундерам, которым важны цена, доступность и контроль данных;
- инженерам, запускающим модели через vLLM, SGLang, llama.cpp или MLX.
Что проверить
- тянет ли ваше железо 27B или 35B-A3B;
- как модель правит ваш реальный репозиторий, а не игрушечные задачи;
- держит ли reasoning-контекст в длинной итерации;
- можно ли скачать веса через ModelScope, если Hugging Face недоступен.
Ограничения
Open-weight не значит “бесплатно и просто”. Нужны железо, память, настройка сервинга и собственные тесты качества. Для русскоязычных задач обязательно проверяй на своих промптах, документах и кодовой базе.
Первоисточник
QwenLM на GitHub: Qwen3.6.