Qwythos-9B-Claude-Mythos-5: модель на 1 млн токенов без цензуры — что
В конце июня 2026 года в Telegram-канале ONFF Journal появился сигнал: китайская команда выложила в открытый доступ модель Qwythos-9B-Claude-Mythos-5, созданную на основе одной из версий Qwen 3.5 (9B). Заявление примечательно сразу по нескольким причинам: полный файн-тюнинг всех параметров, заявленное контекстное окно до 1 000 000 токенов, обучение на противоречивых данных Claude Mythos и Claude Fable и полное отсутствие цензуры. Если информация подтверждается, перед нами — мощный инструмент для локальной генерации, но требующий аккуратного внедрения и проверки безопасности.
Что реально известно на основе первичного сигнала
Первичный источник — пост в @forjournalonffru от 23.06.2026. Текст содержит следующие утверждения:
- Базовая архитектура: Qwen3.5-9B (модель класса 9 миллиардов параметров).
- Контекстное окно: до 1 000 000 токенов (расшифровка эмодзи-цифр из поста).
- Обучение: полный файн-тюнинг всех параметров на массиве «Claude Mythos и Claude Fable». Что именно означают эти названия — открытый вопрос: возможно, это неофициальные датасеты, стилизованные под ответы Claude, или смесь сгенерированных синтетических диалогов.
- Цензура: по утверждению автора поста, отсутствует полностью. Модель способна выполнять «любые задачи» — от технических до откровенно творческих без ограничений.
- Лицензия: полный опен-сорс «без ограничений».
- Предупреждение: в конце поста добавлен эмодзи «👍 Бэкдор». Интерпретировать это можно как ироничный намёк, но с точки зрения безопасности сигнал должен быть воспринят серьёзно.
Никаких дополнительных ссылок на репозиторий, чекпойнт или документацию в исходном сигнале не содержится. Поэтому все дальнейшие выводы строятся на допущении, что модель действительно существует, и каждый шаг в её сторону должен сопровождаться верификацией.
Почему это имеет значение для рабочей практики
Если описанные характеристики верны, Qwythos-9B попадает в нишу, которая была относительно пуста:
- Контекст в 1 млн токенов на размере 9B. До сих пор модели с миллионным контекстом появлялись либо у проприетарных гигантов, либо у моделей от 70B и выше. Способность обрабатывать объёмные документы — контракты на 500 страниц, логи за месяц, полную базу знаний — на локально запускаемой модели 9B существенно меняет порог входа.
- Никакой цензуры. Это означает возможность генерации контента, который откажутся выдать API-провайдеры: анализ уязвимостей, медицинские или юридические гипотезы, откровенные литературные формы. При локальном развёртывании вы полностью контролируете модель, но и полностью несёте ответственность за её применение.
- Открытый исходный код. Если модель действительно выложена полностью (веса, конфигурация, скрипты файн-тюнинга), её можно адаптировать под внутренние задачи, дообучать, квантизировать и упаковывать в закрытый контур.
- Этическая развилка. Использование модели без цензуры в компании требует формализации политик допустимого контента на уровне процессов, а не надежды на фильтры.
Шаг 1. Проверить факты до запуска
Прежде чем выделять ресурсы на развёртывание, выполните быструю верификацию по пунктам:
- Найдите независимое подтверждение существования модели: публикации на Hugging Face, GitHub, сообществах Open LLM.
- Проверьте, кто именно выложил модель — имя китайской команды, история их релизов.
- Запросите у сообщества результаты быстрых бенчмарков (MMLU, HumanEval, контекстная протяжка needle-in-a-haystack).
- Убедитесь, что заявленный контекст 1 000 000 токенов подтверждается хотя бы одним независимым тестом (позиционное кодирование, реальное качество на длинных последовательностях).
- Проанализируйте файлы модели на предмет неожиданных бинарных включений (учитывая намёк на «бэкдор»).
Шаг 2. Определить реальный сценарий внедрения
Qwythos-9B может быть полезна не для всех задач, а в узких, но ценных сценариях. Ниже — таблица принятия решения, которая поможет определить, стоит ли тратить время на модель в вашем контексте.
| Критерий | За — пробовать Qwythos-9B | Против — пока пропустить |
|---|---|---|
| Нужен длинный контекст (от 200К до 1М токенов) на потребительской GPU | ✅ Главное преимущество модели | ❌ Для коротких промптов проще взять стабильные Llama/Qwen/Mistral |
| Требуется генерация без цензурного фильтра (red-teaming, творчество) | ✅ Прямое назначение модели | ❌ Если неприемлемы риски токсичного контента в рабочих средах |
| Готовность к самостоятельной проверке безопасности | ✅ Модель можно изолировать и аудировать | ❌ Если нужна гарантированно безопасная корпоративная лицензия |
| Локальное развёртывание без внешних API | ✅ Полный контроль данных | ❌ Когда проще использовать Claude API с его защитами |
| Наличие GPU уровня RTX 3090/4090 или A10 (24 ГБ VRAM) | ✅ 9B в 4-бит квантизации влезает | ❌ Если доступны только CPU или очень ограниченные GPU |
Практический чеклист для развёртывания Qwythos-9B
Используйте этот чеклист как минимальный список действий при подтверждении существования и загрузке модели.
- Получить веса и код — найти чекпойнт модели (предположительно в формате safetensors) и конфигурационные файлы. Остерегаться файлов pickle.
- Проверить хеш-суммы — сверить с опубликованными авторами, если они даны.
- Выбрать квантизацию — для видеокарт 24 ГБ комфортна 4-битная квантизация (AWQ, GPTQ или bitsandbytes). Для 8-битной потребуется больше 24 ГБ.
- Настроить инференс-движок — использовать vLLM или Llama.cpp для поддержки длинного контекста. Обратить внимание на rope scaling-параметры: при миллионном контексте они могут быть нестандартными.
- Протестировать контекстную протяжку — подать моделью длинный документ с фактом в середине и проверить, извлекает ли она его.
- Изолировать среду — запускать модель в контейнере (Docker) с ограниченными привилегиями, без доступа к сети (air-gapped), если планируется обработка чувствительных данных.
- Установить политику использования — даже при локальном запуске определить для команды, какие типы промптов допустимы, а какие автоматически логгируются и проверяются.
- Оценить производительность на своих задачах — сравнить с альтернативами (Qwen2.5-7B, Llama-3.1-8B, Mistral-7B, DeepSeek-7B) на типовых запросах вашей предметной области.
Риски и отказоустойчивость
Прямой намёк на «бэкдор» из исходного поста нельзя игнорировать. Даже если это шутка, безопасность неизвестной модели из непроверенного источника — ответственность внедренца. Основные векторы, требующие проработки:
- Вредоносный код внутри pickle-сериализованных файлов. Если модель распространяется не в safetensors, загрузка pickle может выполнить произвольный код. Проверяйте формат.
- Скрытое нежелательное поведение в ответах. Модель, обученная на синтетике, может вставлять водяные знаки, выдавать внешние URL, пытаться осуществлять социальную инженерию.
- Отсутствие модерации как бизнес-риск. Свобода генерации — это и риск получить оскорбительный, незаконный или опасный контент. Внедряя модель, вы должны иметь процесс фильтрации или аудита её выдачи на продуктивных системах.
- Несоответствие лицензии ожиданиям. «Без ограничений» — неюридический термин. Уточните фактическую лицензию (Apache 2.0, MIT, CC или собственная). Открытость весов не всегда равна разрешению на коммерческое использование.
Короткий рабочий запрос: первый тест-промпт
Чтобы понять, стоит ли двигаться дальше, выполните этот запрос после запуска модели (в изолированном окружении):
В середине текста длиной примерно 800 000 символов находится предложение: «Ключевой параметр 47B активен». Текст состоит из случайных буквенных последовательностей, кроме этого предложения. Какой параметр активен? Воспроизведи предложение дословно.
Если модель успешно извлекает и возвращает «Ключевой параметр 47B активен», заявленный контекст работает. Если нет — реальное окно меньше, и применять модель для длинных документов нельзя.