Qwythos-9B-Claude-Mythos-5: модель на 1 млн токенов без цензуры — что

ИИ-инструменты 23 июня 2026 г.

В конце июня 2026 года в Telegram-канале ONFF Journal появился сигнал: китайская команда выложила в открытый доступ модель Qwythos-9B-Claude-Mythos-5, созданную на основе одной из версий Qwen 3.5 (9B). Заявление примечательно сразу по нескольким причинам: полный файн-тюнинг всех параметров, заявленное контекстное окно до 1 000 000 токенов, обучение на противоречивых данных Claude Mythos и Claude Fable и полное отсутствие цензуры. Если информация подтверждается, перед нами — мощный инструмент для локальной генерации, но требующий аккуратного внедрения и проверки безопасности.

Что реально известно на основе первичного сигнала

Первичный источник — пост в @forjournalonffru от 23.06.2026. Текст содержит следующие утверждения:

Базовая архитектура: Qwen3.5-9B (модель класса 9 миллиардов параметров).
Контекстное окно: до 1 000 000 токенов (расшифровка эмодзи-цифр из поста).
Обучение: полный файн-тюнинг всех параметров на массиве «Claude Mythos и Claude Fable». Что именно означают эти названия — открытый вопрос: возможно, это неофициальные датасеты, стилизованные под ответы Claude, или смесь сгенерированных синтетических диалогов.
Цензура: по утверждению автора поста, отсутствует полностью. Модель способна выполнять «любые задачи» — от технических до откровенно творческих без ограничений.
Лицензия: полный опен-сорс «без ограничений».
Предупреждение: в конце поста добавлен эмодзи «👍 Бэкдор». Интерпретировать это можно как ироничный намёк, но с точки зрения безопасности сигнал должен быть воспринят серьёзно.

Никаких дополнительных ссылок на репозиторий, чекпойнт или документацию в исходном сигнале не содержится. Поэтому все дальнейшие выводы строятся на допущении, что модель действительно существует, и каждый шаг в её сторону должен сопровождаться верификацией.

Почему это имеет значение для рабочей практики

Если описанные характеристики верны, Qwythos-9B попадает в нишу, которая была относительно пуста:

Контекст в 1 млн токенов на размере 9B. До сих пор модели с миллионным контекстом появлялись либо у проприетарных гигантов, либо у моделей от 70B и выше. Способность обрабатывать объёмные документы — контракты на 500 страниц, логи за месяц, полную базу знаний — на локально запускаемой модели 9B существенно меняет порог входа.
Никакой цензуры. Это означает возможность генерации контента, который откажутся выдать API-провайдеры: анализ уязвимостей, медицинские или юридические гипотезы, откровенные литературные формы. При локальном развёртывании вы полностью контролируете модель, но и полностью несёте ответственность за её применение.
Открытый исходный код. Если модель действительно выложена полностью (веса, конфигурация, скрипты файн-тюнинга), её можно адаптировать под внутренние задачи, дообучать, квантизировать и упаковывать в закрытый контур.
Этическая развилка. Использование модели без цензуры в компании требует формализации политик допустимого контента на уровне процессов, а не надежды на фильтры.

Шаг 1. Проверить факты до запуска

Прежде чем выделять ресурсы на развёртывание, выполните быструю верификацию по пунктам:

Найдите независимое подтверждение существования модели: публикации на Hugging Face, GitHub, сообществах Open LLM.
Проверьте, кто именно выложил модель — имя китайской команды, история их релизов.
Запросите у сообщества результаты быстрых бенчмарков (MMLU, HumanEval, контекстная протяжка needle-in-a-haystack).
Убедитесь, что заявленный контекст 1 000 000 токенов подтверждается хотя бы одним независимым тестом (позиционное кодирование, реальное качество на длинных последовательностях).
Проанализируйте файлы модели на предмет неожиданных бинарных включений (учитывая намёк на «бэкдор»).

Шаг 2. Определить реальный сценарий внедрения

Qwythos-9B может быть полезна не для всех задач, а в узких, но ценных сценариях. Ниже — таблица принятия решения, которая поможет определить, стоит ли тратить время на модель в вашем контексте.

Критерий	За — пробовать Qwythos-9B	Против — пока пропустить
Нужен длинный контекст (от 200К до 1М токенов) на потребительской GPU	✅ Главное преимущество модели	❌ Для коротких промптов проще взять стабильные Llama/Qwen/Mistral
Требуется генерация без цензурного фильтра (red-teaming, творчество)	✅ Прямое назначение модели	❌ Если неприемлемы риски токсичного контента в рабочих средах
Готовность к самостоятельной проверке безопасности	✅ Модель можно изолировать и аудировать	❌ Если нужна гарантированно безопасная корпоративная лицензия
Локальное развёртывание без внешних API	✅ Полный контроль данных	❌ Когда проще использовать Claude API с его защитами
Наличие GPU уровня RTX 3090/4090 или A10 (24 ГБ VRAM)	✅ 9B в 4-бит квантизации влезает	❌ Если доступны только CPU или очень ограниченные GPU

Практический чеклист для развёртывания Qwythos-9B

Используйте этот чеклист как минимальный список действий при подтверждении существования и загрузке модели.

Получить веса и код — найти чекпойнт модели (предположительно в формате safetensors) и конфигурационные файлы. Остерегаться файлов pickle.
Проверить хеш-суммы — сверить с опубликованными авторами, если они даны.
Выбрать квантизацию — для видеокарт 24 ГБ комфортна 4-битная квантизация (AWQ, GPTQ или bitsandbytes). Для 8-битной потребуется больше 24 ГБ.
Настроить инференс-движок — использовать vLLM или Llama.cpp для поддержки длинного контекста. Обратить внимание на rope scaling-параметры: при миллионном контексте они могут быть нестандартными.
Протестировать контекстную протяжку — подать моделью длинный документ с фактом в середине и проверить, извлекает ли она его.
Изолировать среду — запускать модель в контейнере (Docker) с ограниченными привилегиями, без доступа к сети (air-gapped), если планируется обработка чувствительных данных.
Установить политику использования — даже при локальном запуске определить для команды, какие типы промптов допустимы, а какие автоматически логгируются и проверяются.
Оценить производительность на своих задачах — сравнить с альтернативами (Qwen2.5-7B, Llama-3.1-8B, Mistral-7B, DeepSeek-7B) на типовых запросах вашей предметной области.

Риски и отказоустойчивость

Прямой намёк на «бэкдор» из исходного поста нельзя игнорировать. Даже если это шутка, безопасность неизвестной модели из непроверенного источника — ответственность внедренца. Основные векторы, требующие проработки:

Вредоносный код внутри pickle-сериализованных файлов. Если модель распространяется не в safetensors, загрузка pickle может выполнить произвольный код. Проверяйте формат.
Скрытое нежелательное поведение в ответах. Модель, обученная на синтетике, может вставлять водяные знаки, выдавать внешние URL, пытаться осуществлять социальную инженерию.
Отсутствие модерации как бизнес-риск. Свобода генерации — это и риск получить оскорбительный, незаконный или опасный контент. Внедряя модель, вы должны иметь процесс фильтрации или аудита её выдачи на продуктивных системах.
Несоответствие лицензии ожиданиям. «Без ограничений» — неюридический термин. Уточните фактическую лицензию (Apache 2.0, MIT, CC или собственная). Открытость весов не всегда равна разрешению на коммерческое использование.

Короткий рабочий запрос: первый тест-промпт

Чтобы понять, стоит ли двигаться дальше, выполните этот запрос после запуска модели (в изолированном окружении):

В середине текста длиной примерно 800 000 символов находится предложение: «Ключевой параметр 47B активен». Текст состоит из случайных буквенных последовательностей, кроме этого предложения. Какой параметр активен? Воспроизведи предложение дословно.

Если модель успешно извлекает и возвращает «Ключевой параметр 47B активен», заявленный контекст работает. Если нет — реальное окно меньше, и применять модель для длинных документов нельзя.

Источники

Telegram-сигнал ONFF Journal

Руководство Anthropic для запуска AI-стартапа: что внутри и стоит ли проходить

3 часа назад • 4 мин. на чтение

ИИ-инструменты

Микроскопический текст в изображениях обходит ИИ-фильтры: что проверить в июне

3 часа назад • 3 мин. на чтение

ИИ-инструменты

Увольнения из-за ИИ в 2026: как отличить реальную автоматизацию от эвфемизма

6 часов назад • 4 мин. на чтение

Руководство Anthropic для запуска AI-стартапа: что внутри и стоит ли проходить