Qwythos-9B-Claude-Mythos-5 — тест локальной модели с контекстом 1 млн токенов и без цензуры

Qwythos-9B-Claude-Mythos-5: модель на 1 млн токенов без цензуры — что

ИИ-инструменты 23 июня 2026 г.

В конце июня 2026 года в Telegram-канале ONFF Journal появился сигнал: китайская команда выложила в открытый доступ модель Qwythos-9B-Claude-Mythos-5, созданную на основе одной из версий Qwen 3.5 (9B). Заявление примечательно сразу по нескольким причинам: полный файн-тюнинг всех параметров, заявленное контекстное окно до 1 000 000 токенов, обучение на противоречивых данных Claude Mythos и Claude Fable и полное отсутствие цензуры. Если информация подтверждается, перед нами — мощный инструмент для локальной генерации, но требующий аккуратного внедрения и проверки безопасности.

Что реально известно на основе первичного сигнала

Первичный источник — пост в @forjournalonffru от 23.06.2026. Текст содержит следующие утверждения:

  • Базовая архитектура: Qwen3.5-9B (модель класса 9 миллиардов параметров).
  • Контекстное окно: до 1 000 000 токенов (расшифровка эмодзи-цифр из поста).
  • Обучение: полный файн-тюнинг всех параметров на массиве «Claude Mythos и Claude Fable». Что именно означают эти названия — открытый вопрос: возможно, это неофициальные датасеты, стилизованные под ответы Claude, или смесь сгенерированных синтетических диалогов.
  • Цензура: по утверждению автора поста, отсутствует полностью. Модель способна выполнять «любые задачи» — от технических до откровенно творческих без ограничений.
  • Лицензия: полный опен-сорс «без ограничений».
  • Предупреждение: в конце поста добавлен эмодзи «👍 Бэкдор». Интерпретировать это можно как ироничный намёк, но с точки зрения безопасности сигнал должен быть воспринят серьёзно.

Никаких дополнительных ссылок на репозиторий, чекпойнт или документацию в исходном сигнале не содержится. Поэтому все дальнейшие выводы строятся на допущении, что модель действительно существует, и каждый шаг в её сторону должен сопровождаться верификацией.

Почему это имеет значение для рабочей практики

Если описанные характеристики верны, Qwythos-9B попадает в нишу, которая была относительно пуста:

  1. Контекст в 1 млн токенов на размере 9B. До сих пор модели с миллионным контекстом появлялись либо у проприетарных гигантов, либо у моделей от 70B и выше. Способность обрабатывать объёмные документы — контракты на 500 страниц, логи за месяц, полную базу знаний — на локально запускаемой модели 9B существенно меняет порог входа.
  2. Никакой цензуры. Это означает возможность генерации контента, который откажутся выдать API-провайдеры: анализ уязвимостей, медицинские или юридические гипотезы, откровенные литературные формы. При локальном развёртывании вы полностью контролируете модель, но и полностью несёте ответственность за её применение.
  3. Открытый исходный код. Если модель действительно выложена полностью (веса, конфигурация, скрипты файн-тюнинга), её можно адаптировать под внутренние задачи, дообучать, квантизировать и упаковывать в закрытый контур.
  4. Этическая развилка. Использование модели без цензуры в компании требует формализации политик допустимого контента на уровне процессов, а не надежды на фильтры.

Шаг 1. Проверить факты до запуска

Прежде чем выделять ресурсы на развёртывание, выполните быструю верификацию по пунктам:

  • Найдите независимое подтверждение существования модели: публикации на Hugging Face, GitHub, сообществах Open LLM.
  • Проверьте, кто именно выложил модель — имя китайской команды, история их релизов.
  • Запросите у сообщества результаты быстрых бенчмарков (MMLU, HumanEval, контекстная протяжка needle-in-a-haystack).
  • Убедитесь, что заявленный контекст 1 000 000 токенов подтверждается хотя бы одним независимым тестом (позиционное кодирование, реальное качество на длинных последовательностях).
  • Проанализируйте файлы модели на предмет неожиданных бинарных включений (учитывая намёк на «бэкдор»).

Шаг 2. Определить реальный сценарий внедрения

Qwythos-9B может быть полезна не для всех задач, а в узких, но ценных сценариях. Ниже — таблица принятия решения, которая поможет определить, стоит ли тратить время на модель в вашем контексте.

Критерий За — пробовать Qwythos-9B Против — пока пропустить
Нужен длинный контекст (от 200К до 1М токенов) на потребительской GPU ✅ Главное преимущество модели ❌ Для коротких промптов проще взять стабильные Llama/Qwen/Mistral
Требуется генерация без цензурного фильтра (red-teaming, творчество) ✅ Прямое назначение модели ❌ Если неприемлемы риски токсичного контента в рабочих средах
Готовность к самостоятельной проверке безопасности ✅ Модель можно изолировать и аудировать ❌ Если нужна гарантированно безопасная корпоративная лицензия
Локальное развёртывание без внешних API ✅ Полный контроль данных ❌ Когда проще использовать Claude API с его защитами
Наличие GPU уровня RTX 3090/4090 или A10 (24 ГБ VRAM) ✅ 9B в 4-бит квантизации влезает ❌ Если доступны только CPU или очень ограниченные GPU

Практический чеклист для развёртывания Qwythos-9B

Используйте этот чеклист как минимальный список действий при подтверждении существования и загрузке модели.

  1. Получить веса и код — найти чекпойнт модели (предположительно в формате safetensors) и конфигурационные файлы. Остерегаться файлов pickle.
  2. Проверить хеш-суммы — сверить с опубликованными авторами, если они даны.
  3. Выбрать квантизацию — для видеокарт 24 ГБ комфортна 4-битная квантизация (AWQ, GPTQ или bitsandbytes). Для 8-битной потребуется больше 24 ГБ.
  4. Настроить инференс-движок — использовать vLLM или Llama.cpp для поддержки длинного контекста. Обратить внимание на rope scaling-параметры: при миллионном контексте они могут быть нестандартными.
  5. Протестировать контекстную протяжку — подать моделью длинный документ с фактом в середине и проверить, извлекает ли она его.
  6. Изолировать среду — запускать модель в контейнере (Docker) с ограниченными привилегиями, без доступа к сети (air-gapped), если планируется обработка чувствительных данных.
  7. Установить политику использования — даже при локальном запуске определить для команды, какие типы промптов допустимы, а какие автоматически логгируются и проверяются.
  8. Оценить производительность на своих задачах — сравнить с альтернативами (Qwen2.5-7B, Llama-3.1-8B, Mistral-7B, DeepSeek-7B) на типовых запросах вашей предметной области.

Риски и отказоустойчивость

Прямой намёк на «бэкдор» из исходного поста нельзя игнорировать. Даже если это шутка, безопасность неизвестной модели из непроверенного источника — ответственность внедренца. Основные векторы, требующие проработки:

  • Вредоносный код внутри pickle-сериализованных файлов. Если модель распространяется не в safetensors, загрузка pickle может выполнить произвольный код. Проверяйте формат.
  • Скрытое нежелательное поведение в ответах. Модель, обученная на синтетике, может вставлять водяные знаки, выдавать внешние URL, пытаться осуществлять социальную инженерию.
  • Отсутствие модерации как бизнес-риск. Свобода генерации — это и риск получить оскорбительный, незаконный или опасный контент. Внедряя модель, вы должны иметь процесс фильтрации или аудита её выдачи на продуктивных системах.
  • Несоответствие лицензии ожиданиям. «Без ограничений» — неюридический термин. Уточните фактическую лицензию (Apache 2.0, MIT, CC или собственная). Открытость весов не всегда равна разрешению на коммерческое использование.

Короткий рабочий запрос: первый тест-промпт

Чтобы понять, стоит ли двигаться дальше, выполните этот запрос после запуска модели (в изолированном окружении):

В середине текста длиной примерно 800 000 символов находится предложение: «Ключевой параметр 47B активен». Текст состоит из случайных буквенных последовательностей, кроме этого предложения. Какой параметр активен? Воспроизведи предложение дословно.

Если модель успешно извлекает и возвращает «Ключевой параметр 47B активен», заявленный контекст работает. Если нет — реальное окно меньше, и применять модель для длинных документов нельзя.

Источники

Теги