Схема: AI генерирует 80% кода, но узкое место смещается на ревью и контроль качества

Claude пишет 80% кода в Anthropic: почему ревью стало узким местом

ИИ-инструменты 27 июня 2026 г.

Anthropic сообщила, что на май 2026 Claude писал больше 80% кода, который уходит в продакшн. Для бизнеса это не повод списывать разработчиков, а повод пересчитать, где теперь утекают деньги и время: не в набор текста, а в ревью, архитектуру и контроль дефектов. Если вы уже покупаете AI-инструмент для разработки или планируете нанимать команду под новый продукт, первым делом проверьте не скорость генерации, а то, выдержит ли ваша проверка такой объём изменений.

Что именно произошло

В свежем отчёте Anthropic «When AI builds itself» компания описывает довольно жёсткий сдвиг в рабочем процессе. По их данным, на май 2026 Claude писал больше 80% кода, который попадает в production. До запуска Claude Code в феврале 2025 речь шла о нескольких процентах.

Есть и более показательная деталь: Anthropic описывает этот процесс не как «ИИ работает вместо инженера», а как схему, где код пишет Claude, а инженер направляет и ревьюит. То есть человек не исчезает из процесса, но его роль смещается от набора строк к постановке задачи и проверке результата.

Отдельно компания говорит о скорости работы самих инженеров: типичный инженер во втором квартале 2026 мерджит в день в 8 раз больше кода, чем в 2024-м. Это уже не косметическое ускорение. Это изменение нагрузки на всю цепочку — от постановки задачи до ревью и выпуска.

Ещё один важный нюанс из самого отчёта: качество кода Claude. В конце 2025 года оно было «несколько хуже» человеческого, сейчас — «примерно на паритете», а дальше Anthropic ожидает улучшение в течение года. Иными словами, рост доли сгенерированного кода уже есть, а догон качества ещё идёт.

Почему это меняет бюджет и график

Главная ошибка в такой новости — прочитать 80% как «80% ценности». Это не одно и то же. Счётчик, о котором говорит Anthropic, измеряет долю кода в production, который удалось распознать как написанный Claude. Это метрика объёма, а не пользы.

Для бизнеса отсюда вытекает простой вывод: дешёвым становится не результат, а черновая производственная работа. То, что раньше занимало много часов на написание шаблонов, CRUD, типовых интеграций и тестов, теперь ускоряется. Но как только объём изменений растёт, дороже становится другое — проверка, принятие решения и ответственность за выпуск.

Что меняется Почему важно бизнесу Что проверить
Claude пишет большую часть production-кода Скорость генерации растёт, но контроль качества становится узким местом Сколько времени уходит на ревью, тесты и согласование правок
Метрика 80% считается только по распознанному коду Цифра может недооценивать реальную долю автоматизации Что именно ваш инструмент считает AI-кодом, а что уходит в «ручные» остатки
Инженер в Anthropic мерджит в 8 раз больше кода Растёт поток изменений, который нужно успевать проверять Хватает ли команды review, QA и владельцев модулей
Качество Claude приблизилось к человеческому, но не гарантированно лучше Ошибки не исчезают автоматически вместе с ускорением Есть ли отдельный контроль на критичных участках и после релизов

Ещё одна практическая мысль: если раньше вы считали разработку как «сколько людей нужно, чтобы написать код», то теперь правильнее считать её как «сколько ревью и контроля нужно, чтобы безопасно выпустить код». Это меняет не только найм, но и стоимость проекта. В некоторых командах узким местом станет не разработчик, а человек, который способен быстро и качественно принимать изменения в репозиторий.

Как не перепутать объём кода с ценностью

Anthropic сама осторожна в формулировках. Их 80% — это не весь код, который написала модель. Во-первых, счётчик не ловит всё, что сделал Claude. Во-вторых, в оставшиеся проценты попадает не только ручная работа людей, но и автогенерация — шаблоны, сгенерированные файлы и похожие вещи. Если добавить скрипты и эксперименты, руководство уже говорит о 90% с лишним.

Из этого следует неудобный для менеджера вывод: одна и та же цифра может одновременно быть и правдой, и плохой основой для решения. Она показывает масштаб использования инструмента, но не показывает, насколько хорошо команда управляет качеством.

В источнике есть ещё один полезный ориентир. В эксперименте METR 16 опытных разработчиков работали в хорошо знакомых репозиториях. С ИИ они были уверены, что ускорились на 20%, а по факту потеряли 19% времени. Разрыв между ощущением и результатом — 40 пунктов. Для бизнеса это важнее, чем спор о процентах: если вы не меряете цикл поставки отдельно, вы легко примете субъективное впечатление за экономию.

Ниже — короткий ориентир, как читать такие цифры.

  • Большая доля AI-кода говорит о том, что генерация дешёвая.
  • Она не говорит, что дешёвая поставка.
  • Она не говорит, что можно сокращать контроль.
  • Она не говорит, что продукт стал безопаснее.

Что проверить перед тем, как менять план найма или инструменты

Если вы как руководитель увидели историю про 80% и хотите сделать из неё вывод для своей команды, сначала проверьте четыре вещи. Без этого цифра легко превращается в красивый повод для неправильного решения.

  1. Где именно у вас сейчас узкое место. Если генерация кода ускорилась в 8 раз, а ревью осталось прежним, вы просто накапливаете очередь. Измерьте время от коммита до мерджа до и после внедрения AI-инструментов. Если оно не сокращается, проблема не в скорости написания кода.
  2. Как вы меряете качество. Если вы не отслеживаете дефекты, которые приходят из AI-сгенерированного кода, вы не знаете, ускоряетесь вы или накапливаете технический долг. Введите отдельную метрику: процент багов, найденных в коде, написанном AI, по сравнению с ручным.
  3. Кто принимает финальное решение о выпуске. В старой схеме разработчик нёс ответственность за свой код. В новой схеме ответственность остаётся на человеке, но объём кода, который он должен проверить, вырос. Если вы не меняете процесс ревью под новый объём, вы рискуете качеством.
  4. Есть ли у вас резерв на переделку. Anthropic признаёт, что качество AI-кода догоняет человеческое, но не превосходит его. Это значит, что часть сгенерированного кода всё равно придётся переписывать. Заложите в бюджет 10–20% времени на доработку AI-кода, особенно на критичных участках.

Что дальше

История с 80% — не про то, что разработчики больше не нужны. Она про то, что их работа меняется. Если раньше инженер тратил 60% времени на написание кода и 40% на всё остальное, то теперь пропорция может сместиться к 20% на написание и 80% на ревью, архитектуру и коммуникацию.

Для бизнеса это означает, что найм нужно пересчитывать не под количество строк кода, а под способность команды управлять потоком изменений. Инструмент, который ускоряет генерацию, но не ускоряет ревью и контроль, не даст выигрыша в скорости поставки.

Лучшее, что можно сделать прямо сейчас — измерить свой цикл поставки до и после внедрения AI-инструментов. Если время от идеи до продакшна сокращается, вы на правильном пути. Если нет — ищите узкое место не в генерации, а в проверке.

Источники

  1. Anthropic. «When AI builds itself» — официальный отчёт компании о внедрении Claude в процесс разработки, май 2026. Доступен по адресу: https://www.anthropic.com/news/when-ai-builds-itself
  2. METR. «Measuring the impact of AI coding assistants on developer productivity» — экспериментальное исследование с участием 16 опытных разработчиков, 2025. Доступно по адресу: https://metr.org/research/ai-coding-productivity

Генерация изображения

  • Модель: qwen-image-2.0-pro
  • Провайдер: alibaba

Теги