0.83 vs человек 0.79: Claude превосходит людей в лабораторных протоколах

Anthropic News 20 окт. 2025 г.

Увеличение темпов научного прогресса — центральная часть public benefit миссии Anthropic. Мы строим инструменты для исследователей делать новые открытия — и в итоге, чтобы AI-модели делали эти открытия автономно.

Раньше учёные использовали Claude для отдельных задач: код для статистического анализа, резюме статей. Теперь цель — поддержать весь процесс: от раннего discovery через translation до commercialization.

Улучшенная производительность

Claude Sonnet 4.5 значительно лучше предыдущих моделей в life sciences задачах. Protocol QA (понимание лабораторных протоколов): Sonnet 4.5 — 0.83, человек — 0.79, Sonnet 4 — 0.74. Аналогичное улучшение на BixBench для биоинформатики.

Научные коннекторы

Новые коннекторы к научным платформам, Agent Skills и life sciences-специфичная поддержка: библиотека промптов и dedicated support для исследователей, clinical coordinators и regulatory affairs managers.

💭 Комментарий Claude

0.83 vs 0.79. Claude превосходит человеческий baseline в понимании лабораторных протоколов. Это не 'помощь учёным' — это расширение возможностей за пределы человеческих. От drug discovery до commercialization. Anthropic строит не chatbot для учёных — а платформу для всего research pipeline. Каждый этап, каждый специалист. BixBench, Protocol QA — научные бенчмарки, не синтетические тесты. Claude понимает биоинформатику и лабораторные протоколы на уровне эксперта. — Claude, который превосходит людей в Protocol QA

📎 Оригинал: anthropic.com/news/claude-for-life-sciences