Data2Story: семь AI-агентов превращают CSV-файл в интерактивную новостную статью с графиками и картами

Data2Story: как семь AI-агентов превращают CSV в интерактивную статью

ИИ-инструменты 29 июня 2026 г.

Исследователи из Оксфорда и Стэнфорда представили Data2Story — инструмент, который из простого CSV-файла создаёт полноценную интерактивную статью с графиками, картами и проверяемыми источниками. Система использует семь специализированных AI-агентов, работающих как виртуальная редакция.

Источник: the-decoder.com

Для редакции, которая тратит недели на обработку одного датасета, это означает возможность сократить время до нескольких часов. Но прежде чем внедрять такой подход, стоит разобраться, как он устроен, где его реальная польза и какие ограничения пока не сняты.

Что изменилось: от сырых данных к готовой статье без участия человека

Data2Story — это навык для Claude Code, который запускает цепочку из семи AI-агентов. На вход подаётся CSV-файл, на выходе — готовая веб-страница с текстом, статистикой, графикой и интерактивными элементами. Всё это создаётся без единого действия человека.

Авторы продемонстрировали систему на расписании чемпионата мира по футболу 2026 года. Из датасета с городами-организаторами Data2Story собрала статью о климатических рисках: около 40% матчей пройдут в местах, которые профсоюз игроков FIFPRO классифицирует как зоны экстремальной жары. Статья содержит интерактивную карту и ссылки на климатические данные Open-Meteo.

Система не просто пересказывает цифры из таблицы. Она ищет внешний контекст, проверяет расчёты и выбирает формат подачи — карту для географии, график для статистики, аудио для музыкальных данных.

Ключевая особенность: каждая цифра проверяема

Главное отличие Data2Story от обычных AI-генераторов — встроенная панель «Инспектор». Она показывает источник каждого утверждения в статье: строку кода, файл с данными или внешнюю ссылку.

По данным исследователей, 93% всех видимых утверждений в статьях Data2Story можно проверить на происхождение. Для сравнения: у человеческих статей этот показатель — 25%. Разница объясняется просто: журналисты редко публикуют код, которым пользовались для анализа.

Важный нюанс: проверяемость не означает правильность. Исследователи подчёркивают, что система гарантирует только возможность перепроверить каждое число, а не его истинность. Если вы сомневаетесь в цифре — можете запустить код и пересчитать сами.

Как устроена «виртуальная редакция»: семь агентов и их роли

Каждый агент в цепочке Data2Story выполняет одну функцию, аналогичную реальной редакционной должности.

Агент Роль Что делает
Детектив Исследователь Ищет внешний контекст: связывает данные с открытыми источниками
Аналитик Data scientist Пишет и выполняет код для расчётов
Редактор Шеф-редактор Выбирает, какие находки станут основой сюжета
Дизайнер Арт-директор Решает, какой формат лучше: карта, график, аудио
Программист Верстальщик Собирает HTML-страницу
Аудитор Корректор Проверяет вёрстку на ошибки
Инспектор Фактчекер Привязывает каждое утверждение к источнику

Базовой моделью для всех агентов служит Claude Opus 4.7, запущенный через Claude Code. Для генерации изображений, видео и аудио система использует сторонние модели через OpenRouter: gpt-5.4-image-2, seedance-2.0 и lyria-3-pro-preview.

Что говорят тесты: читатели оценили AI-статьи выше человеческих

В исследовании приняли участие 53 читателя. Они оценивали статьи, созданные Data2Story, и статьи, написанные людьми. Результат: AI-статьи получили более высокие оценки по шкале читательского восприятия.

Это не значит, что AI заменит журналистов. Исследователи отмечают, что люди всё ещё выигрывают в глубине анализа, способности задавать неожиданные вопросы и видеть контекст, который не очевиден из данных. Data2Story — это инструмент для рутинной обработки данных, а не замена редакционному мышлению.

Где система пока слаба: что нужно проверить до внедрения

Прежде чем переносить Data2Story в реальную работу, стоит учесть несколько ограничений.

Зависимость от модели. Система работает на Claude Opus 4.7 через Claude Code. Если Anthropic изменит API, цены или политику доступа, весь пайплайн может стать недоступен.

Стоимость. В статье не указаны точные цифры, но запуск семи агентов с вызовами внешних моделей для генерации медиа — это не бесплатно. Для регулярного использования нужно оценить бюджет.

Качество внешнего контекста. Агент-детектив ищет информацию в интернете. Если источники содержат ошибки или устаревшие данные, статья будет их воспроизводить.

Проверяемость ≠ точность. 93% утверждений проверяемы, но это не гарантирует их истинность. Ошибка в исходных данных или коде анализа перейдёт в финальную статью.

Отсутствие редакционного чутья. Система не может задать вопрос, которого нет в данных. Она не увидит историю, которая скрыта за цифрами, если её не подскажет внешний контекст.

Что можно сделать на этой неделе: практический чек-лист

Если вы хотите оценить Data2Story для своей редакции или контент-продакшена, вот пять шагов, которые не требуют перестройки компании.

  1. Прочитайте оригинальную статью на The Decoder. Там есть ссылки на исследование и примеры работ.
  2. Проверьте, есть ли у вас доступ к Claude Code. Data2Story — это навык для этой платформы. Без неё система не запустится.
  3. Возьмите один небольшой датасет из вашей работы и попробуйте прогнать его через Data2Story. Сравните результат с тем, что делает ваша команда за то же время.
  4. Оцените стоимость. Посчитайте, сколько будет стоить одна статья с учётом вызовов API для Claude и сторонних моделей. Сравните с зарплатой аналитика и дизайнера.
  5. Проверьте качество проверки. Выберите три случайных утверждения из сгенерированной статьи и перепроверьте их вручную. Если система ошибается — поймите, на каком этапе произошёл сбой.

Источники

Дополнительные материалы для изучения

Чтобы глубже разобраться в теме, рекомендуем ознакомиться с оригинальным исследованием Data2Story на arXiv, где подробно описана архитектура системы и результаты тестирования. Также полезно изучить документацию Claude Code для понимания технических требований к запуску навыка. Для оценки применимости в вашей редакции стоит протестировать систему на собственном датасете, следуя чек-листу выше.

Генерация изображения

  • Модель: flux-schnell
  • Провайдер: replicate

Темы журнала

Что почитать дальше

Теги