Граф правовых связей для ИИ: когда похожего фрагмента мало

Юридический ИИ легко сделать похожим на справочный чат: человек задает вопрос, система ищет несколько фрагментов, модель собирает ответ. Для простых вопросов этого иногда достаточно. Но в праве часто нужно не просто найти похожий текст, а пройти по связям: какой документ действует, какая норма применима, что изменено позже, где исключение, где ссылка на другой акт и что можно показать человеку как основание.

Поэтому после карты документов появляется следующий слой: граф правовых связей. Это не обязательно огромная академическая система. В практическом смысле граф означает, что документы, нормы, статьи, пункты, требования, исключения и цитаты связаны между собой явно. ИИ-агент видит не только кусок текста, а маршрут: от вопроса к норме, от нормы к связанному документу, от документа к проверяемому ответу.

Microsoft GraphRAG хорошо показывает общий принцип: когда вопрос требует соединить разрозненные сведения, простого поиска по похожести может быть мало. Система строит граф сущностей и отношений, а потом использует его при ответе. В юридической задаче это особенно важно, потому что ответ часто зависит не от одного абзаца, а от связи между несколькими правовыми объектами.

Где ломается обычный top-k поиск

Обычный поиск по похожим фрагментам отвечает на вопрос: какие куски текста ближе всего к запросу. Для права это слишком узко. Пользователь может спросить про одно требование, а правильный ответ будет зависеть от приложения, исключения, актуальной редакции, письма с разъяснением или связанного договора.

LegalBench как исследовательский бенчмарк важен не конкретным набором задач, а рамкой: юридическое рассуждение бывает разным. Есть классификация, применение правила, интерпретация, работа с условиями, сравнение фактов и норм. Значит, система не должна вести себя так, будто весь юридический поиск сводится к одному похожему абзацу.

Главное:

Если ответ требует связи между нормами, версиями, исключениями и документами, одного top-k списка мало. Нужен слой правовых отношений: что на что ссылается, что отменяет, что уточняет и какой источник можно показать человеку.

Что должно стать узлами и связями

Объект Что хранить Зачем это агенту
Документ тип, дата, статус, источник, версия понять, можно ли использовать документ
Норма статья, пункт, требование, условие находить не просто текст, а правовой объект
Связь ссылается, изменяет, исключает, уточняет переходить между зависимыми нормами
Цитата точный фрагмент и путь к источнику показывать основание ответа
Проверка тестовый вопрос и ожидаемое основание контролировать качество после обновлений

Технически это может жить не только в графовой базе. Часть связей можно хранить как метаданные рядом с векторами: например, Qdrant поддерживает фильтрацию по payload и гибридные запросы. Но сама модель данных должна появиться раньше выбора хранилища. Если у документа нет полей и связей, инструменту нечего фильтровать.

Как применить это в работе

Начинать полезно с маленького графа. Берем один тип документов и описываем не все подряд, а только связи, которые реально нужны для ответа. Например: документ, пункт, связанный пункт, основание, исключение, редакция, источник. Потом пишем несколько контрольных вопросов: где система обязана показать норму, где должна отказаться, где должна попросить уточнение.

В Codex это можно оформить как отдельную задачу перед разработкой: не “собери RAG”, а “составь карту правовых объектов и связей для этой коллекции, предложи поля, тестовые вопросы и границы ответа”. Тогда агент помогает не только писать код, но и проектировать предметный слой.

Где граница метода

Граф не отменяет поиск и не делает систему автоматически правильной. Он добавляет структуру, которую можно проверять. Модель все равно может неверно понять вопрос, выбрать слабую связь или перепутать смысл нормы. Поэтому граф должен идти вместе с тестами, журналом источников и человеческим ревью на рискованных ответах.

Но без графа ошибка часто остается невидимой. Система уверенно отвечает, а человек видит только красивую формулировку. С графом можно спросить: откуда взялся этот вывод, по какой связи система пришла к норме, какая редакция использована и где цитата. Для юридического ИИ это и есть переход от “чатбота по документам” к рабочему инструменту.