Граф правовых связей для ИИ: когда похожего фрагмента мало
Юридический ИИ легко сделать похожим на справочный чат: человек задает вопрос, система ищет несколько фрагментов, модель собирает ответ. Для простых вопросов этого иногда достаточно. Но в праве часто нужно не просто найти похожий текст, а пройти по связям: какой документ действует, какая норма применима, что изменено позже, где исключение, где ссылка на другой акт и что можно показать человеку как основание.
Поэтому после карты документов появляется следующий слой: граф правовых связей. Это не обязательно огромная академическая система. В практическом смысле граф означает, что документы, нормы, статьи, пункты, требования, исключения и цитаты связаны между собой явно. ИИ-агент видит не только кусок текста, а маршрут: от вопроса к норме, от нормы к связанному документу, от документа к проверяемому ответу.
Microsoft GraphRAG хорошо показывает общий принцип: когда вопрос требует соединить разрозненные сведения, простого поиска по похожести может быть мало. Система строит граф сущностей и отношений, а потом использует его при ответе. В юридической задаче это особенно важно, потому что ответ часто зависит не от одного абзаца, а от связи между несколькими правовыми объектами.

Где ломается обычный top-k поиск
Обычный поиск по похожим фрагментам отвечает на вопрос: какие куски текста ближе всего к запросу. Для права это слишком узко. Пользователь может спросить про одно требование, а правильный ответ будет зависеть от приложения, исключения, актуальной редакции, письма с разъяснением или связанного договора.
LegalBench как исследовательский бенчмарк важен не конкретным набором задач, а рамкой: юридическое рассуждение бывает разным. Есть классификация, применение правила, интерпретация, работа с условиями, сравнение фактов и норм. Значит, система не должна вести себя так, будто весь юридический поиск сводится к одному похожему абзацу.
Главное:Если ответ требует связи между нормами, версиями, исключениями и документами, одного top-k списка мало. Нужен слой правовых отношений: что на что ссылается, что отменяет, что уточняет и какой источник можно показать человеку.
Что должно стать узлами и связями
| Объект | Что хранить | Зачем это агенту |
|---|---|---|
| Документ | тип, дата, статус, источник, версия | понять, можно ли использовать документ |
| Норма | статья, пункт, требование, условие | находить не просто текст, а правовой объект |
| Связь | ссылается, изменяет, исключает, уточняет | переходить между зависимыми нормами |
| Цитата | точный фрагмент и путь к источнику | показывать основание ответа |
| Проверка | тестовый вопрос и ожидаемое основание | контролировать качество после обновлений |
Технически это может жить не только в графовой базе. Часть связей можно хранить как метаданные рядом с векторами: например, Qdrant поддерживает фильтрацию по payload и гибридные запросы. Но сама модель данных должна появиться раньше выбора хранилища. Если у документа нет полей и связей, инструменту нечего фильтровать.
Как применить это в работе
Начинать полезно с маленького графа. Берем один тип документов и описываем не все подряд, а только связи, которые реально нужны для ответа. Например: документ, пункт, связанный пункт, основание, исключение, редакция, источник. Потом пишем несколько контрольных вопросов: где система обязана показать норму, где должна отказаться, где должна попросить уточнение.
В Codex это можно оформить как отдельную задачу перед разработкой: не “собери RAG”, а “составь карту правовых объектов и связей для этой коллекции, предложи поля, тестовые вопросы и границы ответа”. Тогда агент помогает не только писать код, но и проектировать предметный слой.
Где граница метода
Граф не отменяет поиск и не делает систему автоматически правильной. Он добавляет структуру, которую можно проверять. Модель все равно может неверно понять вопрос, выбрать слабую связь или перепутать смысл нормы. Поэтому граф должен идти вместе с тестами, журналом источников и человеческим ревью на рискованных ответах.
Но без графа ошибка часто остается невидимой. Система уверенно отвечает, а человек видит только красивую формулировку. С графом можно спросить: откуда взялся этот вывод, по какой связи система пришла к норме, какая редакция использована и где цитата. Для юридического ИИ это и есть переход от “чатбота по документам” к рабочему инструменту.