Исследование проводилось на основе реального клинического испытания DEFEND (NCT06792214). Система обработала 106 вопросов, сгенерированных и валидированных тремя опытными координаторами КИ. Каждый вопрос был задан модели трижды, в результате получено 318 ответов. Средняя точность ответов, по оценке трех независимых экспертов, составила 4,8 из 5 (95% доверительного индекса (ДИ): 4,7–4,9). При проверке с помощью второй LLM-модели-модератора средний балл точности также оказался высоким – 4,7 (95% ДИ: 4,6–4,8). Семантическая согласованность ответов на один и тот же вопрос, сформулированный по-разному, составила 0,91 как у людей, так и у LLM-модератора.
Ключевым результатом стало расхождение между оценками экспертов. Коэффициент межэкспертной согласованности в этом случае оказался крайне низким – 0,1 (95% ДИ: 0,0–0,2). В то же время у LLM-модератора этот показатель достиг 0,8 (95% ДИ: 0,8–0,8). Причиной разногласий экспертов стали субъективные ожидания: ответы признавались технически точными, но недостаточно адекватными из-за отсутствия живого диалога, эмпатии и учета контекста. В 4,4% случаев (14 из 318) система передавала вопрос главному исследователю – когда требовалась индивидуальная клиническая интерпретация, выходящая за рамки документов (например, вопросы о лекарственных взаимодействиях или изменении состояния пациента). При состязательном тестировании система успешно избегала предоставления медицинских рекомендаций и диагностических заключений, строго следуя ограничениям документации.
Авторы подчеркивают, что исследование является проверкой концепции и не оценивает эффективность в реальном взаимодействии с участниками. Отмечается также, что средняя стоимость одного КИ составляет $19 млн, и основная доля затрат приходится на зарплаты исследовательского персонала. Внедрение подобных систем может сократить нагрузку на персонал и повысить доступность клинических исследований для учреждений с ограниченными ресурсами, а также расширить охват недостаточно представленных групп населения за счет удаленного и многоязычного формата. В то же время авторы обращают внимание на риски, связанные с отсутствием адаптации для людей с нарушениями коммуникации и необходимостью проектирования с участием пациентов на следующих этапах. Авторы также подчеркивают, что высокая точность ответов не означает их достаточности для принятия полностью информированного решения, и для оценки реального понимания участников требуются проспективные исследования.
Разработка представляет собой первую демонстрацию возможности использования ИИ для информационной поддержки процедуры информированного согласия в клинических исследованиях. Внедрение таких систем в будущем может сделать КИ быстрее, доступнее и справедливее, но при условии, что они будут дополнять, а не заменять человеческих координаторов, и что их применение будет сопровождаться строгим этическим контролем и участием пациентов в проектировании. Авторы планируют дальнейшие исследования с участием реальных пациентов для оценки понимания, восприятия полезности и эффективности в реальных условиях.
В декабре 2025 года президент России Владимир Путин утвердил федеральный закон о сохранении бумажного формата согласия пациентов на участие в клинических исследованиях. Резкий переход к электронному документообороту и использование бумажных носителей только в качестве опции были предусмотрены масштабными корректировками в № 61-ФЗ «Об обращении лекарственных средств» от января 2024 года, в силу эти изменения должны были вступить в начале 2025 года, но затем дату перенесли на 1 января 2026 года. Эта мера вызвала вопросы в профсообществе и среди парламентариев, поэтому в Госдуме инициировали пересмотр новеллы.
К оцифровке согласий на участие в КИ индустрия готовилась, однако риски перехода были очевидны изначально. О том, как спонсоры и операторы КИ оценивали последствия такой реформы для сегмента, – в материале Vademecum.


