В первом эксперименте участники определяли анатомические ориентиры при эндоскопической нейрохирургии. Новички, получавшие от ИИ лишь конечный результат без каких-либо пояснений, повышали точность принятых решений с 66% до 79%. У опытных врачей прирост был значительно меньше, и они редко меняли свое решение на основании подсказки. Во втором исследовании участники искали признаки аневризмы на операционных изображениях и одновременно видели тепловые карты и показатели точности алгоритма. Такой формат позволил экспертам повысить результат с 77% до 92%, сопоставляя визуализированные подсказки с собственным клиническим опытом. Новички также улучшали показатели, но применяли объяснения менее эффективно.
Авторы уточнили, что сами модели работали в разных условиях: в одном случае выполнялась сегментация сложной анатомии, в другом – классификация сосудистых структур. Эти различия считаются потенциальными факторами, влияющими на результаты, поэтому прямые сопоставления требуют осторожности. Тем не менее обе работы демонстрируют одну тенденцию: формат объяснений меняет поведение врача не меньше, чем точность самого алгоритма.
Дополнительно в работе рассмотрены международные данные. В ряде исследований из радиологии, дерматологии и патологии показано, что визуализация зон внимания повышает согласованность решений врача и ИИ, но при некорректной интерпретации может приводить к ошибкам. На эту проблему ранее указывали и американские исследователи из Mayo Clinic и Zyter|TruCare, которые предложили механизм оценки надежности медицинского ИИ. Он объединяет уровень уверенности модели, совпадение с врачебным заключением и качество объяснения в единый индекс и позволяет фильтровать менее надежные рекомендации. При тестировании на 6 689 клинических случаях схема снизила долю отклоненных врачами выводов с 87,6% до 33,3%, и авторы рассматривают ее как возможный инструмент калибровки взаимодействия «врач-алгоритм».
Кроме того, в анализе ученых из Великобритании отмечается, что для оценки ИИ в медицине уже существуют специализированные стандарты DECIDE-AI и IDEAL. Они требуют учитывать человеческие факторы на ранних этапах разработки, проверять, насколько согласуются решения врача и алгоритма, отслеживать уровень доверия специалистов и проводить поэтапные испытания моделей в условиях, максимально близких к клиническим. Авторы рекомендуют шире применять эти инструменты при исследовании и внедрении ИИ в хирургии.
Представленный анализ демонстрирует, что эффективность ИИ в хирургии определяется не только точностью алгоритмов, но и тем, как врач воспринимает, интерпретирует и использует подсказки системы. Среди перспективных направлений выделяются мультимодальные алгоритмы, которые объединяют видео, данные датчиков и клинические показатели, а также интерфейсы, адаптирующие формат подсказок под уровень подготовки специалиста.
Похожие вопросы о том, как медицинские специалисты взаимодействуют с ИИ и насколько системы готовы к его применению, поднимает и Всемирная организация здравоохранения (ВОЗ). По данным ВОЗ, только четверть стран обучает медработников вопросам использования ИИ, несмотря на то что алгоритмы уже применяются в диагностике и поддержке пациентов. Специалисты ВОЗ подчеркивали необходимость выстраивать надежные механизмы управления, защищать данные и формировать совместимые правила, чтобы технологии ИИ действительно усиливали медицинские системы и снижали нагрузку на медработников.
В первом эксперименте участники определяли анатомические ориентиры при эндоскопической нейрохирургии. Новички, получавшие от ИИ лишь конечный результат без каких-либо пояснений, повышали точность принятых решений с 66% до 79%. У опытных врачей прирост был значительно меньше, и они редко меняли свое решение на основании подсказки. Во втором исследовании участники искали признаки аневризмы на операционных изображениях и одновременно видели тепловые карты и показатели точности алгоритма. Такой формат позволил экспертам повысить результат с 77% до 92%, сопоставляя визуализированные подсказки с собственным клиническим опытом. Новички также улучшали показатели, но применяли объяснения менее эффективно.
Авторы уточнили, что сами модели работали в разных условиях: в одном случае выполнялась сегментация сложной анатомии, в другом – классификация сосудистых структур. Эти различия считаются потенциальными факторами, влияющими на результаты, поэтому прямые сопоставления требуют осторожности. Тем не менее обе работы демонстрируют одну тенденцию: формат объяснений меняет поведение врача не меньше, чем точность самого алгоритма.
Дополнительно в работе рассмотрены международные данные. В ряде исследований из радиологии, дерматологии и патологии показано, что визуализация зон внимания повышает согласованность решений врача и ИИ, но при некорректной интерпретации может приводить к ошибкам. На эту проблему ранее указывали и американские исследователи из Mayo Clinic и Zyter|TruCare, которые предложили механизм оценки надежности медицинского ИИ. Он объединяет уровень уверенности модели, совпадение с врачебным заключением и качество объяснения в единый индекс и позволяет фильтровать менее надежные рекомендации. При тестировании на 6 689 клинических случаях схема снизила долю отклоненных врачами выводов с 87,6% до 33,3%, и авторы рассматривают ее как возможный инструмент калибровки взаимодействия «врач-алгоритм».
Кроме того, в анализе ученых из Великобритании отмечается, что для оценки ИИ в медицине уже существуют специализированные стандарты DECIDE-AI и IDEAL. Они требуют учитывать человеческие факторы на ранних этапах разработки, проверять, насколько согласуются решения врача и алгоритма, отслеживать уровень доверия специалистов и проводить поэтапные испытания моделей в условиях, максимально близких к клиническим. Авторы рекомендуют шире применять эти инструменты при исследовании и внедрении ИИ в хирургии.
Представленный анализ демонстрирует, что эффективность ИИ в хирургии определяется не только точностью алгоритмов, но и тем, как врач воспринимает, интерпретирует и использует подсказки системы. Среди перспективных направлений выделяются мультимодальные алгоритмы, которые объединяют видео, данные датчиков и клинические показатели, а также интерфейсы, адаптирующие формат подсказок под уровень подготовки специалиста.
Похожие вопросы о том, как медицинские специалисты взаимодействуют с ИИ и насколько системы готовы к его применению, поднимает и Всемирная организация здравоохранения (ВОЗ). По данным ВОЗ, только четверть стран обучает медработников вопросам использования ИИ, несмотря на то что алгоритмы уже применяются в диагностике и поддержке пациентов. Специалисты ВОЗ подчеркивали необходимость выстраивать надежные механизмы управления, защищать данные и формировать совместимые правила, чтобы технологии ИИ действительно усиливали медицинские системы и снижали нагрузку на медработников.
