Пятница, 28 ноября 2025
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
  • Вход
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
Нет результата
Просмотреть все результаты
Главная Новости Новости медицины и фармации

95% тестов медицинских ИИ-моделей не отражают их реальную эффективность

14.10.2025
в Новости медицины и фармации


По мнению ученых, такой подход формирует «иллюзию эффективности» и создает ложное ощущение готовности ИИ к медицинской практике. Авторы подчеркивают, что реальные клинические данные гораздо сложнее для анализа: они содержат профессиональный жаргон, неполные записи и значительные различия между медицинскими учреждениями. В результате алгоритмы, демонстрирующие высокие показатели на синтетических тестах, часто оказываются менее точными в реальной работе врача.


Более того, большинство оценок основаны на автоматических метриках точности – BLEU, ROUGE, BERTScore и других, – которые были разработаны для задач машинного перевода и обработки текстов, но плохо подходят для медицинского контекста. Совпадение между автоматическими и человеческими оценками минимально: модели, показавшие высокую точность по формальным метрикам, на практике нередко дают неверные или неполные ответы.


Еще одна проблема заключается в том, что даже использование данных из реальных медицинских карт не гарантирует точной оценки работы моделей. Многие тесты, такие как MedNLI, создаются на основе настоящих записей врачей, но при их подготовке данные часто упрощаются и теряют важные детали. В итогн алгоритм может показывать высокий результат не потому, что действительно «понимает» клинический текст, а потому что угадывает ответы, подстраиваясь под особенности набора.


Кроме того, наиболее распространенный формат испытаний – экзамены с множественным выбором – не отражает практику врачей, где решения приходится принимать при неполных и противоречивых данных. В реальных условиях языковые модели показывают существенно более низкие результаты, что подтверждают исследования. Например, ученые из Германии, Великобритании и США в 2024 году проверили точность постановки диагнозов ИИ на данных 2,4 тысячи пациентов с четырьмя распространенными заболеваниями брюшной полости и выяснили, что точность моделей составляла лишь 13-68%, тогда как врачи определяли те же патологии в 84-86% случаев. Алгоритмы пока не способны воспроизводить процесс клинического мышления и принятия решений, свойственный специалистам.


Исследователи предлагают перейти к новым стандартам оценки медицинского ИИ – с участием клиницистов, анализом реальных сценариев взаимодействия врача и языковых моделей, а также проверкой того, как алгоритмы влияют на качество диагностики, скорость работы и когнитивную нагрузку персонала. Они подчеркивают, что ИИ-системы в ближайшие годы будут использоваться не как самостоятельные инструменты, а как вспомогательные технологии для рутинных задач специалистов. Поэтому качество их оценки должно учитывать не только точность ответов, но и реальные эффекты для медицинской практики.


По мнению авторов, только комплексная, прозрачная и учитывающая клинический контекст система проверки позволит объективно определить, насколько ИИ способен повысить эффективность здравоохранения и снизить риски для пациентов.


Ранее исследователи из Вашингтонского и Мичиганского университетов совместно с коллегами из Китая предложили включать в работу алгоритмов не только данные пациентов, но и цифровые следы взаимодействия врачей с электронными медкартами. Такой подход позволит моделям учитывать реальные особенности клинического мышления. Интеграция этих данных в систему раннего предупреждения об ухудшении состояния позволила снизить внутрибольничную смертность на 35,6%. Так, учет реального контекста, на котором настаивают авторы статьи об «иллюзии эффективности», становится ключевым направлением развития медицинского ИИ.


По мнению ученых, такой подход формирует «иллюзию эффективности» и создает ложное ощущение готовности ИИ к медицинской практике. Авторы подчеркивают, что реальные клинические данные гораздо сложнее для анализа: они содержат профессиональный жаргон, неполные записи и значительные различия между медицинскими учреждениями. В результате алгоритмы, демонстрирующие высокие показатели на синтетических тестах, часто оказываются менее точными в реальной работе врача.


Более того, большинство оценок основаны на автоматических метриках точности – BLEU, ROUGE, BERTScore и других, – которые были разработаны для задач машинного перевода и обработки текстов, но плохо подходят для медицинского контекста. Совпадение между автоматическими и человеческими оценками минимально: модели, показавшие высокую точность по формальным метрикам, на практике нередко дают неверные или неполные ответы.


Еще одна проблема заключается в том, что даже использование данных из реальных медицинских карт не гарантирует точной оценки работы моделей. Многие тесты, такие как MedNLI, создаются на основе настоящих записей врачей, но при их подготовке данные часто упрощаются и теряют важные детали. В итогн алгоритм может показывать высокий результат не потому, что действительно «понимает» клинический текст, а потому что угадывает ответы, подстраиваясь под особенности набора.


Кроме того, наиболее распространенный формат испытаний – экзамены с множественным выбором – не отражает практику врачей, где решения приходится принимать при неполных и противоречивых данных. В реальных условиях языковые модели показывают существенно более низкие результаты, что подтверждают исследования. Например, ученые из Германии, Великобритании и США в 2024 году проверили точность постановки диагнозов ИИ на данных 2,4 тысячи пациентов с четырьмя распространенными заболеваниями брюшной полости и выяснили, что точность моделей составляла лишь 13-68%, тогда как врачи определяли те же патологии в 84-86% случаев. Алгоритмы пока не способны воспроизводить процесс клинического мышления и принятия решений, свойственный специалистам.


Исследователи предлагают перейти к новым стандартам оценки медицинского ИИ – с участием клиницистов, анализом реальных сценариев взаимодействия врача и языковых моделей, а также проверкой того, как алгоритмы влияют на качество диагностики, скорость работы и когнитивную нагрузку персонала. Они подчеркивают, что ИИ-системы в ближайшие годы будут использоваться не как самостоятельные инструменты, а как вспомогательные технологии для рутинных задач специалистов. Поэтому качество их оценки должно учитывать не только точность ответов, но и реальные эффекты для медицинской практики.


По мнению авторов, только комплексная, прозрачная и учитывающая клинический контекст система проверки позволит объективно определить, насколько ИИ способен повысить эффективность здравоохранения и снизить риски для пациентов.


Ранее исследователи из Вашингтонского и Мичиганского университетов совместно с коллегами из Китая предложили включать в работу алгоритмов не только данные пациентов, но и цифровые следы взаимодействия врачей с электронными медкартами. Такой подход позволит моделям учитывать реальные особенности клинического мышления. Интеграция этих данных в систему раннего предупреждения об ухудшении состояния позволила снизить внутрибольничную смертность на 35,6%. Так, учет реального контекста, на котором настаивают авторы статьи об «иллюзии эффективности», становится ключевым направлением развития медицинского ИИ.

Пред.

Различные виды депрессии связали с диабетом и болезнями сердца

След.

На пациента, разгромившего скорую помощь, завели административное дело о мелком хулиганстве

СвязанныеСообщения

Каждый второй россиянин выбирает частную медицину из‑за возможности быстро попасть на прием любого специалиста
Новости медицины и фармации

Каждый второй россиянин выбирает частную медицину из‑за возможности быстро попасть на прием любого специалиста

28.11.2025
Пациентка московской больницы покончила жизнь самоубийством
В России

Пациентка московской больницы покончила жизнь самоубийством

28.11.2025
Минфин предлагает утвердить перечень СЗЛС в первой половине 2026 года
Новости медицины и фармации

Минфин предлагает утвердить перечень СЗЛС в первой половине 2026 года

28.11.2025
След.
На пациента, разгромившего скорую помощь, завели административное дело о мелком хулиганстве

На пациента, разгромившего скорую помощь, завели административное дело о мелком хулиганстве

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Товары

  • Comprehensive Foot and Ankle Repair Part 1 Comprehensive Foot and Ankle Repair Part 1 684 ₽
  • Rosen Emergency Medicine e-dition Rosen Emergency Medicine e-dition 342 ₽
  • Chemistry Books 15 Chemistry Books 15 342 ₽
  • Procedures in Cosmetic Dermatology Series: Liposuction Procedures in Cosmetic Dermatology Series: Liposuction 684 ₽

Товары

  • Clinical Atlas v.2.0 Clinical Atlas v.2.0 616 ₽
  • Pathology Books 3 DVD Pathology Books 3 DVD 684 ₽
  • Procedures in Cosmetic Dermatology Series: Soft Tissue Augmentat Procedures in Cosmetic Dermatology Series: Soft Tissue Augmentat 684 ₽
  • IDIS Pharmacology Database IDIS Pharmacology Database 342 ₽
  • Медицинская библиотека — Справочник педиатра Медицинская библиотека - Справочник педиатра 205 ₽

Метки

AstraZeneca FDA RNC Pharma Алексей Водовозов ВОЗ Вакцина Заметки врача Лекарства Минздрав Москва Подкасты Производство Роспотребнадзор ФАС вакцинация вакцинация от коронавирусной инфекции видеолекции дети исследование исследования клинические исследования книги для врачей коронавирус коронавирус 2019 коронавирус 2021 коронавирусная инфекция мероприятия новости Remedium новости медицины онкология опрос подкаст продажи разработка рак регистрация рост рынок лекарств сделка слушать подкаст онлайн статьи для врачей сша фармацевтика фармация фармрынок РФ

Свежие записи

  • Каждый второй россиянин выбирает частную медицину из‑за возможности быстро попасть на прием любого специалиста
  • Пациентка московской больницы покончила жизнь самоубийством
  • Минфин предлагает утвердить перечень СЗЛС в первой половине 2026 года
  • FDA расследует смерть ребенка после приема препарата Takeda от редкого заболевания крови
  • ГЕРОФАРМ зарегистрировал первый российский аналог препарата для лечения миодистрофии Дюшенна
  • О нас
  • Реклама
  • Политика конфиденциальности
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Добро пожаловать!

Войдите в свой аккаунт ниже

Забыли пароль?

Восстановите ваш пароль

Пожалуйста, введите ваше имя пользователя или адрес электронной почты, чтобы сбросить пароль.

Вход
Нет результата
Просмотреть все результаты
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Go to mobile version