Среда, 24 декабря 2025
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
  • Вход
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
Нет результата
Просмотреть все результаты
Главная Новости Новости медицины и фармации

Аналитики зафиксировали резкий разброс точности ИИ-ассистентов

03.12.2025
в Новости медицины и фармации


Исследование сравнивает показатели нескольких десятков моделей – как коммерческих, так и открытых. Оценивались два ключевых параметра: доля корректных ответов и частота галлюцинаций, то есть уверенных, но неверных выводов в ситуациях, где система должна была признать недостаток данных или отказаться от ответа. Для медицины это критично, поскольку даже единичные недостоверные рекомендации могут влиять на диагностику, интерпретацию данных и маршрутизацию пациентов.


Отдельный блок данных показывает, насколько сильно различаются модели разных разработчиков. Так, по точности лидирует Gemini 3 Preview от Google – 54%, далее идут Claude Opus 4.5 от Anthropic – 43% и Grok 4 от xAI – 40%. Более свежие версии больших языковых моделей показывают умеренные результаты: GPT-5.1 от OpenAI – 35%, Claude 4.5 Sonnet от Anthropic – 31%.


По уровню галлюцинаций наиболее последовательной оказалась Claude 4.5 Haiku от Anthropic – 26%, но многие модели ошибаются значительно чаще. Среди них – Grok 4 от xAI (64%), Kimi K2 0905 от Moonshot (69%), Llama Nemotron Super 49B от Nvidia/Meta* (76%), DeepSeek R1 от DeepSeek (83%), EXAONE 4.032B от LG AI Research (86%). Некоторые версии Gemini от Google и открытые модели gpt-oss показывают еще более высокий уровень ошибок – свыше 88-93% Такие различия значат, что даже крупные языковые модели ведущих компаний могут вести себя непредсказуемо в сложных или неоднозначных задачах.


Результаты демонстрируют существенный разрыв между точностью и безопасностью ответов. Модели могут показывать приемлемую долю корректных результатов, но при этом регулярно выдавать уверенные, но ошибочные ответы. Аналитики отмечают, что такие расхождения повышают риск некорректных интерпретаций и требуют учета при выборе и внедрении ИИ-систем.


Подобные риски подтверждаются и академическими исследованиями. Работа международной группы ученых, опубликованная в Digital Medicine, показала, что мультимодальные нейромодели резко теряют точность при ухудшении качества медицинских изображений. Легкое размытие или цифровой шум снижали корректность на 3-10%, а серьезные искажения – на десятки процентов. На отдельных типах данных точность падала до 30-40%, а способность отличать норму от патологии ухудшалась почти на 80%. При этом модели практически никогда не предупреждали о плохом качестве снимка и продолжали выдавать уверенные, но ошибочные заключения.


Другое международное исследование выявило, что большие языковые модели остаются нестабильными в задачах персонализированных рекомендаций по долголетию. Семь систем протестировали на 1 000 клинических сценариев с использованием 25 виртуальных профилей пациентов. Качество рекомендаций заметно различалось: GPT-4o от OpenAI достигала около 90% соответствия медицинским критериям, тогда как модели Meta, Alibaba и DeepSeek часто не превышали 60%. Авторы отмечали, что ИИ нередко дает неполные или чрезмерно осторожные ответы, что ограничивает его применение без экспертного контроля.


Ранее, в 2024 году, Associated Press сообщала о серьезных сбоях в медицинских транскрибациях на основе модели Whisper от OpenAI. По данным расследования, ошибки и «галлюцинации» обнаруживались в большинстве записей – в отдельных оценках до восьми из десяти расшифровок. Алгоритм путал диагнозы, подменял назначения и даже «добавлял» несуществующие препараты, а оригинальные аудиофайлы автоматически удалялись, не позволяя врачам проверить корректность транскрипций. 


Эксперты из Artificial Analysis подчеркивают, что надежность остается ключевым ограничением для широкого применения ИИ. Рост вычислительных возможностей и появление новых моделей не приводят к пропорциональному улучшению качества ответов: поведение систем, особенно в неоднозначных ситуациях, остается нестабильным. По мнению аналитиков, индустрии необходимы единые стандарты оценки и методы контроля, которые позволят объективно измерять риски и выбирать наиболее устойчивые модели.


* Meta признана экстремистской организацией и запрещена в России


Исследование сравнивает показатели нескольких десятков моделей – как коммерческих, так и открытых. Оценивались два ключевых параметра: доля корректных ответов и частота галлюцинаций, то есть уверенных, но неверных выводов в ситуациях, где система должна была признать недостаток данных или отказаться от ответа. Для медицины это критично, поскольку даже единичные недостоверные рекомендации могут влиять на диагностику, интерпретацию данных и маршрутизацию пациентов.


Отдельный блок данных показывает, насколько сильно различаются модели разных разработчиков. Так, по точности лидирует Gemini 3 Preview от Google – 54%, далее идут Claude Opus 4.5 от Anthropic – 43% и Grok 4 от xAI – 40%. Более свежие версии больших языковых моделей показывают умеренные результаты: GPT-5.1 от OpenAI – 35%, Claude 4.5 Sonnet от Anthropic – 31%.


По уровню галлюцинаций наиболее последовательной оказалась Claude 4.5 Haiku от Anthropic – 26%, но многие модели ошибаются значительно чаще. Среди них – Grok 4 от xAI (64%), Kimi K2 0905 от Moonshot (69%), Llama Nemotron Super 49B от Nvidia/Meta* (76%), DeepSeek R1 от DeepSeek (83%), EXAONE 4.032B от LG AI Research (86%). Некоторые версии Gemini от Google и открытые модели gpt-oss показывают еще более высокий уровень ошибок – свыше 88-93% Такие различия значат, что даже крупные языковые модели ведущих компаний могут вести себя непредсказуемо в сложных или неоднозначных задачах.


Результаты демонстрируют существенный разрыв между точностью и безопасностью ответов. Модели могут показывать приемлемую долю корректных результатов, но при этом регулярно выдавать уверенные, но ошибочные ответы. Аналитики отмечают, что такие расхождения повышают риск некорректных интерпретаций и требуют учета при выборе и внедрении ИИ-систем.


Подобные риски подтверждаются и академическими исследованиями. Работа международной группы ученых, опубликованная в Digital Medicine, показала, что мультимодальные нейромодели резко теряют точность при ухудшении качества медицинских изображений. Легкое размытие или цифровой шум снижали корректность на 3-10%, а серьезные искажения – на десятки процентов. На отдельных типах данных точность падала до 30-40%, а способность отличать норму от патологии ухудшалась почти на 80%. При этом модели практически никогда не предупреждали о плохом качестве снимка и продолжали выдавать уверенные, но ошибочные заключения.


Другое международное исследование выявило, что большие языковые модели остаются нестабильными в задачах персонализированных рекомендаций по долголетию. Семь систем протестировали на 1 000 клинических сценариев с использованием 25 виртуальных профилей пациентов. Качество рекомендаций заметно различалось: GPT-4o от OpenAI достигала около 90% соответствия медицинским критериям, тогда как модели Meta, Alibaba и DeepSeek часто не превышали 60%. Авторы отмечали, что ИИ нередко дает неполные или чрезмерно осторожные ответы, что ограничивает его применение без экспертного контроля.


Ранее, в 2024 году, Associated Press сообщала о серьезных сбоях в медицинских транскрибациях на основе модели Whisper от OpenAI. По данным расследования, ошибки и «галлюцинации» обнаруживались в большинстве записей – в отдельных оценках до восьми из десяти расшифровок. Алгоритм путал диагнозы, подменял назначения и даже «добавлял» несуществующие препараты, а оригинальные аудиофайлы автоматически удалялись, не позволяя врачам проверить корректность транскрипций. 


Эксперты из Artificial Analysis подчеркивают, что надежность остается ключевым ограничением для широкого применения ИИ. Рост вычислительных возможностей и появление новых моделей не приводят к пропорциональному улучшению качества ответов: поведение систем, особенно в неоднозначных ситуациях, остается нестабильным. По мнению аналитиков, индустрии необходимы единые стандарты оценки и методы контроля, которые позволят объективно измерять риски и выбирать наиболее устойчивые модели.


* Meta признана экстремистской организацией и запрещена в России

Пред.

FDA планирует сократить исследования моноклональных антител на приматах

След.

наука плюс бизнес»

СвязанныеСообщения

На Совете ректоров медицинских и фармацевтических вузов обсудили системное решение задач кадрового обеспечения в здравоохранении
В России

На Совете ректоров медицинских и фармацевтических вузов обсудили системное решение задач кадрового обеспечения в здравоохранении

22.12.2025
«Ригла» взяла в управление «Столичные аптеки»
Новости медицины и фармации

«Ригла» взяла в управление «Столичные аптеки»

10.12.2025
Формула доступа в систему здравоохранения
Новости медицины и фармации

Формула доступа в систему здравоохранения

10.12.2025
След.
наука плюс бизнес»

наука плюс бизнес»

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Товары

  • Mcminns Interactive Clinical Anatomy Mcminns Interactive Clinical Anatomy 342 ₽
  • Hurst’s The Heart Hurst's The Heart 342 ₽
  • Principles and Practice of Endocrinology and Metabolism Principles and Practice of Endocrinology and Metabolism 342 ₽
  • Principles and Practice of Oncology 5th Edition Principles and Practice of Oncology 5th Edition 274 ₽

Товары

  • Rheumatology Books 3 Rheumatology Books 3 342 ₽
  • Humanscope Male Humanscope Male 342 ₽
  • War medicine books War medicine books 342 ₽
  • Molecular Biotechnology 1994-2010 Molecular Biotechnology 1994-2010 342 ₽
  • Campbells Operative Orthopaedics 11 edition Campbells Operative Orthopaedics 11 edition 342 ₽

Метки

AstraZeneca FDA RNC Pharma Алексей Водовозов ВОЗ Вакцина Лекарства Минздрав Москва Подкасты Производство Роспотребнадзор ФАС вакцинация вакцинация от коронавирусной инфекции видеолекции дети исследование исследования клинические исследования книги для врачей коронавирус коронавирус 2019 коронавирус 2021 коронавирусная инфекция мероприятия новости Remedium новости медицины онкология опрос подкаст продажи проект разработка рак регистрация рост рынок лекарств сахарный диабет сделка статьи для врачей сша фармацевтика фармация фармрынок РФ

Свежие записи

  • На Совете ректоров медицинских и фармацевтических вузов обсудили системное решение задач кадрового обеспечения в здравоохранении
  • Лекарственный препарат трифлуридин + [типирацил] от Сервье одобрен для медицинского применения в России по трем показаниям в терапии метастатического колоректального рака и метастатического рака желудка
  • «Инфарма» обсудила международные регуляторные практики на 2-ом Международном форуме фармацевтических инспекторов
  • Ассоциация флебологов России и компания «Сервье» подписали меморандум о сотрудничестве
  • «Ригла» взяла в управление «Столичные аптеки»
  • О нас
  • Реклама
  • Политика конфиденциальности
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Добро пожаловать!

Войдите в свой аккаунт ниже

Забыли пароль?

Восстановите ваш пароль

Пожалуйста, введите ваше имя пользователя или адрес электронной почты, чтобы сбросить пароль.

Вход
Нет результата
Просмотреть все результаты
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Go to mobile version