Четверг, 23 октября 2025
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
  • Вход
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
Нет результата
Просмотреть все результаты
Главная Новости Новости медицины и фармации

ChatGPT и DeepSeek превзошли студентов в тестах для медэкзамена

20.08.2025
в Новости медицины и фармации


ChatGPT-4o – продукт американской компании QpenAI, одна из самых популярных коммерческих моделей, доступная только по подписке. DeepSeek DeepThink R1 – китайская разработка, ориентированная на сложные задачи рассуждения и предоставляемая бесплатно.


Ученые использовали базу вопросов AMBOSS – популярный тренажер для подготовки к экзаменам USMLE в США. В анализ вошли задания разной тематики и сложности. Распределение вопросов в платформе AMBOSS характеризовалось смещением в сторону легкого уровня сложности: 2 554 легких вопроса (43,9%), 1 896 вопросов средней сложности (32,6%) и 1 373 сложных вопроса (23,6%). Для обеспечения сбалансированного представления каждого уровня сложности в анализе с помощью встроенного генератора случайных вопросов платформы AMBOSS было отобрано по 10 вопросов каждого уровня сложности для каждой категории, что в совокупности составило 540 вопросов для каждого экзамена.


Сбор результатов осуществлялся путем прямого копирования вопросов и вариантов ответов с веб-сайта AMBOSS и их последующей вставки в онлайн-версии моделей GPT-4o (последнее обновление: май 2024 года) и DeepSeek DeepThink R1 (последнее обновление: октябрь 2023 года) без каких-либо изменений. Каждый вопрос вводился индивидуально в чат-интерфейс большой языковой модели без дополнительных команд для обеспечения единообразия форматирования между обеими моделями. Для каждого вопроса регистрировался бинарный показатель правильности ответа модели с учетом уровня сложности вопроса.


На простых вопросах ChatGPT отвечал правильно в 95% случаев, DeepSeek – в 93%, тогда как студенты справлялись лишь в 76% случаев. На заданиях средней сложности показатели составили 89% y ChatGPT, 78% – у DeepSeck и 55% – у студентов. На самых трудных вопросах разрыв оказался максимальным: точность ChatGPT – 80%, DeepSeek – 63%, а у студентов всего 36%. Разработка OpenAI оказалась «умнее» своего китайского конкурента в части вопросов по эндокринологии, гастроэнтерологии, иммунологии, мультисистемных заболеваний и ряда других разделов, причем разрыв в результатах моделей был несущественным, когда акцент делался на клиническом мышлении.


По мнению исследователей, критический подход и проверка источников остаются ключевыми условиями при работе с ИИ-ассистентами. Только в таком сочетании новые технологии смогут повысить качество подготовки врачей и не снизить уровень их самостоятельного клинического мышления.


Пациенты тоже выражают настороженность. По данным апрельского опроса Центра общественной политики Анненберга, 79% взрослых американцев ищут информацию о здоровье в интернете и часто сталкиваются с ответами, сгенерированными ИИ, но почти половине (49%) некомфортно, когда врач опирается на такие инструменты вместо собственного опыта.


Компания OpenAI тем временем уже представила новое поколение модели – GPT-5, сделав акцент на ее медицинском потенциале. По данным компании, в тестах на платформе HealthBench, разработанной при участии 250 практикующих врачей, GPT-5 показала еще более высокую точность и качество ответов, превзойдя предыдущие версии. Модель уже применяется фармацевтическими и страховыми компаниями, а также внедряется в работу федеральных служб США.


ChatGPT-4o – продукт американской компании QpenAI, одна из самых популярных коммерческих моделей, доступная только по подписке. DeepSeek DeepThink R1 – китайская разработка, ориентированная на сложные задачи рассуждения и предоставляемая бесплатно.


Ученые использовали базу вопросов AMBOSS – популярный тренажер для подготовки к экзаменам USMLE в США. В анализ вошли задания разной тематики и сложности. Распределение вопросов в платформе AMBOSS характеризовалось смещением в сторону легкого уровня сложности: 2 554 легких вопроса (43,9%), 1 896 вопросов средней сложности (32,6%) и 1 373 сложных вопроса (23,6%). Для обеспечения сбалансированного представления каждого уровня сложности в анализе с помощью встроенного генератора случайных вопросов платформы AMBOSS было отобрано по 10 вопросов каждого уровня сложности для каждой категории, что в совокупности составило 540 вопросов для каждого экзамена.


Сбор результатов осуществлялся путем прямого копирования вопросов и вариантов ответов с веб-сайта AMBOSS и их последующей вставки в онлайн-версии моделей GPT-4o (последнее обновление: май 2024 года) и DeepSeek DeepThink R1 (последнее обновление: октябрь 2023 года) без каких-либо изменений. Каждый вопрос вводился индивидуально в чат-интерфейс большой языковой модели без дополнительных команд для обеспечения единообразия форматирования между обеими моделями. Для каждого вопроса регистрировался бинарный показатель правильности ответа модели с учетом уровня сложности вопроса.


На простых вопросах ChatGPT отвечал правильно в 95% случаев, DeepSeek – в 93%, тогда как студенты справлялись лишь в 76% случаев. На заданиях средней сложности показатели составили 89% y ChatGPT, 78% – у DeepSeck и 55% – у студентов. На самых трудных вопросах разрыв оказался максимальным: точность ChatGPT – 80%, DeepSeek – 63%, а у студентов всего 36%. Разработка OpenAI оказалась «умнее» своего китайского конкурента в части вопросов по эндокринологии, гастроэнтерологии, иммунологии, мультисистемных заболеваний и ряда других разделов, причем разрыв в результатах моделей был несущественным, когда акцент делался на клиническом мышлении.


По мнению исследователей, критический подход и проверка источников остаются ключевыми условиями при работе с ИИ-ассистентами. Только в таком сочетании новые технологии смогут повысить качество подготовки врачей и не снизить уровень их самостоятельного клинического мышления.


Пациенты тоже выражают настороженность. По данным апрельского опроса Центра общественной политики Анненберга, 79% взрослых американцев ищут информацию о здоровье в интернете и часто сталкиваются с ответами, сгенерированными ИИ, но почти половине (49%) некомфортно, когда врач опирается на такие инструменты вместо собственного опыта.


Компания OpenAI тем временем уже представила новое поколение модели – GPT-5, сделав акцент на ее медицинском потенциале. По данным компании, в тестах на платформе HealthBench, разработанной при участии 250 практикующих врачей, GPT-5 показала еще более высокую точность и качество ответов, превзойдя предыдущие версии. Модель уже применяется фармацевтическими и страховыми компаниями, а также внедряется в работу федеральных служб США.

Пред.

FDA отказало PTC в регистрации препарата для лечения генетического заболевания

След.

«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

СвязанныеСообщения

Alkermes заключает сделку по приобретению Avadel за 2,1 млрд долларов США
Новости медицины и фармации

Alkermes заключает сделку по приобретению Avadel за 2,1 млрд долларов США

23.10.2025
чат-боты с ИИ регулярно нарушают этические стандарты психотерапии
Новости медицины и фармации

чат-боты с ИИ регулярно нарушают этические стандарты психотерапии

23.10.2025
Анализ метаболитов крови собак раскрывает процессы здорового старения у человека
Новости медицины и фармации

Анализ метаболитов крови собак раскрывает процессы здорового старения у человека

23.10.2025
След.
«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Товары

  • TransFix II ACL Reconstruction Using the Bio-TransFix Implant TransFix II ACL Reconstruction Using the Bio-TransFix Implant 342 ₽
  • The Johns Hopkins Atlas of Digital EEG The Johns Hopkins Atlas of Digital EEG 342 ₽
  • 3-Point Shoulder Distraction System and S.T.a.R™ Sleeve. Instruc 3-Point Shoulder Distraction System and S.T.a.R™ Sleeve. Instruc 342 ₽
  • Stomatology Books DVD Stomatology Books DVD 1,027 ₽

Товары

  • The Encyclopaedia of Medical Imaging The Encyclopaedia of Medical Imaging 342 ₽
  • Advances in Polymer Science Advances in Polymer Science 342 ₽
  • Переломы плечевой кости Переломы плечевой кости 342 ₽
  • The Fundamental TextBook of Immunology Paul William 4 Edition The Fundamental TextBook of Immunology Paul William 4 Edition 479 ₽
  • Frank Netter Interactive Atlas Human Anatomy Cardiovascular Edit Frank Netter Interactive Atlas Human Anatomy Cardiovascular Edit 479 ₽

Метки

AstraZeneca FDA RNC Pharma Алексей Водовозов ВОЗ Вакцина Заметки врача Лекарства Минздрав Москва Подкасты Производство Слушать подкасты бесплатно онлайн ФАС вакцинация вакцинация от коронавирусной инфекции видеолекции дети исследование исследования клинические исследования книги для врачей коронавирус коронавирус 2019 коронавирус 2021 коронавирусная инфекция мероприятия новости Remedium новости медицины онкология опрос подкаст продажи разработка рак регистрация рост рынок лекарств сделка слушать подкаст онлайн статьи для врачей сша фармацевтика фармация фармрынок РФ

Свежие записи

  • Alkermes заключает сделку по приобретению Avadel за 2,1 млрд долларов США
  • чат-боты с ИИ регулярно нарушают этические стандарты психотерапии
  • Анализ метаболитов крови собак раскрывает процессы здорового старения у человека
  • Контакт «кожа к коже» между новорожденным и матерью укрепляет здоровье ребенка
  • Минздрав России с 23 октября 2025 года объявляет конкурс на включение в кадровый резерв
  • О нас
  • Реклама
  • Политика конфиденциальности
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Добро пожаловать!

Войдите в свой аккаунт ниже

Забыли пароль?

Восстановите ваш пароль

Пожалуйста, введите ваше имя пользователя или адрес электронной почты, чтобы сбросить пароль.

Вход
Нет результата
Просмотреть все результаты
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Go to mobile version