Четверг, 11 сентября 2025
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
  • Вход
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты
Корзина / 0 ₽

Корзина пуста.

Нет результата
Просмотреть все результаты
Recipe.Ru
Нет результата
Просмотреть все результаты
Главная Новости Новости медицины и фармации

ChatGPT и DeepSeek превзошли студентов в тестах для медэкзамена

20.08.2025
в Новости медицины и фармации


ChatGPT-4o – продукт американской компании QpenAI, одна из самых популярных коммерческих моделей, доступная только по подписке. DeepSeek DeepThink R1 – китайская разработка, ориентированная на сложные задачи рассуждения и предоставляемая бесплатно.


Ученые использовали базу вопросов AMBOSS – популярный тренажер для подготовки к экзаменам USMLE в США. В анализ вошли задания разной тематики и сложности. Распределение вопросов в платформе AMBOSS характеризовалось смещением в сторону легкого уровня сложности: 2 554 легких вопроса (43,9%), 1 896 вопросов средней сложности (32,6%) и 1 373 сложных вопроса (23,6%). Для обеспечения сбалансированного представления каждого уровня сложности в анализе с помощью встроенного генератора случайных вопросов платформы AMBOSS было отобрано по 10 вопросов каждого уровня сложности для каждой категории, что в совокупности составило 540 вопросов для каждого экзамена.


Сбор результатов осуществлялся путем прямого копирования вопросов и вариантов ответов с веб-сайта AMBOSS и их последующей вставки в онлайн-версии моделей GPT-4o (последнее обновление: май 2024 года) и DeepSeek DeepThink R1 (последнее обновление: октябрь 2023 года) без каких-либо изменений. Каждый вопрос вводился индивидуально в чат-интерфейс большой языковой модели без дополнительных команд для обеспечения единообразия форматирования между обеими моделями. Для каждого вопроса регистрировался бинарный показатель правильности ответа модели с учетом уровня сложности вопроса.


На простых вопросах ChatGPT отвечал правильно в 95% случаев, DeepSeek – в 93%, тогда как студенты справлялись лишь в 76% случаев. На заданиях средней сложности показатели составили 89% y ChatGPT, 78% – у DeepSeck и 55% – у студентов. На самых трудных вопросах разрыв оказался максимальным: точность ChatGPT – 80%, DeepSeek – 63%, а у студентов всего 36%. Разработка OpenAI оказалась «умнее» своего китайского конкурента в части вопросов по эндокринологии, гастроэнтерологии, иммунологии, мультисистемных заболеваний и ряда других разделов, причем разрыв в результатах моделей был несущественным, когда акцент делался на клиническом мышлении.


По мнению исследователей, критический подход и проверка источников остаются ключевыми условиями при работе с ИИ-ассистентами. Только в таком сочетании новые технологии смогут повысить качество подготовки врачей и не снизить уровень их самостоятельного клинического мышления.


Пациенты тоже выражают настороженность. По данным апрельского опроса Центра общественной политики Анненберга, 79% взрослых американцев ищут информацию о здоровье в интернете и часто сталкиваются с ответами, сгенерированными ИИ, но почти половине (49%) некомфортно, когда врач опирается на такие инструменты вместо собственного опыта.


Компания OpenAI тем временем уже представила новое поколение модели – GPT-5, сделав акцент на ее медицинском потенциале. По данным компании, в тестах на платформе HealthBench, разработанной при участии 250 практикующих врачей, GPT-5 показала еще более высокую точность и качество ответов, превзойдя предыдущие версии. Модель уже применяется фармацевтическими и страховыми компаниями, а также внедряется в работу федеральных служб США.


ChatGPT-4o – продукт американской компании QpenAI, одна из самых популярных коммерческих моделей, доступная только по подписке. DeepSeek DeepThink R1 – китайская разработка, ориентированная на сложные задачи рассуждения и предоставляемая бесплатно.


Ученые использовали базу вопросов AMBOSS – популярный тренажер для подготовки к экзаменам USMLE в США. В анализ вошли задания разной тематики и сложности. Распределение вопросов в платформе AMBOSS характеризовалось смещением в сторону легкого уровня сложности: 2 554 легких вопроса (43,9%), 1 896 вопросов средней сложности (32,6%) и 1 373 сложных вопроса (23,6%). Для обеспечения сбалансированного представления каждого уровня сложности в анализе с помощью встроенного генератора случайных вопросов платформы AMBOSS было отобрано по 10 вопросов каждого уровня сложности для каждой категории, что в совокупности составило 540 вопросов для каждого экзамена.


Сбор результатов осуществлялся путем прямого копирования вопросов и вариантов ответов с веб-сайта AMBOSS и их последующей вставки в онлайн-версии моделей GPT-4o (последнее обновление: май 2024 года) и DeepSeek DeepThink R1 (последнее обновление: октябрь 2023 года) без каких-либо изменений. Каждый вопрос вводился индивидуально в чат-интерфейс большой языковой модели без дополнительных команд для обеспечения единообразия форматирования между обеими моделями. Для каждого вопроса регистрировался бинарный показатель правильности ответа модели с учетом уровня сложности вопроса.


На простых вопросах ChatGPT отвечал правильно в 95% случаев, DeepSeek – в 93%, тогда как студенты справлялись лишь в 76% случаев. На заданиях средней сложности показатели составили 89% y ChatGPT, 78% – у DeepSeck и 55% – у студентов. На самых трудных вопросах разрыв оказался максимальным: точность ChatGPT – 80%, DeepSeek – 63%, а у студентов всего 36%. Разработка OpenAI оказалась «умнее» своего китайского конкурента в части вопросов по эндокринологии, гастроэнтерологии, иммунологии, мультисистемных заболеваний и ряда других разделов, причем разрыв в результатах моделей был несущественным, когда акцент делался на клиническом мышлении.


По мнению исследователей, критический подход и проверка источников остаются ключевыми условиями при работе с ИИ-ассистентами. Только в таком сочетании новые технологии смогут повысить качество подготовки врачей и не снизить уровень их самостоятельного клинического мышления.


Пациенты тоже выражают настороженность. По данным апрельского опроса Центра общественной политики Анненберга, 79% взрослых американцев ищут информацию о здоровье в интернете и часто сталкиваются с ответами, сгенерированными ИИ, но почти половине (49%) некомфортно, когда врач опирается на такие инструменты вместо собственного опыта.


Компания OpenAI тем временем уже представила новое поколение модели – GPT-5, сделав акцент на ее медицинском потенциале. По данным компании, в тестах на платформе HealthBench, разработанной при участии 250 практикующих врачей, GPT-5 показала еще более высокую точность и качество ответов, превзойдя предыдущие версии. Модель уже применяется фармацевтическими и страховыми компаниями, а также внедряется в работу федеральных служб США.

Пред.

FDA отказало PTC в регистрации препарата для лечения генетического заболевания

След.

«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

СвязанныеСообщения

В 2025 г. розничные продажи тест‑полосок для глюкометров растут исключительно за счет онлайн‑канала
Новости медицины и фармации

В 2025 г. розничные продажи тест‑полосок для глюкометров растут исключительно за счет онлайн‑канала

10.09.2025
«ВЕРТЕКС» инвестировал 190 млн рублей в оснащение производства
Новости медицины и фармации

«ВЕРТЕКС» инвестировал 190 млн рублей в оснащение производства

10.09.2025
Испания вводит запрет на курение в парках и на открытых площадках
Новости медицины и фармации

Испания вводит запрет на курение в парках и на открытых площадках

10.09.2025
След.
«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

«Роснано» выставило на торги фармкомпанию «НоваМедика Иннотех»

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Товары

  • Physicians’ Cancer Chemotherapy Drug Manual 2006 Physicians' Cancer Chemotherapy Drug Manual 2006 274 ₽
  • The World Jornal of Hernia and Abdominal Wall Surgery The World Jornal of Hernia and Abdominal Wall Surgery 342 ₽
  • Colloid and Polymer Science 1974-2010 Colloid and Polymer Science 1974-2010 684 ₽
  • Chemistry Books 15 Chemistry Books 15 342 ₽

Товары

  • Clinical Pharmacology 2007 (2 CD) Clinical Pharmacology 2007 (2 CD) 684 ₽
  • Кардиологические конгрессы Кардиологические конгрессы 342 ₽
  • ADAM Interactive Physiology Nervous System ADAM Interactive Physiology Nervous System 342 ₽
  • Arthroscopic Surgery Arthroscopic Surgery 342 ₽
  • Transtibial ACL Reconstruction with Hamstring Tendon Graft and B Transtibial ACL Reconstruction with Hamstring Tendon Graft and B 342 ₽

Метки

AstraZeneca FDA RNC Pharma Алексей Водовозов ВОЗ Вакцина Заметки врача Лекарства Минздрав Москва Подкасты Производство Слушать подкасты бесплатно онлайн ФАС вакцинация вакцинация от коронавирусной инфекции видеолекции дети здравоохранение РФ исследование исследования клинические исследования книги для врачей коронавирус коронавирус 2019 коронавирус 2021 коронавирусная инфекция мероприятия новости Remedium новости медицины онкология опрос подкаст продажи разработка рак регистрация рост рынок лекарств слушать подкаст онлайн статьи для врачей сша фармацевтика фармация фармрынок РФ

Свежие записи

  • В 2025 г. розничные продажи тест‑полосок для глюкометров растут исключительно за счет онлайн‑канала
  • «ВЕРТЕКС» инвестировал 190 млн рублей в оснащение производства
  • Испания вводит запрет на курение в парках и на открытых площадках
  • Глюкометры, тонометры, эндопротезы и наборы реагентов включат в перечень маркировки
  • Препараты Regeneron вдвое облегчили симптомы аллергии на кошек и пыльцу березы
  • О нас
  • Реклама
  • Политика конфиденциальности
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Добро пожаловать!

Войдите в свой аккаунт ниже

Забыли пароль?

Восстановите ваш пароль

Пожалуйста, введите ваше имя пользователя или адрес электронной почты, чтобы сбросить пароль.

Вход
Нет результата
Просмотреть все результаты
  • Главная
  • Новости
    • Новости медицины и фармации
    • Пресс-релизы
    • Добавить новость/пресс-релиз
  • Документы
    • Госреестр ЛС
    • Госреестр предельных отпускных цен
    • Нормативная документация
      • Общие положения
      • Управление в сфере здравоохранения
      • Медицинское страхование
      • Медицинские учреждения
      • Медицинские и фармацевтические работники
      • Бухгалтерский учет и отчетность
      • Медицинская документация Учет и отчетность
      • Обеспечение населения лекарственными средствами и изделиями медицинского назначения
      • Медицинская деятельность
      • Санитарно-эпидемиологическое благополучие населения
      • Ветеринария
    • Госреестр медизделий
    • Реестр разрешений на КИ медизделий
    • Реестр уведомлений о деятельности в обращении медизделий
    • Разрешения на ввоз медизделий
    • Изъятие ЛС
    • МКБ-10
  • Магазин
    • Медицина
    • Фармация
    • Биология, биохимия
    • Химия
  • Контакты

© 1999 - 2022 Recipe.Ru - фармацевтический информационный сайт.

Go to mobile version