Recipe.Ru

В России разработали первую систему автоматического кодирования по МКБ-10

В России разработали первую систему автоматического кодирования по МКБ-10


В основе сервиса лежит открытый датасет RuCCoD, собранный из реальных медицинских заключений и размеченный врачами-экспертами по более чем 1,5 тысячи кодов МКБ-10. На этом материале были обучены современные языковые модели – BERT, Llama* и RAG, – которые автоматически извлекают описания заболеваний из текста и сопоставляют их с кодами классификатора. По результатам тестов алгоритмы обеспечивают более стабильное и точное кодирование по сравнению с ручной обработкой, что особенно важно для крупных клиник с большим потоком данных.


Помимо базовой задачи кодирования исследователи проверили, способен ли ИИ прогнозировать диагнозы по истории болезни пациента. Для этого использовалась закрытая база RuCCoD-DP, включающая 865 тысяч записей о приемах и 164 тысяч пациентов за период 2017–2021 годов. Оказалось, что если обучать модель на кодах, автоматически сгенерированных системой, точность возрастает почти в 2,5 раза. Особенно выраженный эффект наблюдается при распознавании редких заболеваний, где врачи чаще ошибаются при подборе точного кода.


Создатели проекта считают, что такие технологии помогут стандартизировать ведение медицинской документации, сократить нагрузку на врачей и повысить достоверность статистики, от которой зависят расчеты тарифов и планирование медицинской помощи. В перспективе RuCCoD может стать основой для автоматизированных модулей в системах электронных медицинских карт и аналитических платформах страховых компаний.


Разработка RuCCoD совпадает по целям с планами Минздрава РФ по созданию федерального регистра заболеваний, который начнет работу в 2026 году и станет частью Единой государственной информационной системы в сфере здравоохранения. В нем будут аккумулироваться сведения о пациентах с онкологическими, сердечно-сосудистыми, эндокринными и другими хроническими патологиями. Автоматизация кодирования диагнозов, на которой специализируется RuCCoD, может повысить качество и полноту данных, поступающих в такие государственные регистры.


Кроме того, появление RuCCoD оказалось особенно актуальным на фоне приостановки внедрения Международной классификации болезней одиннадцатого пересмотра (МКБ-11) в России. В мае 2024 года правительство решило временно отложить переход на новую систему, утвержденную ВОЗ, ссылаясь на большое количество обращений граждан и общественных организаций, а также необходимость дополнительно изучить зарубежный опыт интеграции. В результате российская медицина продолжит использовать МКБ-10. 


По мнению авторов проекта, именно такие решения, как RuCCoD, способны поддерживать развитие цифровой обработки медицинских данных, не дожидаясь перехода на новый стандарт. Исследование выполнено при поддержке Минэкономразвития РФ и ИСП РАН. В дальнейшем команда планирует расширить датасет, добавить новые источники медицинских текстов и повысить точность моделей при работе с редкими нозологиями.


*Продукт компании Meta, признанной экстремистской организацией и запрещенной в России


В основе сервиса лежит открытый датасет RuCCoD, собранный из реальных медицинских заключений и размеченный врачами-экспертами по более чем 1,5 тысячи кодов МКБ-10. На этом материале были обучены современные языковые модели – BERT, Llama* и RAG, – которые автоматически извлекают описания заболеваний из текста и сопоставляют их с кодами классификатора. По результатам тестов алгоритмы обеспечивают более стабильное и точное кодирование по сравнению с ручной обработкой, что особенно важно для крупных клиник с большим потоком данных.


Помимо базовой задачи кодирования исследователи проверили, способен ли ИИ прогнозировать диагнозы по истории болезни пациента. Для этого использовалась закрытая база RuCCoD-DP, включающая 865 тысяч записей о приемах и 164 тысяч пациентов за период 2017–2021 годов. Оказалось, что если обучать модель на кодах, автоматически сгенерированных системой, точность возрастает почти в 2,5 раза. Особенно выраженный эффект наблюдается при распознавании редких заболеваний, где врачи чаще ошибаются при подборе точного кода.


Создатели проекта считают, что такие технологии помогут стандартизировать ведение медицинской документации, сократить нагрузку на врачей и повысить достоверность статистики, от которой зависят расчеты тарифов и планирование медицинской помощи. В перспективе RuCCoD может стать основой для автоматизированных модулей в системах электронных медицинских карт и аналитических платформах страховых компаний.


Разработка RuCCoD совпадает по целям с планами Минздрава РФ по созданию федерального регистра заболеваний, который начнет работу в 2026 году и станет частью Единой государственной информационной системы в сфере здравоохранения. В нем будут аккумулироваться сведения о пациентах с онкологическими, сердечно-сосудистыми, эндокринными и другими хроническими патологиями. Автоматизация кодирования диагнозов, на которой специализируется RuCCoD, может повысить качество и полноту данных, поступающих в такие государственные регистры.


Кроме того, появление RuCCoD оказалось особенно актуальным на фоне приостановки внедрения Международной классификации болезней одиннадцатого пересмотра (МКБ-11) в России. В мае 2024 года правительство решило временно отложить переход на новую систему, утвержденную ВОЗ, ссылаясь на большое количество обращений граждан и общественных организаций, а также необходимость дополнительно изучить зарубежный опыт интеграции. В результате российская медицина продолжит использовать МКБ-10. 


По мнению авторов проекта, именно такие решения, как RuCCoD, способны поддерживать развитие цифровой обработки медицинских данных, не дожидаясь перехода на новый стандарт. Исследование выполнено при поддержке Минэкономразвития РФ и ИСП РАН. В дальнейшем команда планирует расширить датасет, добавить новые источники медицинских текстов и повысить точность моделей при работе с редкими нозологиями.


*Продукт компании Meta, признанной экстремистской организацией и запрещенной в России

Exit mobile version