STPath обучена на одном из самых крупных наборов данных, когда-либо использованных в пространственной транскриптомике: 983 цифровых слайда, 17 органов и 38 тысяч генов, охваченных в единой модели. Кроме того, в STPath вошли данные, полученные четырьмя разными технологиями. Такой масштаб позволил создать универсальный алгоритм, который сразу работает с разными типами тканей и не требует дополнительной настройки под конкретный набор генов.
Модель объединяет в одном представлении изображение ткани, данные об органе, технологию секвенирования и фрагменты транскриптомной информации. За счет такой многокомпонентной структуры STPath восстанавливает пространственный профиль экспрессии точнее существующих методов. При проверке на 23 отдельных наборах данных STPath стабильно показывала лучшие результаты: качество предсказаний было выше примерно на 7% по одной ключевой метрике и на 14% по другой. На некоторых типах рака показатели были особенно высокими – совпадение результатов с реальными измерениями достигало примерно 75% для опухолей молочной железы и около 60% для меланомы.
Отдельно исследователи проверили, как STPath справляется с задачами без дополнительного обучения. В автономном режиме модель уверенно распознавала отдельные маркеры: например, при раке молочной железы она показывала около 73% точности при определении статуса гена TP53 – показатель, сопоставимый с лабораторными тестами.
Авторы также оценили, может ли STPath усиливать прикладные клинические модели. После добавления ее данных точность прогноза выживаемости увеличивалась на 5-6%, а определение мутаций ключевых онкогенов улучшалось примерно на 5%.
Исследователи считают, что STPath может значительно ускорить развитие цифровой патоморфологии. Модель позволяет получать данные, близкие к транскриптомным, по обычным гистологическим изображениям, без применения сложных экспериментальных протоколов. Это повышает скорость диагностики, помогает точнее выявлять опухолевые зоны, улучшает стратификацию пациентов и делает продвинутые методы анализа доступнее для клиник.
Команда планирует расширить обучающую базу, добавить другие типы данных и протестировать модель в клинических сценариях на редких типах опухолей. По оценке разработчиков, универсальные ИИ-системы, подобные STPath, в ближайшие годы могут стать одним из ключевых инструментов для онкодиагностики и персонализированного лечения.
Разработка STPath вписывается в более широкий технологический тренд. Согласно обзору, ранее опубликованному в журнале Digital Medicine, именно мультимодальные модели, объединяющие генетические, клинические и визуальные данные, сегодня считаются главным направлением развития технологий. Анализ публикаций и патентов за 2010-2025 годы показывает, что интерес к таким системам растет стремительно: рынок мультимодального ИИ в фармацевтике и биотехнологиях, по прогнозам, увеличится с $1,8 млрд в 2023 году до $13 млрд к 2034 году при среднегодовом росте около 19%.
STPath обучена на одном из самых крупных наборов данных, когда-либо использованных в пространственной транскриптомике: 983 цифровых слайда, 17 органов и 38 тысяч генов, охваченных в единой модели. Кроме того, в STPath вошли данные, полученные четырьмя разными технологиями. Такой масштаб позволил создать универсальный алгоритм, который сразу работает с разными типами тканей и не требует дополнительной настройки под конкретный набор генов.
Модель объединяет в одном представлении изображение ткани, данные об органе, технологию секвенирования и фрагменты транскриптомной информации. За счет такой многокомпонентной структуры STPath восстанавливает пространственный профиль экспрессии точнее существующих методов. При проверке на 23 отдельных наборах данных STPath стабильно показывала лучшие результаты: качество предсказаний было выше примерно на 7% по одной ключевой метрике и на 14% по другой. На некоторых типах рака показатели были особенно высокими – совпадение результатов с реальными измерениями достигало примерно 75% для опухолей молочной железы и около 60% для меланомы.
Отдельно исследователи проверили, как STPath справляется с задачами без дополнительного обучения. В автономном режиме модель уверенно распознавала отдельные маркеры: например, при раке молочной железы она показывала около 73% точности при определении статуса гена TP53 – показатель, сопоставимый с лабораторными тестами.
Авторы также оценили, может ли STPath усиливать прикладные клинические модели. После добавления ее данных точность прогноза выживаемости увеличивалась на 5-6%, а определение мутаций ключевых онкогенов улучшалось примерно на 5%.
Исследователи считают, что STPath может значительно ускорить развитие цифровой патоморфологии. Модель позволяет получать данные, близкие к транскриптомным, по обычным гистологическим изображениям, без применения сложных экспериментальных протоколов. Это повышает скорость диагностики, помогает точнее выявлять опухолевые зоны, улучшает стратификацию пациентов и делает продвинутые методы анализа доступнее для клиник.
Команда планирует расширить обучающую базу, добавить другие типы данных и протестировать модель в клинических сценариях на редких типах опухолей. По оценке разработчиков, универсальные ИИ-системы, подобные STPath, в ближайшие годы могут стать одним из ключевых инструментов для онкодиагностики и персонализированного лечения.
Разработка STPath вписывается в более широкий технологический тренд. Согласно обзору, ранее опубликованному в журнале Digital Medicine, именно мультимодальные модели, объединяющие генетические, клинические и визуальные данные, сегодня считаются главным направлением развития технологий. Анализ публикаций и патентов за 2010-2025 годы показывает, что интерес к таким системам растет стремительно: рынок мультимодального ИИ в фармацевтике и биотехнологиях, по прогнозам, увеличится с $1,8 млрд в 2023 году до $13 млрд к 2034 году при среднегодовом росте около 19%.



