2025 год стал этапом, на котором обсуждение искусственного интеллекта в медицине постепенно смещается от демонстрации высоких метрик точности к анализу клинической применимости.
Если ранее основным аргументом служили показатели AUC (площадь под ROC-кривой, интегральная мера способности модели различать наличие и отсутствие заболевания) и точности классификации на ретроспективных выборках, то в 2025 году появились рандомизированные исследования, прагматичные внедрения в реальный клинический процесс и регуляторные документы, описывающие требования к системам с возможностью обновления алгоритма.
Ниже — обзор направлений, в которых доказательная база действительно усилилась, и областей,
где интерпретация должна оставаться осторожной.
Скрининг рака молочной железы: рандомизированные данные
Исследование MASAI — одно из крупнейших рандомизированных исследований по интеграции ИИ
в национальную программу маммографического скрининга.
В выборку включено более 100 тысяч женщин. Сравнивались стандартная стратегия двойного чтения и модель с поддержкой ИИ.
Ключевые наблюдения:
- увеличение показателя выявляемости рака;
- отсутствие статистически значимого роста ложноположительных результатов;
- существенное снижение нагрузки на специалистов.
Для клинической практики это важный результат: впервые продемонстрировано улучшение показателей скрининга и оптимизация клинического процесса без явного роста вреда.
При этом остаются нерешённые вопросы:
- частота интервальных раков;
- влияние на гипердиагностику;
- долгосрочные исходы, включая смертность.
Таким образом, речь идёт о доказательствах влияния на организацию скрининга и показатели выявляемости, но не о завершённом ответе на вопрос о влиянии на конечные клинические исходы.
Эндоскопия: поддержка оптической диагностики
В 2025 году опубликованы данные рандомизированного исследования по использованию систем компьютерной классификации полипов для поддержки оптической диагностики мелких полипов.
Сравнивалась стратегия удаления всех полипов и подход сохранения in situ при уверенной классификации как не-неопластических.
Показатель выявления аденом оказался не ниже стандартной тактики. Осложнений, связанных
с процедурой, не отмечено.
Однако первичной конечной точкой был показатель выявления аденом — суррогатный маркер онкологической безопасности. Данные о долгосрочных исходах отсутствуют.
Следовательно, доказательная база позволяет обсуждать внедрение в центрах с высоким уровнем качества колоноскопии, но требует мониторинга клинических результатов.
Системы автоматического формирования медицинских записей
Прагматичные рандомизированные исследования 2025 года по системам автоматического формирования медицинских записей на основе аудиозаписи консультации показали:
- сокращение времени на оформление документации;
- снижение показателей эмоционального истощения;
- сохранение приемлемого качества записей при обязательной проверке врачом.
Важное наблюдение — выявление неточностей в автоматически сформированных текстах даже
в условиях контролируемого исследования.
Все модели использовались с обязательной финальной валидацией специалистом. Автономное принятие клинических решений системой не допускалось.
Практическая роль этих решений — оптимизация клинического процесса и снижение административной нагрузки, а не замещение врача.
Генеративные терапевтические системы
Опубликованное в 2025 году рандомизированное исследование генеративного чат-бота для пациентов с депрессивной и тревожной симптоматикой продемонстрировало статистически значимое снижение показателей по валидированным шкалам.
Однако:
- ответы системы просматривались обученным персоналом;
- фиксировались вмешательства при потенциально небезопасных ситуациях;
- корректировались клинически неподходящие рекомендации.
Эффективность продемонстрирована в условиях постоянного профессионального контроля. Данные не позволяют говорить о самостоятельном применении без участия специалиста.
Цифровая патология и молекулярная диагностика
В 2025 году опубликованы данные по моделям цифровой патологии, способным предсказывать молекулярный статус опухоли по гистологическим изображениям с внешней валидацией и проспективной оценкой в режиме скрытого тестирования без влияния на клинические решения.
Отдельное направление — ускоренная молекулярная классификация опухолей центральной нервной системы с использованием современных секвенирующих платформ и алгоритмов машинного анализа.
Метрики точности высоки. Однако большинство работ:
- остаются ретроспективными или квази-проспективными;
- не оценивают влияние на клинические исходы;
- предполагают использование в формате предварительной сортировки или оптимизации клинического процесса, а не полной замены молекулярных тестов.
Регуляторные изменения: управление жизненным циклом алгоритмов
В 2025 году регулятор выпустил документы, касающиеся управления жизненным циклом программных медицинских изделий с искусственным интеллектом и механизма предварительно утверждённого плана изменений алгоритма.
Суть подхода:
- алгоритмы рассматриваются как динамические системы;
- планируемые изменения должны быть заранее описаны;
- каждое обновление требует оценки влияния на безопасность и эффективность;
- обязателен пострегистрационный мониторинг.
Регуляторная рамка закрепляет необходимость контроля изменения характеристик алгоритма и управляемости обновлений.
Заключение
2025 год показал, что искусственный интеллект постепенно выходит из стадии демонстрационных метрик и начинает получать клинически релевантную оценку — в рандомизированных исследованиях, в реальном клиническом процессе и в регуляторных документах.
При этом большинство решений остаются вспомогательными инструментами: их эффективность подтверждается в рамках конкретных сценариев применения, при обязательном участии специалиста и при наличии процедур контроля качества.
Дальнейшая оценка должна смещаться от формальных показателей точности к анализу влияния на клинические исходы, безопасность и устойчивость результатов в разных популяциях и условиях внедрения.
Именно этот этап сейчас проходит медицинский искусственный интеллект.
