Применение искусственного интеллекта для мониторинга и оценки качества скрининговых колоноскопий
Завьялов Д.В.,  Кашин С.В., Гусейнова С.Р., Федяй О.В.
ФГБОУ ВО «Ярославский государственный медицинский университет» Минздрава России
ГБУЗ ЯО «Областная клиническая онкологическая больница»
г. Ярославль
Введение
Актуальность использования ИИ при скрининговой колоноскопии определяется задачей повышения показателя выявления аденом и снижения доли пропущенных эпителиальных новообразований, что способствует профилактике колоректального рака (КРР). Даже при строгом соблюдении стандартов выполнения колоноскопии и всех критериев контроля качества доля пропущенных аденом остается значимой и может достигать 20−30%. Это формирует потребность в технологиях, повышающих объективность и воспроизводимость эндоскопической диагностики, включая ИИ-системы, функционирующие в режиме реального времени. В нашей стране и в мире наблюдаются тенденции к созданию высокоэффективных систем ИИ с целью повышения качества проведения скрининговой колоноскопии.
Цель исследования
Оценить возможность использования системы ИИ для автоматизированной оценки двух показателей качества колоноскопии: интубации слепой кишки и детекции эпителиальных новообразований толстой кишки с предварительной оценкой риска инвазивного роста.
Материалы и методы
Клиническим материалом исследования стали данные фото- и видеодокументации, полученные при выполнении колоноскопии в ГБУЗ Ярославской области «Клиническая онкологическая больница» и в ФГБОУ ВО «Ярославский государственный медицинский университет». Изображения создавались во время проведения колоноскопии, путем фотофиксации эндоскопом разных отделов толстой кишки, в том числе устья червеобразного отростка и эпителиальных новообразований. База данных была представлена изображениями с разрешениями 624×528 пикселей и 640×480 пикселей, полученные с эндоскопических систем Olympus® (Япония) EXERA III, и видеоколоноскопов: Olympus CF-Q180AL и Olympus CF-Q190AL.
Для проведения исследования по идентификации купола слепой кишки была использована база данных, состоящая из 103 видеопоследовательностей эндоскопических исследований толстой кишки, выполненных в ЯОКОБ. Область купола слепой кишки находилась на них в среднем в течение 1 минуты 19 секунд, таким образом нами использовался способ физической аугментации данных. На нейронную сеть подавался фрагмент видеоизображения разрешением 640×640 пикселей. Также были подготовлены обучающая (8436 изображений), валидационная (1024 изображений) и тестовая (1024 изображений) выборки эндоскопических изображений.
Вторая часть исследования включала в себя детекцию и характеристику эпителиальных новообразований толстой кишки. Для детекции области купола слепой кишки в видеопотоке использовался алгоритм на базе нейросетевой архитектуры YOLOv8 (You Only Look Once). Проблемой его практического использования является большое число ложных срабатываний. Для повышения точности работы алгоритма детекции купола слепой кишки (АДКС) в процесс обработки эндоскопических видеоизображений включен алгоритм трекинга объекта интереса (АДКТ) (рис. 4). Для решения задачи трекинга использовались алгоритмы OSTrack, ByteTrack и BoT-Sort. Для того чтобы отслеживать объекты на видеокадрах сначала выбирались наиболее важные для детектора кадры и таким образом они обновлялись, чтобы получить максимальную вероятность нахождения в них купола слепой кишки. 
Группой экспертов дополнительно была отобрана база данных из 200 изображений, из которых 100 представляли «положительный» класс с зоной устья аппендикса и «отрицательный» класс из 100 изображений без устья червеобразного отростка для проведения тестирования алгоритма. 
Вторая часть исследования включала разработку алгоритмов для автоматической детекции и оценки глубины инвазии колоректальных эпителиальных новообразований. На первом этапе нашей работы рабочей группой был реализован и протестирован комбинированный алгоритм, основанный на двух последовательных модулях: модуле детекции эпителиальных новообразований и модуле оценки уровня инвазии области интереса.
Учитывая динамический характер эндоскопического исследования, при котором новообразование может временно исчезать из поля зрения, смещаться или менять ракурс, был разработан дополнительный алгоритм и модуль оценки инвазии области интереса. Его задача — непрерывно отслеживать ранее детектированную область интереса на протяжении всей видеопоследовательности, обеспечивая стабильность анализа. Это позволило накапливать данные об эпителиальном новообразовании с разных углов и при различном освещении, что повысило надежность последующей оценки его характеристик, включая глубину инвазии. Другой подход — применение самообучающейся модели DINO (Deeper Into Neural Networks) для анализа видеопоследовательностей. В отличие от детекционных моделей (например, YOLO), DINO обучается самостоятельно на больших массивах немаркированных изображений, формируя обобщенные представления о визуальных данных. Это позволяет выделять и анализировать сложные паттерны, такие как динамика рельефа слизистой, микроархитектоника сосудов и текстуры тканей, которые важны для дифференцировки неинвазивных и инвазивных форм раннего рака толстой кишки.
Результаты
Клиническое применение разработанного алгоритма было реализовано следующим обрразов: программа с алгоритмом была инсталлирована на отдельный компьютер, установленный на эндоскопическую стойку и подключенный к рабочему монитору. При достижении эндоскопа анатомической области, расцениваемой системой как устье червеобразного отростка, включался визуальный ассистент в виде рамки по периферии экрана синего цвета (Рис. 1)
Рис. 1. Изображения с устьем червеобразного отростка в куполе слепой кишки с применением модуля ИИ в режиме реального времени.

а — устье червеобразного не определяется системой ИИ, так как эндоскопическое изображение нечеткое или не содержит устья (при достижении эндоскопом анатомической области, расцениваемой системой как устье червеобразного отростка, включается визуальный ассистент в виде рамки синего цвета по периферии экрана).
Рис. 1. Изображения с устьем червеобразного отростка в куполе слепой кишки с применением модуля ИИ в режиме реального времени.

б — устье червеобразного не определяется системой ИИ, так как эндоскопическое изображение нечеткое или не содержит устья (при достижении эндоскопом анатомической области, расцениваемой системой как устье червеобразного отростка, включается визуальный ассистент в виде рамки синего цвета по периферии экрана).
В ходе исследования были получены высокие показатели эффективности работы разработанного алгоритма. На валидационном наборе данных модель продемонстрировала наилучший результат с площадью под ROC-кривой (AUC), равной 0,97, и значением F1-меры 0,85 при оптимальном пороге вероятности th = 0,608. Последующая проверка обученной модели на независимом тестовом наборе подтвердила её надежность и обобщающую способность. Значение AUC составило 0,95, а F1-мера — 0,90.
Практическим результатом является скорость работы алгоритма. Среднее время анализа одного эндоскопического изображения составило 29 мс, что обеспечивает теоретическую пропускную способность системы до 40 кадров в секунду и позволяет осуществлять обработку видео в режиме реального времени. 
При детекции области толстой кишки, расцениваемой системой как эпителиальное новообразование, включается визуальный ассистент в виде рамки желтого цвета по периферии эпителиального новообразования в верхней строке которой отображается прогностический риск наличия поверхностной или глубокой инвазии опухолевого процесса, выражаемый в процентах (рис. 2).
Рис. 2. Пример положительной оценки наличия новообразования малых размеров с признаками злокачественности без глубокой инвазии (появление рамки желтого цвета по периферии изображения новообразования).
Заключение
Полученные результаты демонстрируют, что разработанный алгоритм классификации изображений устья червеобразного отростка и эпителиальных новообразований обладает высокой точностью для задач анализа эндоскопических изображений толстой кишки и может быть использован как основа для создания системы контроля качества проведения колоноскопии в режиме реального времени. Созданная нами ИИ-модель успешно решала обе ключевые задачи — подтверждение интубации слепой кишки и детекцию эпителиальных новообразований, достигая высоких значений точности и корректно определяя оба показателя на тестовой выборке фотоизображений (AUC = 0,9). Внедрение подобных технологий может обеспечить объективную оценку выполнения тотальной колоноскопии, автоматическую фотодокументацию ключевых этапов процедуры, а также стандартизированный аудит качества скрининговых исследований. Кроме того, данная система может служить эффективным инструментом обучения и повышения квалификации специалистов эндоскопических подразделений, особенно в условиях растущей нагрузки на эндоскопические подразделения и увеличения объемов проводимых скрининговых исследований.