Акушерство и Гинекология №10 / 2021
Применение алгоритмов машинного обучения в патоморфологии и вспомогательных репродуктивных технологиях
1) ФГБУ «Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени академика В.И. Кулакова» Минздрава России, Москва, Россия;
2) ФГБУН «Институт системного программирования им. В.П. Иванникова» Российской академии наук, Москва, Россия;
3) ФГАОУ ВО «Российский университет дружбы народов», Министерства науки и высшего образования Российской Федерации, Москва, Россия
Модели машинного обучения повсеместно применяются для анализа изображений, сигналов и видео. На первый взгляд, это хорошо разработанный процесс, сводящийся к этапам сбора данных, разметке, обучению модели и в итоге – ее применению в той или иной области (распознавание автомобильных номеров, лиц в смартфонах и т.д.). Однако в области медицины все гораздо сложнее: применение моделей искусственного интеллекта – серьезный вызов. Методы машинного обучения становятся все более и более используемыми в морфологических науках и биомедицинских исследованиях. Внедрение искусственного интеллекта для анализа изображений позволяет снизить нагрузку на оператора (патолога, гистолога), исключить фактор субъективной оценки и снизить вероятность ошибки. В данном обзоре приводится краткий экскурс в историю возникновения методов машинного обучения, рассматриваются примеры их использования в двух областях, где они получили наибольшее распространение – патоморфологии и вспомогательных репродуктивных технологиях, а также указываются ограничения и сложности, с которыми сталкиваются разработчики при обучении нейронных сетей.
Заключение: Авторами также предлагаются решения для преодоления трудностей связанных со сбором, совместной разметкой данных и обучением моделей: создание инфраструктуры высокого качества, привлечение высококвалифицированных специалистов, размечающих данные, передовой научный подход к технологиям искусственного интеллекта, в качестве основы для масштабируемого хранения и анализа биомедицинских данных предлагается использовать облачные платформы.
Историческая справка
Методы глубокого машинного обучения разработаны еще в 1960-е гг., но из-за низкой производственной мощности компьютеров они не нашли массового применения и вновь проявили себя уже только в 2012 г., когда сверточная нейронная сеть (НС) выиграла у классических конкурс алгоритмов распознавания изображений [1]. К сожалению, до сих пор данные технологии недостаточно широко применяются для анализа изображений при микроскопической визуализации клеток, тканей и органов в биологии и медицине. Это прежде всего обусловлено техническими сложностями получения большого количества воспроизводимых по качеству микроскопических изображений анализируемых объектов.
Одной из областей, где машинное обучение получило наибольшее распространение, является патоморфология. Сканирование и оцифровка препаратов позволили перейти от техники микроскопирования к визуализации всего препарата целиком в сверхвысоком разрешении, размечать и использовать эти изображения для решения задач классификации, семантической сегментации и детекции объектов с помощью глубоких НС, что дало начало целому направлению – digital pathology. В PubMed при поисковом запросе «histopathology neural network» за последние 5 лет обнаруживаются тысячи статей и с каждым годом их количество растет (https://pubmed.ncbi.nlm.nih.gov/?term=histopathology+neural+network&filter=datesearch.y_5). Это свидетельствует о том, что технические возможности, наконец, достигли необходимого уровня, и данная тематика становится актуальной, но все еще малоисследованной. При этом микроскопическая морфология содержит тысячи различных объектов, характеристики которых можно получать и анализировать с помощью современных компьютеров и программного обеспечения. Морфологические науки достигли некоторого предела своего развития, а с помощью машинного обучения (и глубоких НС, в частности) морфометрия может приобрести интенсивное развитие благодаря внедрению цифровизации и алгоритмизации исследований в цитологии, гистологии, эмбриологии и патологической анатомии.
Машинное обучение в патоморфологии
Исходным материалом для анализа и машинного обучения в морфологических науках являются микроскопические изображения субклеточных структур, клеток, тканей, органов и даже целых организмов, которые можно получать с помощью электронной, световой, фазово-контрастной, флуоресцентной и других видов микроскопии. При этом необходимо соблюдать два основных условия: 1) изображения должны быть качественно воспроизводимыми и 2) изображений должно быть много (от сотен тысяч, и чем изображений больше, тем точнее анализ). Современные сканеры гистологических препаратов, тайм-лапс микроскопы и пополняющиеся открытые базы данных позволяют получать огромное количество качественных изображений самых разных биологических объектов для обучения НС, но эффективные инструменты анализа таких данных развиваются с существенным отставанием. Использование сверточных НС позволяет разработать подобные инструменты в самых различных областях.
При использовании НС для семантической сегментации гистологических изображений задачи формулируются таким образом, чтобы находить конкретные структурные элементы или морфологические паттерны в изучаемом объекте. Для обучений НС необходимо определить целевые структуры или паттерны структур, несущих или ненесущих (по принципу +/-, есть/нет) какой-либо признак (или признаки), количественная оценка совокупного присутствия которого сигнализирует о нарушении структуры клетки/ткани/органа/организма. К сожалению, такой подход обучения НС по заданным паттернам не позволяет искусственному интеллекту самостоятельно найти какие-либо новые, неизвестные человеку различия между патологическими процессами.
Подавляющее большинство публикаций по глубокому обучению в медицине посвящено использованию НС в онкоморфологии – наиболее актуальному и востребованному направлению патологической анатомии. Задача машинного обучения в патологической анатомии сводится к тому, чтобы отличить опухолевую ткань от нормальной и в данной области уже достигнуты некоторые успехи. J. Ker et al. [1] продемонстрировали, что НС без ошибок различает нормальную ткань мозга от глиобластомы, а при разделении нормальной ткани молочной железы от рака in situ допускает менее 10% ошибок. Другие авторы [2] добились уровня ошибки менее 3% при разделении доброкачественных и злокачественных опухолей молочной железы. Yan et al. получили схожие результаты: ошибки при дифференцировке злокачественных инвазивных и in situ опухолей от нормальных тканей составили 5% и 3%, соответственно, в то время как при определении доброкачественных опухолей их уровень был несколько выше – до 13% [3]. Hekler et al. [4] при дифференциальном разделении невуса и меланомы продемонстрировали точность, составившую 68% и оказавшуюся статистически выше, чем при анализе, проведенном на том же материале патологоанатомами (59%). Таким образом, можно заключить, что с относительно несложными задачами НС справляется не хуже квалифицированного специ...