Эпидемиология и Инфекционные болезни. Актуальные вопросы №1 / 2024

Кластеризация стандартизованных показателей кумулятивной инцидентности за многолетний период как метод анализа пространственного распределения случаев заболевания

18 марта 2024

1) Центральный НИИ эпидемиологии Роспотребнадзора, Москва, Россия;
2) Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи Минздрава России, Москва, Россия

Цель исследования. Обоснование использования визуализации результатов иерархической кластеризации стандартизованных показателей кумулятивной инцидентности за многолетний период как метода анализа пространственного распределения случаев заболевания.
Материалы и методы. Проанализированы сведения о заболеваемости хроническим гепатитом В (ХГВ) населения 85 субъектов Российской Федерации за период с 2014 по 2022 г. по данным статистической формы № 2 «Сведения об инфекционных и паразитарных болезнях». Все расчеты выполнены при помощи библиотек Python.
Результаты. Описана последовательность действий по получению и интерпретации результатов иерархической кластеризации показателей многолетней кумулятивной инцидентности в субъектах Российской Федерации с целью анализа многолетней заболеваемости населения ХГВ.
Заключение. Предложенный метод значительно повышает информативность и объективность результатов изучения пространственного распределения случаев заболевания ХГВ.

Одним из элементов системы надзора за инфекционной заболеваемостью является постановка эпидемиологического диагноза, включающего оценку эпидемической ситуации, ее причин и тенденций развития. В качестве первого этапа эпидемиологической диагностики рассматривается оценка проявлений эпидемического процесса по территории, среди разных групп населения и во времени, то есть изучение пространственно-временной структуры и динамики заболеваемости населения [1, 2]. Реализация этого этапа позволяет сформировать общее представление о масштабе изучаемой проблемы и направлении дальнейшего научного поиска, что важно для формирования гипотез о факторах и группах риска [1, 3].

Слежение за заболеваемостью и динамическое ее изображение в таблицах и на графиках преследует цель эпидемио­логического осмысления наблюдаемых явлений, выдвижения объясняющих происходящие явления гипотез, их проверки и принятия управленческих решений [4]. В настоящее время информационные технологии шагнули далеко вперед и уже способны решать те задачи анализа, которые еще недавно описывались только в теории или решались ручным способом. При значительных объемах информации необходимо создание алгоритмов поиска значимых показателей, а также блоков интерпретации и обработки данных [5].

Анализ показателей кумулятивной инцидентности не выглядит чем-то сложным, пока эпидемиолог не сталкивается с задачей охарактеризовать интенсивность и динамику эпидемического процесса на десятках территорий с учетом меняющихся особенностей регистрации случаев заболеваний. В связи с этим нужны новые подходы. В качестве примера рассмотрено применение предлагаемой методики при анализе кумулятивной инцидентности хронического гепатита В (ХГВ) в 85 субъектах РФ за период 2014–2022 гг., включая 2020–2022 гг., когда на фоне пандемии новой коронавирусной инфекции COVID-19 регистрация новых случаев ХГВ резко сократилась, в основном из-за изменений в работе системы здравоохранения. При решении такой задачи возникает необходимость применения компьютерных алгоритмов для объективной оценки величины различий изучаемых показателей и визуализации результатов их работы для перевода полученных результатов на язык, понятный для исследователя.

В настоящее время обсуждаются перспективные направления цифровизации в части анализа и структурирования данных при помощи математических методов и подходов, создания интеллектуальных алгоритмов [6]. Широкое распространение получили методы машинного обучения (machine learning), представляющего собой процесс машинного анализа подготовленных статистических данных для поиска закономерностей и создания на их основе нужных алгоритмов, которые позволят в дальнейшем компьютерному искусственному интеллекту сделать корректные выводы на основании предоставленных ему данных [7]. Подобные подходы повышают эффективность прогнозирования рисков за счет использования объемных хранилищ данных при независимой идентификации новых предикторов риска и сложных взаимодействий между ними [8].

Методы машинного обучения находят все более широкое применение в эпидемиологических исследованиях, как правило, для построения прогнозных моделей [9–12]. В статье изложены общие принципы иерархической кластеризации кумулятивной инцидентности з...

Дубоделов Д.В., Углева С.В., Гасанов Г.А., Корабельникова М.И., Сычева Н.В., Заволожин В.А., Есьман А.С., Власенко Н.В., Семененко Т.А., Кузин С.Н., Акимкин В.Г.
Статья платная, чтобы прочесть ее полностью, вам необходимо произвести покупку
Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.