Терапия №6 (приложение) / 2025
МОДЕЛЬ ПРОГНОЗИРОВАНИЯ СОДЕРЖАНИЯ ГОМОЦИСТЕИНА НА ОСНОВЕ ДАННЫХ ДИСПАНСЕРНОГО НАБЛЮДЕНИЯ С ПОМОЩЬЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
1) ФГАОУ ВО «Российский университет дружбы народов им. Патриса Лумумбы», 117198, г. Москва, ул. Миклухо-Маклая, д. 6.;
2) ООО «ЛабХаб», 111024, г.Москва, ул. Авиамоторная, д. 50, стр 2;
3) ФГАОУ ВО РНИМУ им. Н.И. Пирогова Минздрава России, 117513, г. Москва, ул. Островитянова, д. 1, стр. 6
Аннотация. Гипергомоцистеинемия (ГГЦ) признана независимым фактором тромбофилических состояний, что обосновывает необходимость разработки методов ранней диагностики и профилактики для снижения рисков тромбозов. Современные методы машинного обучения (МО) активно используются в медицинских исследованиях, в том числе для анализа взаимосвязей между уровнем гомоцистеина (Hcy) и модифицируемыми факторами, такими как демографические показатели, образ жизни, биохимические и гематологические параметры стандартных лабораторных исследований.
Цель. Разработать и валидировать бинарную модель классификации прогнозирования содержания Hcy на основе данных диспансерного наблюдения (общий анализ крови (ОАК), уровни общего холестерина (ОХС), глюкозы плазмы натощак (ГПН), пол, возраст).
Материал и методы. Проведено поперечное исследование на основе деперсонифицированных данных федеральной медицинской лаборатории. В анализ включены данные 20145 человек (7392 мужчины, 12753 женщины) со средним возрастом 36,6 ± 18,2 лет. Критерием включения являлось наличие комплекса показателей, имитирующего стандартное обследование в рамках диспансеризации и целевого маркера – Hcy. ГГЦ определялась при концентрации Hcy> 15,0 мкмоль/л. Модель прогнозирования ГГЦ была разработана с использованием ансамблевого метода линейной регрессии и градиентного бустинга на решающих деревьях (платформа LightAutoML). Оценка дискриминационной способности модели проводилась путем расчета площади под ROC-кривой (AUC-ROC) на тестово...












