Акушерство и Гинекология №4 / 2017
Использование транскриптомных баз данных для анализа патогенетических факторов эндометриоза
1ФГБУ Научный центр акушерства, гинекологии и перинатологии им. академика В.И. Кулакова Минздрава России, Москва
2ФГБУН Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова, Москва, Россия
Актуальность. Молекулярные механизмы патогенеза эндометриоза остаются недостаточно изученными, что во многом определяет отсутствие высокоэффективной терапии данного заболевания. В последнее время применение «омиксных» технологий в исследовании эндометриоза приводит к накоплению информации об изменении количества и состава различных классов молекул в нормальных и патологически измененных тканях.
Цель исследования. Провести анализ массивов данных, полученных в разных исследованиях.
Материал и методы. Был проведен анализ шести наборов данных по экспрессии мРНК и девяти наборов по экспрессии микроРНК в эутопическом и эктопическом эндометрии. Было отобрано 79 генов с однонаправленным изменением экспрессии в большинстве наборов, и была проведена их функциональная характеристика.
Результаты. Сопоставление списков дифференциально экспрессированных генов и микроРНК, а также оценка их возможных взаимодействий позволили выявить девять микроРНК, способных участвовать в регуляции экспрессии десяти генов. Анализ процессов, регулируемых дифференциально экспрессирующимися генами, позволил выявить ряд клеточных функций и путей внутриклеточной сигнализации, которые ранее не были показаны при эндометриозе.
Заключение. Нарушения регуляции, ассоциированные с данными путями, могут вносить существенный вклад в развитие данного заболевания.
Эндометриоз – заболевание, которое характеризуется формированием эктопических очагов эндометриоидной ткани за пределами матки, имеющих разнообразную локализацию в брюшной полости: в ретроцервикальном пространстве, на ретровагинальной перегородке, мочевом пузыре, брюшине, матке, прямой кишке, аппендиксе и яичнике [1].
Формирование, развитие и распространение эктопических очагов стимулирует процессы неспецифического воспаления, сопровождающегося болевым синдромом, фиброзированием эктопической эндометриоидной ткани, приводящим к развитию спаечного процесса в брюшной полости. При множественной локализации очагов эндометриоза наблюдается вовлечение в патологический процесс сразу нескольких органов, что приводит к тяжелым осложнениям, связанным с нарушением их физиологических функций. Распространенность эндометриоза в общей популяции может достигать 10%, а среди пациенток с бесплодием и/или болевым синдромом – до 50% [2]. Важно отметить, что эффективного медикаментозного лечения данного заболевания до сих пор не предложено. На данный момент существует несколько концепций этиологии и патогенеза эндометриоза [3]. Тем не менее, ключевые механизмы развития заболевания, позволяющие выявить молекулярные мишени для терапевтического воздействия, остаются недостаточно изученными.
Одним из перспективных подходов в исследовании патогенеза эндометриоза является применение так называемых «омиксных» технологий, основанных на широкомасштабном анализе различных классов молекул в нормальных и патологически измененных клетках и тканях. Постепенное повышение доступности методов геномного, транскриптомного, протеомного и метаболомного анализа приводит к накоплению ценной информации о количественных и качественных структурно-функциональных изменениях на соответствующих уровнях молекулярной организации. При этом возникает новый класс задач, связанный с анализом получаемых массивов данных. Необходимо отметить, что применение всех перечисленных технологий в рамках одного исследования одной лабораторией на сегодняшний день представляется проблематичным. Рациональным подходом в данной ситуации является совместное использование и анализ данных, получаемых разными научными группами, применяющими альтернативные «омиксные» подходы или их комбинации. Таким образом, коллективное использование информации может позволить получать оптимальное количество данных для формирования относительно целостной картины изучаемых явлений.
В рамках данного подхода были созданы базы данных, например GEO (Gene Expression Omnibus, http://www.ncbi.nlm.nih.gov/geo), где исследователи делятся результатами экспериментов, полученных с использованием различных омиксных технологий. Открытость этой и других баз позволяет на этапе планирования и подготовки эксперимента провести анализ полученных другими исследователями данных для формулировки гипотез и целей предстоящих исследований, а также сопоставить данные, полученные в ходе одного исследования, с результатами других авторов. Важным аспектом анализа баз данных является возможность построения путей и сетей предполагаемых молекулярных взаимодействий, характерных для определенных физиологических и патологических процессов. Интеграция биологической информации, полученной при помощи различных высокопроизводительных технологий может служить эффективным подходом для выявления ключевых механизмов развития заболеваний.
В данной работе был проведен анализ транскриптомных наборов данных из базы GEO для поиска ключевых регуляторов и мишеней в этиологии и патогенезе эндометриоза. В исследование включено шесть наборов данных (GDS2737 [4], GDS5339 [5], GDS3060 [6], GDS3975 [7], GDC3092 [8], GDS2835 [9]), найденных в соответствующих статьях в результате поиска по ключевым словам «endometriosis» и «endometrium». Использованные наборы данных были получены авторами статей при помощи транскриптомного микроматричного анализа образцов тканей человека. В зависимости от использованных групп сравнения, наборы были поделены на парные и непарные. В парных наборах авторы исследований проводили сравнение экспрессии между эктопическим и эутопическим эндометрием одного пациента. В непарных наборах проводилось сравнение ткани эктопического очага одного пациента с тканью эндометрия другого пациента, не болеющего эндометриозом. Основные характеристики наборов данных приведены в табл. 1.
Наборы данных GDS2737 и GDS5339 были разбиты на несколько подгрупп. Набор GDS5339 включал две группы парных (GDS5339_1) и непарных (GDS5339_2) образцов. Набор GDS2737 был разделен в соответствии с фазой цикла: GDS2737_1 – ранняя секреторная фаза, GDS2737_2 – средняя секреторная фаза, GDS2737_3 – пролиферативная фаза.
Нами был проведен анализ транскриптомных данных и выделены дифференциально экспрессированные гены из каждого набора. Затем на основе списка этих генов было проведено обогащение метаболических путей, молекулярных функций и биологических процессов.
Для выявления возможных механизмов регуляции экспрессии генов был также прове...