Урология №2 / 2024

Искусственный интеллект и большие языковые модели: вызовы и перспективы в исследованиях и медицине

22 мая 2024

1) Институт урологии и репродуктивного здоровья человека, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
2) Институт клинической медицины им. Н.В. Склифосовского, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
3) НМИЦ по профилю «урология» ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
4) Научно-технологический парк биомедицины, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия

С развитием и распространением искусственного интеллекта технологии, основанные на принци-пах нейронных сетей (например, большие языковые модели), привлекли наибольшее внимание в качестве перспективных методов анализа и обработки данных в различных сферах.
Большие языковые модели (БЯМ) представляют собой системы, обученные на огромных объемах текстовых данных и способные генерировать ответы на запросы пользователей. Примеры известных БЯМ – это ChatGPT, Bing, Sparrow, BlenderBot, Bard, YandexGPT и GigaChat и прочие.
Уже сейчас искусственный интеллект (ИИ) может играть важную роль в научной и исследовательской работе, включая обработку медицинских данных, постановку диагнозов, составление научных работ и документаций, написание статей, рецензий и других академических материалов.
В настоящей статье рассматриваются эволюция и возможности использования больших языковых моделей в различных областях медицины (и не только), а также анализируются перспективы их применения в будущем и обсуждаются препятствия, затрудняющие их активное внедрение и важность контроля их использования.

За последние несколько лет технологии, созданные на основе нейронных сетей (нейросетей), стали одной из наиболее обсуждаемых и активно развивающихся научных тематик. Одним из наиболее «громких» достижений, созданных с помощью нейросетей, стал искусственный интеллект (ИИ) – технология обработки данных, которая имитирует умственные процессы человека, такие как логическое мышление, обучение, запоминание [1, 2].

В 1956 г. прошел семинар по разработке логических задач и способов автоматизации их решения. На нем был впервые представлен термин «искусственный интеллект». После данного семинара ИИ стал считаться отдельной отраслью науки. Через 25 лет Барр и Файгенбаум предложили более точное определение ИИ, в котором говорится, что ИИ является областью информатики, которая занимается разработкой интеллектуальных компьютерных систем: понимание языка, обучение, способность рассуждать, решать проблемы и т.д. Ученые выделяли ключевые моменты у ИИ, к которым должны прийти создатели в ходе работы над ним [3].

Активное изучение и внедрение ИИ привели к разработке ряда технологий для нужд медицины [4, 5]: анализ изображений (КТ, МРТ), анализ генетических нарушений, компьютерное моделирование [6–8] и т.д.

Впрочем, наиболее доступный и простой способ прикоснуться к технологиям ИИ – это применение больших языковых моделей (БЯМ, large language model – LLM), созданных с его использованием (YandexGPT, GigaChat, ChatGPT, Bard и пр.). Причем технологии языковых моделей используются не только в быту, но и в медицинской деятельности, правда, для начала следует разобраться в терминах. Языковая модель – это компьютерная программа, созданная для обработки человеческого языка, способная формулировать ответы на задаваемые ей вопросы. Языковые модели варьируются по размеру и сложности: от небольших систем, основанных на коротком своде правил (чат-боты), до сложных моделей на базе нейросетей [9]. Последний тип зачастую называют «Большие языковые модели» (БЯМ) – это системы на основе ИИ, которые обучаются на огромных объемах текстовых данных, полученных из статей, книг и других ресурсов (доступных, к примеру, в сети Интернета) [10]. Как правило, для предоставления сложных ассоциативных отношений между словами в текстовом наборе обучающих данных используют «глубокое обучение» – технологию моделирования высокоуровневых абстракций [10]. Данная технология способна интерпретировать пользовательские запросы и предоставлять диалоговый ответ, как в случае с ChatGPT, разработанным OpenAI [10].

Необходимо отметить, что технологии, которые позволили бы создать ИИ, изучают уже длительное время. Истоки языковых моделей восходят к 1950-м гг. (Джорджтаунский эксперимент – IBM) [12]. Одна из первых языковых моделей, «чат-бот» ELIZA, была создана в 1960-х гг. [13]. Активное развитие и распространение сети Интернета с начала 1990-х гг. способствовали постоянному росту интереса к технологиям с использованием языковых моделей [14]. А последнее десятилетие отметилось одним из наиболее быстрых скачков в развитии нейронных сетей [15] благодаря разработке нейронных сетей-трансформеров, которые могут обучаться с повышенной скоростью. Один из наиболее известных примеров подобной нейросети – это ChatGPT, где GPT – Generative pre-trained transformer (генеративный предварительно обученный трансформер). Именно он открыл для большинства людей эпоху БЯМ. Коротко описывая особенности данного вида БЯМ, следует отметить, что их задача – «сгенерировать» ответ, то есть создавать его на основе существующих данных. Это, с одной стороны, позволяет моделям создавать множество разных вариантов ответа, с другой стороны, может приводить к возникновению так называемого феномена искусственных галлюцинаций, когда модель подменяет реально существующие факты искусственно созданными.

С тех пор БЯМ продолжают расти и развиваться во всех отношениях, завоевывая популярность среди как населения в целом, так и профессиональных сообществ, к примеру медицинского сообщества [16]. На данный момент среди больших языковых моделей наиболее известные примеры – это GPT-3.5, GPT-4 и ChatGPT (OpenAI), Bing (Microsoft), Sparrow (DeepMind), BlenderBot 3 (Meta Platforms), Bard (Google), а также русскоязычные YandexGPT (Yandex) и GigaChat (Сбер).

И хотя примеров использования больших языковых моделей в медицине множество [17] (самодиагностика и самолечение, обработка данных анализов, постановка диагнозов, составление страховых апелляций или писем, создание инструкций и т.д.) [18, 19], в данной работе мы хотели бы остановиться на применении больших языковых моделей для ака...

Тараткин М.C., Щелкунова К.Ю., Азильгареева К.Р., Али C.X., Морозов А.О., Cалпагарова А.И., Гаджиева З.К., Газимиев М.А.
Статья платная, чтобы прочесть ее полностью, вам необходимо произвести покупку
Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.