Урология №2 / 2024
Искусственный интеллект и большие языковые модели: вызовы и перспективы в исследованиях и медицине
1) Институт урологии и репродуктивного здоровья человека, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
2) Институт клинической медицины им. Н.В. Склифосовского, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
3) НМИЦ по профилю «урология» ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия;
4) Научно-технологический парк биомедицины, ФГАОУ ВО Первый МГМУ им. И.М. Сеченова МЗ РФ (Сеченовский Университет), Москва, Россия
С развитием и распространением искусственного интеллекта технологии, основанные на принци-пах нейронных сетей (например, большие языковые модели), привлекли наибольшее внимание в качестве перспективных методов анализа и обработки данных в различных сферах.
Большие языковые модели (БЯМ) представляют собой системы, обученные на огромных объемах текстовых данных и способные генерировать ответы на запросы пользователей. Примеры известных БЯМ – это ChatGPT, Bing, Sparrow, BlenderBot, Bard, YandexGPT и GigaChat и прочие.
Уже сейчас искусственный интеллект (ИИ) может играть важную роль в научной и исследовательской работе, включая обработку медицинских данных, постановку диагнозов, составление научных работ и документаций, написание статей, рецензий и других академических материалов.
В настоящей статье рассматриваются эволюция и возможности использования больших языковых моделей в различных областях медицины (и не только), а также анализируются перспективы их применения в будущем и обсуждаются препятствия, затрудняющие их активное внедрение и важность контроля их использования.
За последние несколько лет технологии, созданные на основе нейронных сетей (нейросетей), стали одной из наиболее обсуждаемых и активно развивающихся научных тематик. Одним из наиболее «громких» достижений, созданных с помощью нейросетей, стал искусственный интеллект (ИИ) – технология обработки данных, которая имитирует умственные процессы человека, такие как логическое мышление, обучение, запоминание [1, 2].
В 1956 г. прошел семинар по разработке логических задач и способов автоматизации их решения. На нем был впервые представлен термин «искусственный интеллект». После данного семинара ИИ стал считаться отдельной отраслью науки. Через 25 лет Барр и Файгенбаум предложили более точное определение ИИ, в котором говорится, что ИИ является областью информатики, которая занимается разработкой интеллектуальных компьютерных систем: понимание языка, обучение, способность рассуждать, решать проблемы и т.д. Ученые выделяли ключевые моменты у ИИ, к которым должны прийти создатели в ходе работы над ним [3].
Активное изучение и внедрение ИИ привели к разработке ряда технологий для нужд медицины [4, 5]: анализ изображений (КТ, МРТ), анализ генетических нарушений, компьютерное моделирование [6–8] и т.д.
Впрочем, наиболее доступный и простой способ прикоснуться к технологиям ИИ – это применение больших языковых моделей (БЯМ, large language model – LLM), созданных с его использованием (YandexGPT, GigaChat, ChatGPT, Bard и пр.). Причем технологии языковых моделей используются не только в быту, но и в медицинской деятельности, правда, для начала следует разобраться в терминах. Языковая модель – это компьютерная программа, созданная для обработки человеческого языка, способная формулировать ответы на задаваемые ей вопросы. Языковые модели варьируются по размеру и сложности: от небольших систем, основанных на коротком своде правил (чат-боты), до сложных моделей на базе нейросетей [9]. Последний тип зачастую называют «Большие языковые модели» (БЯМ) – это системы на основе ИИ, которые обучаются на огромных объемах текстовых данных, полученных из статей, книг и других ресурсов (доступных, к примеру, в сети Интернета) [10]. Как правило, для предоставления сложных ассоциативных отношений между словами в текстовом наборе обучающих данных используют «глубокое обучение» – технологию моделирования высокоуровневых абстракций [10]. Данная технология способна интерпретировать пользовательские запросы и предоставлять диалоговый ответ, как в случае с ChatGPT, разработанным OpenAI [10].
Необходимо отметить, что технологии, которые позволили бы создать ИИ, изучают уже длительное время. Истоки языковых моделей восходят к 1950-м гг. (Джорджтаунский эксперимент – IBM) [12]. Одна из первых языковых моделей, «чат-бот» ELIZA, была создана в 1960-х гг. [13]. Активное развитие и распространение сети Интернета с начала 1990-х гг. способствовали постоянному росту интереса к технологиям с использованием языковых моделей [14]. А последнее десятилетие отметилось одним из наиболее быстрых скачков в развитии нейронных сетей [15] благодаря разработке нейронных сетей-трансформеров, которые могут обучаться с повышенной скоростью. Один из наиболее известных примеров подобной нейросети – это ChatGPT, где GPT – Generative pre-trained transformer (генеративный предварительно обученный трансформер). Именно он открыл для большинства людей эпоху БЯМ. Коротко описывая особенности данного вида БЯМ, следует отметить, что их задача – «сгенерировать» ответ, то есть создавать его на основе существующих данных. Это, с одной стороны, позволяет моделям создавать множество разных вариантов ответа, с другой стороны, может приводить к возникновению так называемого феномена искусственных галлюцинаций, когда модель подменяет реально существующие факты искусственно созданными.
С тех пор БЯМ продолжают расти и развиваться во всех отношениях, завоевывая популярность среди как населения в целом, так и профессиональных сообществ, к примеру медицинского сообщества [16]. На данный момент среди больших языковых моделей наиболее известные примеры – это GPT-3.5, GPT-4 и ChatGPT (OpenAI), Bing (Microsoft), Sparrow (DeepMind), BlenderBot 3 (Meta Platforms), Bard (Google), а также русскоязычные YandexGPT (Yandex) и GigaChat (Сбер).
И хотя примеров использования больших языковых моделей в медицине множество [17] (самодиагностика и самолечение, обработка данных анализов, постановка диагнозов, составление страховых апелляций или писем, создание инструкций и т.д.) [18, 19], в данной работе мы хотели бы остановиться на применении больших языковых моделей для ака...