Для цитирования: Глизница П.В., Тахчиди Х.П., Светозарский С.Н., Бурсов А.И., Шустерзон К.А.
Машинное обучение в диагностике и лечении офтальмологических заболеваний. Head and neck.
Голова и шея. Российский журнал=Head and neck. Russian Journal. 2022;10(1):83–90
Машинное обучение – это раздел искусственного интеллекта, который направлен на приспособление компьютерных алгоритмов к обучению. Способность решать задачи без заранее заданного алгоритма
формируется в процессе обработки обучающего набора данных, к которым в медицине относится ответ организма пациента или принятое врачебное решение в контексте конкретной клинической ситуации.
Существует ряд методов машинного обучения, включающий классические методы, ансамблевые методы и нейронные сети. В зависимости от способа обучения выделяют обучение с учителем, без учителя, с частичным привлечением учителя и обучение с подкреплением. В статье описаны принципы работы, области применения, преимущества и ограничения данных методов в решении клинических задач, встречающихся в офтальмологической практике. Обсуждаются проблемы, встречающиеся на этапах сбора данных, разработки, внедрения и дальнейшего использования медицинских систем искусственного интеллекта, а также возможные пути их решения.
Ключевые слова: искусственный интеллект, болезни глаза, нейронная сеть, обучение с учителем, системы поддержки принятия решений, медицинская визуализация
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Финансирование. работа выполнена при финансовой поддержке Фонда содействия инновациям (договор №150ГС1ЦТНТИС5/64226 от 22.12.2020).
Machine learning is a branch of artificial intelligence that aims to adapt computer algorithms to learning. The ability to solve problems without a predetermined algorithm is formed during the processing of a training dataset, which in
medicine includes the response of the patient’s body or a medical decision made in the context of a specific clinical situation. There are a number of machine learning methods, including classical methods, ensemble methods, and neural networks; depending on the method of training, there are training with a teacher, without a teacher, with partial involvement of a teacher, and training with reinforcement. The article describes the principles of operation, areas of application, advantages, and limitations of these methods in solving clinical problems encountered in ophthalmological practice.
The problems encountering at the stages of data collection, development, implementation, and further use of medical artificial intelligence systems are discussed, as well as possible ways to solve them.
Key words: Artificial intelligence, eye diseases, neural network, teacher training, decision support systems, medical visualization
Conflicts of interest. The authors have no conflicts of interest to declare.
Funding. This work was financially supported by the Foundation for Assistance to Small Innovative Enterprises in Science and Technology (contract №150ГС1ЦТНТИС5/64226 dated December 22, 2020).
For citation: Gliznitsa P.V., Takhchidi Kh.P., Svetozarskiy S.N., Bursov A.I., Shusterzon K.A. Machine
learning in the diagnosis and treatment of ophthalmic diseases. Head and neck. Russian Journal.
2022;10(1):83–90 (In Russian).
The authors are responsible for the originality of the data presented and the possibility of publishing illustrative material – tables, figures, photographs of patients.
Искусственный интеллект (ИИ) – это отрасль современной науки и компьютерных технологий, реализующая возможность выполнения роботом или компьютером творческих задач [1]. Согласно «Национальной стратегии развития искусственного интеллекта на период до 2030 года», утвержденной указом Президента РФ от 10 октября 2019 г. №490, государство ставит
перед научными организациями стратегические задачи: освоение значительной доли мирового рынка ИИ наряду с обеспечением технологического суверенитета страны. В «Стратегии научно-технологического развития Российской Федерации», утвержденной указом Президента РФ от 1 декабря 2016 г. №642, разработка подобных систем стоит на первом месте в ряду приоритетных направлений развития науки.
В рамках ИИ выделяют раздел машинного обучения, направленный на приспособление компьютерных алгоритмов к обучению через симуляцию интеллекта человека. Внедрение элементов машинного обучения в медицине началось в 1970-е гг. в целях помощи врачу на этапах скрининга, диагностики
и прогнозирования исходов заболевания [2]. За последние 10 лет интерес к ИИ значительно возрос благодаря созданию новых высокоэффективных методов машинного обучения, консолидированных наборов данных, современных графических процессоров, с помощью которых обучение алгоритмов происходит быстрее и эффективнее. Динамика роста числа
статей по данной тематике в базе данных медицинских и биологических публикаций Национального центра биотехнологической информации США наглядно иллюстрирует интерес исследователей и перспективность данного направления (поисковый запрос: artificial intelligence[Title/Abstract] OR machine
learning[Title/Abstract], OR deep learning[Title/Abstract], OR neural network[Title/Abstract] (рис. 1).
Базовые понятия и принципы машинного обучения
Понятие ИИ включает широкий спектр технологических решений, обеспечивающих независимое функционирование компьютеризированных систем. Область машинного обучения специализируется на придании компьютеру возможности решать задачи без заранее заданного алгоритма за счет самообучения на основе имеющегося набора данных, а не знаний. Применительно к программной инженерии иерархия уровней информации в настоящее время позиционируется в виде модели, в основе которой находятся данные, которые при наличии контекста становятся информацией. Информация в свою очередь применяется, организуется и служит материалом для формирования знаний [3–5]. Самообучение реализуется посредством
самостоятельного изменения компьютером математической модели, лежащей в основе принятия решений [6]. Машинное обучение можно противопоставить экспертным системам, получившим широкое распространение в 1970–1980-х гг. (МОДИС, MYCIN) и реализуемым посредством разработки пошагового
алгоритма на основе имеющейся базы знаний, при этом изменение условий принятия решений доступно только человеку [7].
Для осуществления алгоритма машинного обучения необходим большой набор данных или обучающая выборка, состоящая из прецедентов. Прецедент, наблюдение или случай, применительно к медицине – это ответ организма определенного пациента или принятое врачебное решение в рамках некой клинической ситуации. Компьютеру не объясняется связь между ответом
и ситуацией (объектом), а лишь предъявляется набор подобных пар – прецедентов «ситуация-ответ». Прецедент описывается рядом признаков или переменных, представляющих детали наблюдаемого случая как бинарных (пол, возраст), так и более сложных, таких как изображение в 2D (рентгеновский снимок) или 3D формате (3D реконструкция снимков компьютерной томографии). Представляемые наблюдения могут разделяться по классам, согласно ключевому для выполняемой задачи признаку – ответу, например по наличию или отсутствию заболевания, либо оставаться неклассифицированными [7].
Рассмотрим общую схему работы методов машинного обучения. На примере обучающей выборки алгоритм создает пробную модель для классификации наблюдений, которая анализирует набор признаков и самостоятельно классифицирует объект. Далее система сверяет собственный ответ с заданным и адаптирует свою математическую модель для более точного
определения ответа (класса). В случае с нейронными сетями алгоритм обновляет значения весовых коэффициентов, отражающих значимость каждого признака для принятия решения.
Набор данных повторно анализируется, а алгоритм продолжает корректировать свою математическую модель до тех пор, пока не сможет точно распределить объекты по правильным классам. Причины – основания, на которые опирается система в процессе классификации, в большинстве методов остаются в «черном ящике», т.е. мы видим только данные, загружаемые на входе, и результат, ответ системы на выходе. Этот повторяющийся цикл самооценки и самокоррекции и является «обучением»
алгоритма. На следующем этапе систему запускают на новом, неизвестном тестовом наборе данных, где оценивают чувствительность и специфичность, делая вывод об эффективности сформировавшейся в результате обучения системы. Следует заметить, что для признания эффективности той или иной
технологии ИИ не требуется достижения 100% точности, достаточно лишь иметь показатели, не уступающие результатам практикующих врачей.
Методы машинного обучения
В рамках машинного обучения существует ряд методов обучения, которые классифицируются на основе различных критериев (рис. 2). В зависимости от типа математической модели существующие методы можно разделить на классические методы, ансамблевые методы (сочетание нескольких алгоритмов) и нейронные сети. Классические методы известны давно и зачастую могут оказаться проще и эффективнее многослойных нейронных сетей в решении свойственных им задач.
В зависимости от решаемых задач выделяют методы регрессии: установление
места объекта на числовой прямой, классификации – определение категории объекта, кластеризации – разделение объектов на группы по неизвестному признаку, уменьшения размерности – обобщения, группировки признаков. Примером эффективного решения задачи категоризации пациентов в зависимости от стадии птеригиума с помощью классического алгоритма
классификации – метода опорных векторов – является работа W. Wan Zaki и соавт. [8]. Авторы добились высокой точности диагностики стадии птеригиума на основании модели, осуществляющей трехступенчатую классификацию фотографий переднего отрезка глаза, включающую определение наличия птеригиума, его локализацию и определение стадии заболевания. Пример
эффективного сочетания нескольких классических методов машинного обучения представлен в работе K. Ishii и соавт. [9], посвященной прогнозированию уровня внутриглазного давления по сочетанию клинических признаков. Исследователи применили модель многомерной линейной регрессии в сочетании с регрессией с наименьшим абсолютным сокращением и оператором выбора (LASSO), методами опорных векторов и случайных лесов для обобщения 35 различных клинических показателей и предсказания абсолютного значения уровня внутриглазного давления с помощью регрессионной модели. Таким образом, для правильного выбора алгоритма или их сочетаний необходимо соотносить этапы и задачи исследования с существующими группами методов машинного обучения [10].
В зависимости от способа обучения методы можно разделить
следующим образом:
– Обучение с учителем (supervised learning) – способ обучения, когда алгоритму заданы и объекты, и ответы. Для этого человек должен заранее присвоить объектам классы или провести разметку данных, т.е. определить правильный ответ, что требует больших затрат труда и времени. Ограничением подобных методов является их зависимость от уровня знаний эксперта, производящего разметку и ограничивающего варианты предполагаемых ответов. Примером исследования, построенном на обучении с учителем, служит выявление интраоперационных факторов, позволяющих прогнозировать риск отторжения роговичного трансплантата после кератопластики с помощью метода случайных лесов (random forests) [11].
Обучение без учителя (unsupervised learning) – способ обучения, когда алгоритму заданы только объекты или ситуации, что позволяет обрабатывать колоссальные объемы данных, не поддающиеся экспертной классификации. В результате могут быть выявлены новые закономерности, оригинальные клинические паттерны, оставшиеся незамеченными специалистом в ходе разметки. К примеру, используя иерархический кластерный анализ данных оптической когерентной томографии зрительного нерва, E. Kim и соавт. удалось выявить 3 типа прогрессирования нормотензивной глаукомы, отличающиеся по клиническому прогнозу [12].
Обучение с частичным привлечением учителя (semi-supervised learning) – способ обучения, когда часть данных размечена, а часть – нет. В настоящее время подобные методы получают все большее распространение в связи с созданием генеративно-состязательных нейросетей (Generative adversarial
networks). Генеративно-состязательная нейросеть – модель машинного самообучения, построенная из двух нейросетей, одна из которых создает наборы данных, близкие к оригинальным, а вторая получает как реальные, так и смоделированные первой нейросетью данные, и выбраковывает искусственные.
Данная модель относится к методам обучения без учителя и используется для создания и улучшения изображений и может обогащать имеющиеся наборы данных, ограниченные по объему. В результате, генерированные изображения при меняются для обучения алгоритмов других типов. Учитывая небольшой по меркам машинного обучения объем размеченных данных для большинства клинических задач, данная модель представляет особый интерес. Примером использования обучения с частичным привлечением учителя является система улучшения качества снимков переднего отрезка глаза с помощью
оптической когерентной томографии, где наряду с реально существующими снимками, классифицированными специалистом, в обучающую выборку включали изображения, искусственно созданные с помощью генеративно-состязательной нейросети [13]. Аналогичная задача обогащения базы данных медицинских изображений решена в работе Y. Zhou и соавт. [14], посвященной генерации снимков глазного дна, имеющих при знаки диабетической ретинопатии и отличающихся улучшенным качеством по сравнению с оригиналом. Использование подобных снимков в дальнейшем может позволить добиться лучших показателей при обучении нейронных сетей
– Обучение с подкреплением (reinforcement learning) – способ обучения, при котором алгоритм (агент) взаимодействует с реальной средой или ее моделью, получает сигналы подкрепления при успешном выполнении задач и адаптирует программный код на основе обратной связи [15–17]. Таким способом обучаются беспилотные автомобили и другие роботы, осуществляющие физическое передвижение. Примерами использования подобных методов в медицине служат работы, посвященные диагностике глаукомы по данным цветных фотографий глазного [18], поддержке принятия решений в хирургии [19, 20] и функционированию автономного робота, выполняющего ультразвуковое исследование [21]. Последняя работа, на наш взгляд, заслуживает особого внимания, поскольку служит не анализу имеющихся данных, а открывает направление автономных медицинских роботов, способных выполнять задачи, связанные с физическим взаимодействием с пациентом.
Важно заметить, что приведенная классификация методов отчасти ситуативна, поскольку различные модификации одного метода могут быть использованы как для обучения с учителем, так и без учителя, в частности широко применяемые в медицине нейронные сети. Нейронные сети – системы, состоящие из взаимодействующих искусственных нейронов (процессоров), расположенных в виде слоев. Ключевая характеристика подобного процессора то, что он может получать множество различного рода входных сигналов разной интенсивности от предыдущего слоя, преобразуя их в один выходной, поступающий процессорам следующего слоя. В этом заключается сходство искусственных нейронов с нервными клетками, которые на постсинаптической мембране контактируют с молекулами разного
рода нейротрансмиттеров, поступающих в синаптическую щель в разном количестве, однако единственным ответом нервной клетки может быть развитие потенциала действия.Понятие «глубокое обучение» относится к архитектуре сетей и описывает систему с множественными слоями процессо-
ров-нейронов. Частным случаем глубокого обучения является сверточная нейросеть, отличающаяся специфической операцией свертки и широко используемая для распознавания и классификации изображений, обучение которой может происходить с учителем, как в работе V. Mayya и соавт., посвященной диагностике грибкового кератита на цветных фотографиях глазного дна [22], с частичным привлечением учителя, как в работе M. Wang и соавт., посвященной распознаванию сканов оптической когерентной томографии сетчатки [23], и без учителя, как в работе U. Schmidt-Erfurth и соавт., посвященной мониторингу количества субретинальной жидкости в ходе лечения различных заболеваний сетчатки [24]. Генеративно-состязательная и сверточная нейросети являются наиболее распространенными алгоритмами машинного обучения, применяемыми для анализа медицинских изображений [25].
Характеристики методов
Существует много алгоритмов машинного обучения, отличающихся своими возможностями и ограничениями. К принципиальным характеристикам, присущим тому или иному алгоритму можно отнести следующие [26]:
– Интерпретируемость – возможность установить основания принятого алгоритмом решения открыть «черный ящик». Возможность объяснить решение, предлагаемое алгоритмом, значительно облегчает внедрение методов в медицинскую практику.
– Устойчивость к мультиколлинеарности – корреляционной связи между независимыми переменными, которая негативно сказывается на времени обучения и точности результата. В частности, учет избыточного числа переменных из медицинской карты приводит к формированию слишком сложной модели, учитывающей несущественные признаки заболевания
(эффект переобучения) и потому неспособной к обобщению.
– Возможность выбора переменных, позволяющая снизить эффект мультиколлинеарности. Например, если алгоритм учел в построенной математической модели и национальность, и расовую принадлежность пациента, то возможность вручную исключить один из параметров, не редактируя набор данных, значительно облегчит работу с системой.
Анализ преимуществ и недостатков различных алгоритмов машинного обучения представлен в таблице [7, 10, 26].
Для оценки эффективности системы в решении конкретной медицинской задачи широко используют параметры чувствительности, отражающей долю истинно положительных результатов от общего числа положительных ответов теста, специфичности, связанной с числом истинно отрицательных результатов, и точности, определяемой отношением суммы истинно положительных и истинно отрицательных ответов к общему числу выполненных задач. В то же время для задач сегментации изображений подобные критерии малоприменимы, и в таких случаях используют коэффициент подобия Дайса, который показывает степень сходства или долю правильно классифицированных сегментов изображений, а также среднее расстояние до совпадения, которое показывает среднее расстояние между опорными точками контуров двух очертаний, размеченного с помощью нейросети и контрольным методом [27].
Проблемы и их решения
Хотя ИИ и обещает произвести революцию в медицинской практике, впереди еще много проблем технического, социального, экономического и правового характера. Эффективность методов, основанных на машинном обучении, в первую очередь зависит от наличия большого количества обучающих данных высокого качества. Кроме того, данные должны быть репрезентативными для целевой группы пациентов. Например, данные, собранные на разных моделях
диагностической аппаратуры, содержат неоднородные спектры шума и отличаются по референсным значениям нормы, в то же время результаты, полученные на одном оборудовании, но в различных городах или странах, могут отличаться по причине этнической гетерогенности населения [28]. В результате, для применения разработанной математической модели в новых условиях потребуются ее валидация и коррекция, что тесно связано с проблемой переобучения. Переобучение – это явление, характеризующее высокую точность алгоритма при решении задачи на примерах из обучающей выборки и меньшую точность в отношении новых данных тестовой выборки, что ограничивает его практическую применимость [29]. Причина этого феномена – включение в математическую модель или придание избыточных
весовых коэффициентов таким переменным, которые носят случайный или присущий только данной обучающей выборке характер и не обнаруживаются в генеральной совокупности.
На вероятность переобучения влияют несколько факторов, включая размер и степень неоднородности набора данных, а также число признаков, описывающих ситуацию. Применение алгоритмов, устраняющих отклонения и шумы, сближающих между собой свойства различных наборов данных, повысит надежность прогностических моделей и безопасность их использования при принятии клинически значимых решений [30]. Очевидно, что на этапе обучения системы затруднения могут возникать в связи с потребностью в больших массивах данных и в случае обучения с учителем с необходимостью классификации или разметки данных специалистом [31]. В результате этого традиционные методы машинного обучения достигают высоких показателей точности только в отношении широко распространенных заболеваний. Одним из решений указанной проблемы является использование алгоритмов распознавания, обучающихся с одного или нескольких раз (few-shot learning) [32]. Задачей алгоритма является эффективное извлечение одной или нескольких ключевых характеристик объекта на основе малых наборов данных. Для большей эффективности
алгоритм применяют в сочетании с генеративно-состязательной нейросетью, которая обогащает обучающую выборку сгенерированными изображениями, подобными представленным, тем самым увеличивая число прецендентов [33]. В работе T. Yoo и соавт. технология обучения с нескольких раз применя-
лась для диагностики 9 редких болезней сетчатки [34]. На этапе
валидации авторам удалось добиться точности 93,9%, а также
высоких показателей диагностической ценности.На этапе внедрения систем машинного обучения обнаруживается проблема адаптации к работе с практикующим врачом, которому необходима интерпретация ответа алгоритма, указания на специфические признаки (область интереса), которые позволяют поставить диагноз [35]. Неспособность алгоритмов продемонстрировать, как они приходят к своим выводам, называют проблемой «черного ящика» [36–38]. В работе с медицинскими изображениями проблема «черного ящика» решается визуализацией фильтров свертки или построением карт активации [39]. Тепловые карты активации классов (Grad-CAM) получили широкое распространение в силу своей демонстративности: данный модуль выделяет области, послужившие причиной активации искусственных нейронов или, иными словами, основанием для принятия решений нейросетью [22, 35]. В то же время интер-
претация решений нейронных сетей в отношении текстовых, числовых и иных данных, отличных от изображений, до недавнего времени оставалась нерешенной научной задачей.
Успешным решением данной проблемы явился метод аддитивного объяс-
нения (SHAP – SHapley Additive ex-Planations technique), использование которого в работе T. Yoo и соавт. позволило создать интуитивно понятную для практикующего офтальмолога систему поддержки принятия врачебных решений по выбору типа рефракционной операции [40]. При этом искусственный интеллект в данном случае опирался на данные различных модальностей, что затрудняло решение проблемы интерпретации. Большинство работ в сфере машинного обучения в медицине направлено на анализ данных одной модальности, в основном числовых, категориальных или графических, несмотря на большие успехи в распознавании голоса, анализе видеоданных, анализа данных временных рядов и пр. [41, 42]. В клинической практике диагностические и лечебные задачи зачастую не поддаются решению без учета объективного (сопутствующие заболевания и степень их компенсации) или субъективного (предпочтения пациента и социальные факторы) контекста, представленного данными различной модальности. Разработка масштабных усилий по сбору и обобщению данных междисци-
алгоритмов, учитывающих полноту подобного контекста, требует невозможно включить в набор данных ту часть сведений, которая не фиксируется в медицинской документации, оставаясь в сфере личного взаимодействия врача и пациента, в т.ч. в рамках сохранения врачебной тайны. Кроме того, существует проблема низкого индекса согласия специалистов
при формулировании диагноза и иных значимых разделов медицинской карты.
Заключение
За последние годы характер научной информации, связанной с применением технологий ИИ в медицине, прошел путь от единичных пилотных публикаций до систематических обзоров, подводящих итоги все новых масштабных иссле-
дований. Методы машинного обучения быстро переходят из разряда высоко оригинальных в категорию рекомендованных к использованию. Внедрение ИИ в клиническую медицину и, в частности в офтальмологию, в обозримом будущем изменит систему оказания медицинской помощи. Претерпят трансформацию виды социального взаимодействия в данной сфере, расширится спектр задач, относящихся к компетенции врача.
Владение понятийным аппаратом, знание основных характеристик используемых методов, решаемых ими задач, требований к клиническому материалу и возможных проблем, связанных с их применением, позволит специалисту корректно оценивать новизну, значимость и перспективность предлагаемых технологий и адекватно использовать их в своей исследовательской и практической работе.