Анализ информации о полях зрения человека c использованием методов машинного обучения и оценка их точности
- Авторы: Медведева А.И.1, Бакуткин В.В.2
-
Учреждения:
- РЭУ им. Г. В. Плеханова
- ООО «МАКАО ИТ»
- Выпуск: Том 21, № 1 (2025)
- Страницы: 63-66
- Раздел: МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
- Статья опубликована: 28.03.2025
- URL: https://vestnikugrasu.org/byusu/article/view/645349
- DOI: https://doi.org/10.18822/byusu20250163-66
- ID: 645349
Цитировать
Полный текст
Аннотация
Предмет исследования: изучение методов анализа периметрических снимков для диагностики и контроля заболеваний глаукомой.
Объект исследования: датасет, собранный на офтальмологическом периметре с результатами различных патологий пациентов, так как в офтальмологическом сообществе остро стоит вопрос контроля заболеваний и импортозамещения [5].
Цель исследования: рассмотреть различные методы машинного обучения, способные классифицировать глаукому. Это возможно благодаря классификатору, построенному после разметки датасета. Он способен определять по снимку, являются ли изображенные на нем поля зрения результатами воздействия на глаза глаукомы или же это другие зрительные заболевания. Ранее в работе [3] описывался датасет, который был собран на периметре «Tomey». Средний возраст обследованных пациентов составляет от 30 до 85 лет.
Методы исследования: методы машинного обучения для классификации результатов изображений (стохастический градиентный спуск, логистическая регрессия, случайный лес, наивный байес).
Основные результаты исследования: результатом исследования является компьютерное моделирование, способное определять по снимку, является ли результат глаукомой или иным заболеванием (бинарная классификация).
Ключевые слова
Полный текст
ВВЕДЕНИЕ
В офтальмологии является важным изучать поля зрения, так как их изменения могут указывать на наличие различных заболеваний, включая глаукому, миопию и другие неврологические расстройства [4]. С развитием технологий методы машинного обучения становятся все более актуальными для анализа и интерпретации этих данных. Говоря об искусственном интеллекте в медицине, важно учитывать и этические аспекты, чтобы не нарушать права пациентов [2].
В данной статье рассматривается применение методов машинного обучения для анализа полей зрения, оценка их точности и эффективности. Сосредоточимся на различных алгоритмах, таких как логистическая регрессия, случайный лес и других, а также проведем сравнительный анализ их производительности.
Целью исследования является не только выявление наиболее эффективных методов, но и понимание того, как эти технологии могут быть интегрированы в клиническую практику для улучшения диагностики и мониторинга заболеваний глаз.
В результате проведенного анализа важно заметить развитие методов диагностики и лечения заболеваний, связанных с изменениями в полях зрения, ведь потенциал машинного обучения особенно важен в области медицины. Повышая точность полученных данных, а также увеличивая количество испытуемых, стало возможным построение классификатора. Важно понимать, что всё это необходимо для улучшения жизнедеятельности пациентов и контроля течения заболевания.
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Одной из задач машинного обучения, применимых к данному исследованию, является бинарная классификация. Алгоритмы анализируют входные данные и выдают предсказания о принадлежности объекта к одному из двух классов.
Этапы разработки классификатора:
- Сбор данных
Как говорилось в работе [3], был собран и размечен датасет для определения координат точек на снимках. В данной статье каждый снимок был разделён на 2 глаза (каждый глаз отдельно). Собранный набор изображений глаз был помечен как «глаукома» и «иные заболевания» (рисунок 1);
Рисунок 1. Пример снимка правого глаза (OD) пациента, больного глаукомой
- Предобработка изображений
Так как качество изображений было удовлетворительным (изображения были сняты на камеру с бумажного носителя или экрана монитора), они могли быть изменены для уменьшения шума, нормализации яркости и контрастности.
- Обучение модели
Данные были разделены на обучающую и тестовую выборки. Обучение происходило с использованием извлеченных признаков. Обозначение 1 – глаукома, 0 – иные заболевания.
- Прописывание гиперпараметров модели для повышения точности.
- Рассмотрение и оценка точности модели.
Рассмотрим ключевые метрики оценки качества бинарной классификации, а именно precision, recall, F1-score и support. Эти показатели играют важную роль в анализе производительности классификаторов, особенно в задачах, где классы имеют неравномерное распределение.
Precision (точность) измеряет долю правильно предсказанных примеров глаукомы среди всех предсказанных положительных, что позволяет оценить, насколько классификатор надежен в своих положительных предсказаниях диагноза.
Recall (полнота) отражает долю правильно диагностированных снимков среди всех фактических положительных, что важно для понимания способности модели выявлять все положительные случаи.
F1-score представляет собой гармоническое среднее между precision и recall, обеспечивая сбалансированную оценку, особенно в ситуациях, когда необходимо учитывать как ложные срабатывания, так и пропуски.
Support указывает на количество фактических примеров каждого класса в тестовом наборе данных, что помогает интерпретировать другие метрики в контексте распределения классов [1].
В таблице 1 рассматривается применение метода логистической регрессии в рамках обучения модели на ранее описанном датасете. Определим взаимосвязь между независимыми переменными (признаками) и зависимой переменной (целевой переменной) с помощью логистической функции.
Таблица 1. Обучение модели методом логистической регрессии
Признак | Precision | Recall | F1-score | Support |
0 | 0,69 | 0,69 | 0,69 | 13 |
1 | 0,75 | 0,75 | 0,75 | 16 |
Accuracy | 0,72 | 29 |
В результате этого accuracy (доля правильно классифицированных снимков (как с диагнозом «глаукома», так и иных заболеваний) к общему числу экземпляров) составляет 0,72, при этом support составляет 29. Случайный лес показал более низкий результат на то же количество support, а именно 0,69. Стохастический градиентный спуск и случайный лес составляют 0,69 (см. таблицы 3, 4, а самый худший результат показал наивный байес – 0,45 (см. таблицу 2), хотя преимущество наивного байеса заключается в его простоте и скорости обучения, что делает его эффективным для больших наборов данных. Его предположение о независимости признаков может ограничивать точность в нашей задаче.
Таблица 2. Обучение модели – наивный байес
Признак | Precision | Recall | F1-score | Support |
0 | 0,20 | 0,08 | 0,11 | 13 |
1 | 0,50 | 0,75 | 0,60 | 16 |
Accuracy | 0,45 | 29 |
Таблица 3. Обучение модели – случайный лес
Признак | Precision | Recall | F1-score | Support |
0 | 0,61 | 0,85 | 0,71 | 13 |
1 | 0,82 | 0,56 | 0,67 | 16 |
Accuracy | 0,69 | 29 |
Таблица 4. Обучение модели – стохастический градиентный спуск SVM (SGD)
Признак | Precision | Recall | F1-score | Support |
0 | 0,67 | 0,62 | 0,64 | 13 |
1 | 0,71 | 0,75 | 0,73 | 16 |
Accuracy | 0,69 | 29 |
ЗАКЛЮЧЕНИЕ И ВЫВОДЫ
В результате данного исследования было рассмотрено несколько методов обучения модели. Лучше всего себя показала логистическая регрессия с точностью 0,72, из чего можно сделать вывод, что для задачи классификации снимков этот метод наиболее предпочтителен. Логистическая регрессия и бинарная классификация являются важными инструментами для решения задач по определению диагнозов в нашей работе.
Это простая модель, которая легко интерпретируется. Она позволяет понять, как изменения в независимых переменных влияют на вероятность наступления события, также это идеально подходит для задач бинарной классификации, где необходимо предсказать одно из двух возможных состояний (глаукома или иные заболевания).
В дальнейшем планируется построить матрицы ошибок и ROC-кривые AUC для детального рассмотрения качества классификации. Несомненно, возможно исследовать обучение данного датасета на сверточных нейронных сетях, а также его расширение и изучение группы паталогически здоровых пациентов.
Об авторах
Анастасия Игоревна Медведева
РЭУ им. Г. В. Плеханова
Email: Medvedeva.AI@rea.ru
ORCID iD: 0009-0008-7583-7565
научный сотрудник учебно-научной лаборатории искусственного интеллекта, нейротехнологий и бизнес-аналитики
Россия, МоскваВалерий Васильевич Бакуткин
ООО «МАКАО ИТ»
Автор, ответственный за переписку.
Email: bakutv@bk.ru
доктор медицинских наук, профессор, генеральный директор
Россия, СаратовСписок литературы
- Баканов, Б. А. Нейросети и брендинг. Искусственный интеллект как тест на человечность / Б. А. Баканов // Бренд-менеджмент. – 2023. – № 3. – С. 170–177.
- Ивлев, Д. В. Искусственный интеллект и проблемы этики / Д. В. Ивлев // Право и практика. – 2023. – № 4. – С. 263–267.
- Медведева, А. И. Применение методов искусственного интеллекта при анализе результатов периметрии пациентов и диагностировании глаукомы / А. И. Медведева, Т. А. Жуков // Цифровая экономика. – URL: http://digital-economy.ru/stati/применение-методов-искусственного-интеллекта-при-анализе-результатов-периметрии-пациентов-и-диагностировании-глаукомы (дата обращения: 21.12.2024).
- Martins, J. Offline computer-aided diagnosis for Glaucoma detection using fundus images targeted at mobile devices / J. Martins, J. S. Cardoso, F. Soares // Comput Methods Programs Biomed. – 2020. – Vol. 192. – P. 105341.
- Refined Frequency Doubling Perimetry Analysis Reaffirms Central Nervous System Control of Chronic Glaucomatous Neurodegeneration / M. Reilly, A. Villarreal, T. Maddess, W. E Sponsel // Translational vision science & technology. – 2015. – Vol. 4, № 3. – P. 7.
Дополнительные файлы
