Определение инвариантных характеристик цифрового изображения и их вычисление в системе MatLab
- Авторы: Самарина О.В.1, Самарин В.А.1
-
Учреждения:
- Югорский государственный университет
- Выпуск: Том 19, № 1 (2023)
- Страницы: 77-82
- Раздел: МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
- Статья опубликована: 09.04.2023
- URL: https://vestnikugrasu.org/byusu/article/view/112484
- DOI: https://doi.org/10.18822/byusu20230177-82
- ID: 112484
Цитировать
Полный текст
Аннотация
Предмет исследования: одноканальное полутоновое цифровое изображение, инварианты второго порядка относительно группы движений и растяжений.
Цель исследования: определить новую группу инвариантов одноканального цифрового изображения относительно сдвигов, поворотов и растяжений цифрового изображения.
Методы и объекты исследования: объектом исследования являются одноканальные изображения. Разработанные вычислительные алгоритмы основаны на комплексном использовании аналитических и геометрических методов исследования, теории инвариантов и вейвлетов.
Основные результаты исследования: разработана вычислительная схема определения группы инвариантных характеристик относительно таких преобразований цифрового изображения как сдвиги, повороты и растяжения.
Ключевые слова
Полный текст
Введение
Инвариантные характеристики изображения являются точным математическим инструментом, позволяющим решать широкий класс задач обработки и анализа одноканальных и многоканальных изображений, таких так распознавание образов, поиск объектов по образцу и другие. Инварианты способны передавать характерные особенности изображения и выступать в роли существенных признаков при преобразованиях первичного изображения, таких как сдвиг, поворот, масштабирование, изменения контрастности и яркости. Также инвариантные характеристики характеризуются способностью к обобщению, что в свою очередь является необходимым качеством для моделей и методов искусственного интеллекта, нейронных сетей.
В настоящее время исследования, направленные на поиск и исследование инвариантных характеристик цифрового изображения, являются достаточно актуальными. Они получают развитие в областях распознавания текста, анализа 3D-изображений [1–3]. Однако на практике реальные цифровые содержат помехи, неточности и шумы. Кроме того, цифровые изображения не являются непрерывными, они определятся значениями пикселей в дискретных координатах. Таким образом перед исследователями встает задача определения методов и моделей обработки цифрового дискретного изображения и определения для данного изображения ряда устойчивых инвариантных характеристик [4].
В данной работе представлены инварианты второго порядка (числовые функции, содержащие производные первого и второго порядков) относительно группы аффинных преобразований, а также яркости, контрастности изображения. Использование в методах обработки и анализа цифровых изображений инвариантов второго порядка позволяет найти достаточно устойчивую относительно помех и шума изображения числовую характеристику и существенно снизить сложность метода, что является ощутимым преимуществом при практической реализации алгоритма.
Результаты и обсуждение
Представим цифровое полутоновое изображение в виде непрерывной функции . Будем считать, что данная функция цифрового изображения дважды непрерывно дифференцируема. Тогда справедливо разложение Тейлора второго порядка с произвольной точкой рассматриваемой области в виде центра. При помощи простых преобразований любую точку области можно перевести в начало координат. Тогда функция цифрового полутонового изображения будет иметь вид:
В данной записи коэффициенты разложения представляют собой значения функции, дифференциалов первого и второго порядка в начале координат:
Представим, что цифровое изображение претерпело некоторые преобразования (такие как сдвиг, масштабирование, поворот). Обозначим эту группу преобразований как G. В таком случае можем записать
В этой записи коэффициент соответствует преобразованию плоскости цифрового изображения, угол – повороту, а множитель – можно описать как коэффициент соответствующий частотному диапазону данного изображения, а также как фактор поглощения среды, действующий в окрестности рассматриваемой точки.
Определение. Числовая функция нетождественно равная константе является инвариантом цифрового изображения порядка , если она сохраняет свое значение под действием преобразований группы .
Замечание. Размерность пространства инвариантов определяется по формуле:
.
Заметим, что группа преобразований действует в пространстве параметров и образует трехмерную коммутативную группу Ли
Для произвольной функции параметров детерминированы инфинитезимальные дифференциальные операторы , ,
Теорема 1. Дифференциальные операторы , , представимы в следующем виде
,
,
.
Доказательство:
Параметр преобразуется по формуле , т.е.
, ,
,
,
,
.
Воспользовавшись данным преобразованием, найдем значения следующих дифференциальных операторов:
,
,
.
Выполнив вычисления с учетом указанных выше начальных условий, получим:
,
,
.
Теорема доказана.
Теорема 2. Данные функции являются инвариантами цифрового изображения второго порядка относительно группы преобразований, включающих в себя движения, растяжения и калибровку цифрового полутонового изображения:
Доказательство.
Проверяется непосредственно.
Замечание. Для представленных инвариантов справедлива следующая оценка:
Для выполнения расчетов данных инвариантов в системе Matlab необходимо дополнительно рассмотреть дискретную модель цифрового полутонового изображения.
В силу технических ограничений память компьютера способна хранить и обрабатывать только дискретные числа. Поэтому при оцифровке непрерывная функция изображения превращается в дискретную – возникает прямоугольная решетка точек изображения. И таким образом при любых операциях с использованием цифровых технических средств, таких как хранение, обработка и анализ, полутоновое изображение представляет собой матрицу определенного размера со значениями пикселей в узлах сетки (рис. 1).
Рисунок 1 – Дискретная сетка цифрового изображения
Система Matlab обладает широкими возможностями обработки и анализа цифровых изображений. При помощи встроенных функций системы была проведена загрузка группы тестовых изображений. Данные группы содержат изображения одной и той же области, но содержащие определенные отличия, такие как уровень яркости, сдвиг по вертикали и горизонтали, угол поворота (рис. 2).
Рисунок 2 – Пример группы изображений
Для каждого из изображений группы были проведены вычисления инвариантных характеристик . Для оценки результативности характеристик рассматривались значения функции распределения разностей между инвариантными характеристиками вычисленных для значения дискретной функции во всех узлах сетки. Проведенные исследования позволяют сделать вывод: для предполагаемого наличия общих областей на изображениях размером достаточно, чтобы у значений сумма попарных разностей по рассмотренным инвариантным характеристикам не превышала величину .
Заключение и выводы
Проведенные теоретические исследования и вычислительные эксперименты позволяют сделать вывод о том, что представленные в данной работе инвариантные характеристики цифрового одноканального изображения относительно группы аффинных преобразований, а также яркости, контрастности изображения можно эффективно использовать при решении различных задач анализа и обработки цифрового изображений, таких как сортировка изображений, поиск снимков по образцу, распознавание изображений и другие.
Об авторах
Ольга Владимировна Самарина
Югорский государственный университет
Автор, ответственный за переписку.
Email: O_Samarina@ugrasu.ru
кандидат физико-математических наук, доцент, руководитель инженерной школы цифровых технологий
Россия, Ханты-МансийскВалерий Анатольевич Самарин
Югорский государственный университет
Email: V_Samarin@ugrasu.ru
кандидат технических наук, доцент, доцент инженерной школы цифровых технологий
Россия, Ханты-МансийскСписок литературы
- Абрамов, Н. С. Обзор методов распознавания образов на основе инвариантов к яркостным и геометрическим преобразованиям / Абрамов Н. С., Фраленко В. П., Хачумов М. В. – Текст : непосредственный // Современные наукоемкие технологии. – 2020. – № 6-1. – С. 110–117.
- Нгуен, З. Т. Инварианты в задачах распознавания графических образов / Нгуен З. Т. – Текст : непосредственный // Вестник РУДН. Серия Математика. Информатика. Физика. – 2016. – № 1. – С. 76–85.
- Самарина, О. В. Применение интегральных топографических характеристик в решении задач обработки данных дистанционного зондирования / Самарина О. В., Славский В. В., Семенов С. П. – Текст : непосредственный // Математические заметки СВФУ. – Январь-март 2020. – Т. 27, № 1. – С. 41–50.
- Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. – СПб. : Питер, 2003. – 608 с. – Текст : непосредственный.
