Автоматическая классификация изображения по спектральным и текстурным признакам на основе многомерной гистограммы.

Сидорова В.С.

Содержание:

1. Назначение программы

Программа предназначена для автоматической классификации многоспектральных и текстурных изображений. Разработана Сидоровой В.С. в лаборатории Обработки Изображений Института Вычислительной Математики и Математической геофизики Сибирского отделения Российской Академии Наук.

2. Основные принципы построения алгоритма

Векторное пространство признаков классифицируется предложенным новым алгоритмом кластерного анализа с применением оценок качества классификации. Под качеством понимается изолированность полученных унимодальных кластеров. В основе нового алгоритма лежит быстрый непараметрический метод Нарендры, разделяющий векторное пространство на унимодальные кластеры, соответствующие локальным максимумам гистограммы. Он не использует никаких предположений о функциях распределения различных классов, не требует никаких априорных данных (число кластеров, количество итераций и т.д.). Поиск максимумов ведется методом наискорейшего спуска с учетом дискретности данных. Быстрота алгоритма достигается за счет представления векторов в форме линейного списка, упорядоченного по их возрастанию. На лабораторном сайте http://ipl.sscc.ru/lab/Weblab/LeraKlas/DEMRU/DemonRu.htm. алгоритм Нарендры подробно описан, там же помещена демонстрационная версия, включающая исполнительный файл (exe) и тестовое трехспектральное изображение тающих снегов поверхности Земли со спутника NOAA . Алгоритм Нарендры предполагал предварительное квантование векторного пространства, но число уровней квантования задавалось произвольно.

Новый алгоритм автоматизирует выбор числа уровней квантования, основываясь на оценке изолированности кластеров по предложенной мере. Строится ряд классификаций методом Нарендры для различного числа уровней квантования, и из этого ряда автоматически выбираются лучшие распределения, соответствующие минимумам меры изолированности кластеров. Такой подход позволяет получить лучшие распределения по унимодальным кластерам, сократив при этом их число.

Предложенная индикаторная мера оценки качества распределений основана на вычислении среднего отношения значения многомерной гистограммы на границе унимодального кластера и в области модального вектора. Показано, что она позволяет корректно оценить изолированность кластеров данных высокой плотности, характерной для дистанционного зондирования. Мера соответствует требованиям достоверности неконтролируемой классификации, в отличие от традиционно применяемых мер, основанных на соотношении дисперсий и расстояний между кластерами, которые могут быть корректно использованы лишь в задачах контролируемой классификации для оценки разделимости классов.

3. Особенности классификации по текстурным признакам

Статистические текстурные признаки являются пространственными характеристиками, а не точечными в отличие от спектральных, поэтому есть некоторые особенности классификации. Текстурные признаки вычисляются в окрестности (окне) каждой точки изображения. Предложен автоматический выбор окна одного размера для всех точек изображения. От размера окна существенно зависят результаты классификации. Его выбор осуществляется путем перебора различных значений размера, начиная с некоторого небольшого, и построения распределения, лучшего по изолированности кластеров (выше описан алгоритм) для каждого из размеров. Предполагается, что для некоторого размера окна значения признаков стабилизируются для всех текстур изображения, и число кластеров перестает меняться. Этот размер и выбирается.

Другая особенность в том, что на границах объектов с разной текстурой появляются ложные кластеры. Для индикации этих узких кластеров применяется пороговый метод, доля граничных точек по отношению к площади превышает порог для ложных кластеров. Предложен алгоритм объединения ложных кластеров в цепочки по принципу плохой изолированности в пространстве признаков, с учетом близости их сегментов в плоскости изображения. Цепочка ложных кластеров выстраивается до тех пор, пока не попадется истинный кластер, и тогда всей цепочке присваивается его номер.

4. Принципы выбора признаков.

Автоматизация выбора различных моделей или статистик текстуры основана на сравнении значений предложенной ранее меры качества неконтролируемой классификации. Реализовано вычисление текстурных признаков:

1.Статистик Харалика;

2. Основанных на известной авторегрессионной модели случайного поля SAR (Simultaneus Autoregressive), определенной на двумерном тороидальном массиве изображения с заданной формой соседства пикселей. Параметры модели рассчитываются по известному численному алгоритму в условиях максимального правдоподобия; приближенные значения параметров, характеризующие зависимость пикселя от ближайших соседей и уровня шума, вычисляются в каждой точке изображения и используются как признаки текстуры, формируя многомерный вектор.

В зарубежной литературе рассмотрено применение текстурных признаков, основанных на модели SAR, для контролируемой классификации эталонных текстур альбома Бродатца. Использование этой модели для неконтролируемой классификации – новая разработка, повышающая уровень автоматического распознавания по сравнению с мировыми аналогами.

Проведены анализ и сравнение результатов классификации изображения лесных ландшафтов на аэроснимке для двух систем признаков. Для обеих систем был выполнен автоматический отбор признаков по предложенной мере. Сравнение систем признаков показало, что качество классификаций (по мере) выше для второй системы для любого числа уровней квантования. Сопоставление кластерных карт и карт, полученных наземными измерениями, подтвердило этот вывод. Исследовались различные сочетания признаков Харалика и среднего тона, однако их мощности оказалось не достаточно, чтобы различить некоторые возрастные фазы двух типов леса (сосняков и кедровников). Признаки по модели SAR показали большую различительную мощностью, чем по системе Харалика. Они позволили распознать с точностью наземной таксации возрастные фазы насаждений леса различных типов и возрастов, близких по визуальным свойствам.

5. Иллюстрация применения.

5.1. Классификация хвойных лесов.

На рис.1b черно-белый аэроснимок лесного ландшафта Западной Сибири масштаба 1:50000. Размер электронной версии изображения 1157*1178, разрешение: 5*5 кв.м/пиксель. Большую часть лесов на изображении составляют хвойные леса. Наиболее трудно различимы по текстуре кедровые и сосновые насаждения некоторых фаз. Однако их удалось отнести в разные кластеры автоматической классификацией. На рис.1с картосхема выделов изображения, построенная лесоводами по данным наземной таксации. Выдел или контур (связная область) устанавливается лесоводами по преобладающим насаждениям определенного типа и возраста, но может включать и другие элементы. На рис. 1а полученная кластерная карта по двум признакам: параметру PN модели SAR, отражающему степень гранулированности текстуры, и среднему тону.

Получено: размер окна для сбора текстурных статистик 16х16, 41 кластер для 82 уровней квантования, значение меры .47. Лесу соответствует 30 кластеров. Сравнение карты рис.1a и картосхемы рис.1с показывает, что кластеры на карте разделены по типам и фазам леса в соответствии с картосхемой.

Рис. 1. a) кластерная карта по признакам Харалика, b) аэроснимок лесного ландшафта, с) картосхема наземной таксации.

5.2. Классификация лиственных лесов

На рис.2a черно-белый аэроснимок ландшафта лиственных лесов Западной Сибири. Разрешение электронной версии изображения:
5x5кв. м/пиксель, размер 1178x1157. Особенностью рассмотренного изображения является высокая степень изрезанности границ ивняков, расположенных в пойме реки, что порождает большое число узких кластеров при кластеризации.

На рис. 2b представлена картосхема выделов изображения, построенная по данным наземной таксации. Представлены выделы ивняков и тополевников в различных возрастных состояниях. Небольшую площадь слева вверху занимают березняки. Значительную площадь покрывают разнотравные луга, изображение которых также имеет текстуру.

Рис. 2. a) аэроснимок лесного ландшафта b) картосхема наземной таксации с) кластерная карта

Классификация осуществлялась с использованием в качестве признаков: параметра Pn модели текстуры SAR, среднего тона и дисперсии. Эти три признака позволили отличить лес от лугов и различить разновозрастные насаждения ивняков и тополевников. Пространство признаков классифицировалось по алгоритму для текстурных изображений. В результате получены: размер окна для сбора статистик 14х14, минимум меры, равный 0.38 при n = 61 в диапазоне изменения числа уровней квантования n: 40< n<255. Почти все оказались узкими (тоньше окна для сбора статистик), и алгоритм объединил полученные кластеры. Алгоритм автоматически выбрал 100 (число задавалось) наиболее крупных кластера, чьи сегменты наиболее компактны в плоскости изображения, и присоединил к ним остальные. 44 из этих 100 кластеров соответствует лесу. Карта окончательной классификации показана на рис.2c.

Тополевникам соответствует четыре крупных выдела: 38, 45, 97, 68. Они различаются по возрасту и составу. В результате классификации по трем признакам каждый из этих выделов оказался представленным несколькими только своими кластерами.

Большая часть ивняков является сообществом крупных деревьев (150 лет) и поросли близкого возраста 40 лет, составляющих два яруса. Эти ивняки отнесены к одному наибольшему кластеру уже на первом этапе классификации. Два кластера соответствуют сообществу ивняков в возрасте 75 и 30 лет (выделы 47, 96). Ивняки молодого возраста (10-30), быстро меняющие вид на снимке, представлены несколькими фазами. Они попали в разные кластеры.

Березняки возраста 150 лет визуально мало отличаются от ивняков, однако они выделились в собственные кластеры.

Анализ результатов показывает, что полученные предложенным автоматическим алгоритмом кластерные карты соответствуют картосхемам наземной таксации. Каждому типу и состоянию леса соответствует 1-3 кластера. Точность распознавания не уступает наземной таксации.

6. Управление программой.

Алгоритм реализован в программной среде системы объектно-ориентированного программирования Visual C++ версии 5.0 фирмы Microsoft c библиотекой классовMFC, разработанная для ОС Windows.
При разработке программы использовался механизм многодокументного интерфейса MDI, который позволяет работать одновременно с несколькими изображениями (документами), каждое из которых связано со своим окном.

Параметры выбора режима работы программы подробно описаны в меню Help пользовательского окна программы. Может быть задан интервал и шаг по числу уровней квантования для поиска лучших распределений с выводом на экран их кластерных карт и характеристик. В другом режиме можно просмотреть подряд все классификации для выбранных уровней квантования.

Статистические текстурные признаки вычисляются в одном из выбранных каналов как дополнение к спектральным, в частных случаях могут быть заданы лишь спектральные, или только текстурные.

Общие характеристики найденных распределений (значение меры изолированности, число уровней квантования, число кластеров) и свойства соответствующих кластеров: значения наиболее вероятных векторов и их плотности вероятности, площади, граничные точки по всем спектральным каналам и др., заносятся в таблицы и могут быть показаны на экране и записаны в файл. Карта кластеров получается в виде BMP-файла (256-цветного).

Сразу после запуска программы главное окно содержит изображения панели инструментов и строки состояния. ….Управление программой осуществляется с помощью команд меню. При перемещении курсора по командам раскрытого меню или командам панели инструментов в левой части строки состояния отображается краткое описание функции, связанной с этой командой….

Меню главного окна состоит из команд File, View, Help. Каждая из этих команд является, в свою очередь, раскрываемым меню с командами:
File:New... - создание нового пустого дочернего окна,
Open... - чтение существующего файла изображения или файла-таблицы кластеров,
View:ToolBar - управление видимостью панели инструментов,
StatusBar - управление видимостью линейки состояния,
Help: About... - сведения о программе.
Using… - подробное описание программы, вводимых параметров и полученных результатоов.
В главном окне всплывает подсказка: Откройте файл изображения. Меню File поможет выбрать файл для обработки. При нажатии на команду меню File/Open внутри главного окна создается дочернее окно. При создании дочернего окна меню главного окна по умолчанию заменяется на меню дочернего окна, состоящего из команд File, Clust, Equal, View, Window, Help. Каждое из этих меню содержит подменю.
Меню File содержит те же команды, что и в меню главного окна, дополненные командами
File:Close - закрыть файл,
Save - сохранить файл,
Save as - сохранить файл под другим именем.
Print- печать,
PrintPreview - предварительный просмотр печати,
PrintSetup - установка параметров печати.
Эта группа обычных команд печати позволяет распечатать изображение или таблицу. Заметим, что PrintPreview позволяет увидеть изображение целиком.
Equal – осуществляет эквализацию для заданного канала многоспектрального изображения.
Clust:ClustGist+Text - запускает программу, которая вычисляет текстурные признаки эквализованного изображения (если такие используются), выбирая размер окна для сбора статистик, формирует совокупные векторы (спектральные + текстурные); строит многомерную гистограмму векторного пространства, осуществляет классификацию векторов для различных значений числа уровней квантования пространства, определяет из них несколько лучших классификаций для последовательности наименьших значений минимумов меры качества. Объединяет ложные кластеры с соседними. Для каждого выбранного или полученного уровня квантования (в зависимости от заданного режима) алгоритм строит карту кластеров и визуализирует ее в новое окно. Автоматически выводится также в новое окно таблица характеристик кластеров. По щелчку л. кнопки мыши в заданную позицию карты кластеров, цвет соответствующего кластера меняется на инвертированный и выводится номер кластера, по которому можно определить его характеристики в таблице.
ClustTable - дополнительная возможность вывести текущую таблицу на экран.
ClustMap- дополнительная возможность вывести текущую карту кластеров на экран
RestoreMap-возвращает исходную окраску кластерам.
Window: New... - создание нового окна с видом текущего (активного) документа,
Cascade - каскадное расположение окон,
Tile - расположить окна горизонтально (одно под другим),
ArrangeIcons - упорядочивает свернутые окна таблиц и изображений в левом нижнем углу главного окна.
Содержимое меню Help остается неизменным.