Алгоритм классификации с полуобучением в виде веб-сервиса для обработки многоспектральных изображений
Семинар: Информационные технологии
Начало заседания: 14:35
Дата выступления: 11 Май 2010
Организация: НГУ
Авторы: Павел Владимирович Мельников
В задачах классификации изображений процесс получения обучающей выборки (ОВ) зачастую связан со значительными материальными затратами. Поэтому ОВ, как правило, имеется лишь для интересующих пользователя классов и является непредставительной. В этих условиях могут работать так называемые алгоритмы с полуобучением. Однако из-за высокой вычислительной трудоемкости они не нашли широкого применения для обработки изображений. Для решения этой проблемы предлагается применять алгоритм с полуобучением soft-PARZEN не ко всем данным, а к выбранному некоторым образом подмножеству точек. После классификации этого множества, его можно рассматривать как обучающую выборку и применять традиционные алгоритмы обработки для всего объема данных. Алгоритм разбивается на 3 этапа. На первом этапе к множеству классифицируемых векторов применяется быстрый сеточный алгоритм кластеризации CCA. Он разбивает все множество точек на некоторое множество кластеров. Из них берутся те, которые содержат точки ОВ и смежные с ними, остальные отбрасываются. На втором этапе ОВ дополняется локальными модами из кластеров, содержащих точки ОВ. На третьем этапе алгоритм soft-PARZEN применяется к небольшому подмножеству исходных данных для второго расширения ОВ. Алгоритм реализован в виде модуля в системе веб-сервисов, разрабатываемой в ИВТ СО РАН. Система позволяет пользователям, использующим популярные пакеты обработки геопространственных данных (таких, как ArcGIS и GRASS), применять этот алгоритм к своим данным, используя вычислительные мощности серверов ИВТ.