Устойчивый поиск изображений по полному и тематическому подобию с использованием многопараметровой классификации

информационная страница проекта

Сроки выполнения исследований: 01.01.2007 - 30.06.2007

Исполнители: Пономаренко Н.Н., к.т.н., с.н.с., www.cs.tu.fi/~ponom, Лукин В.В., д.т.н., профессор, Абрамов С.К., к.т.н., ст.преп.

Дополнительная информация: исследования выполнялись при поддержке ООО "Яндекс" (www.yandex.ru), которым, в частности, был предоставлен фрагмент своей базы изображений, общим числом в 2,5 миллиона пиктограмм.

Цель исследований: разработка робастных (устойчивых к сдвигам изображения, небольшим поворотам, изменениям масштаба и температуры изображения) многопараметровых мер подобия изображений, которые можно было бы эффективно применять для нахождения полного или тематического подобия между изображениями, в том числе, и для существующих баз пиктограмм (например, для базы Яндекса).

Основные результаты:

Ближайшие перспективы: в ближайшее время мы планируем сосредоточить усилия на повышении информативности банка расстояний (внести в него до 5000 расстояний между различными признаками изображений) и на разработке демо-версии системы поиска изображений, работающей в реальном времени.

Тексты отчета и публикаций (в pdf):

report.pdf (1.9 Mb) - текст финального отчета по проекту.
entro.pdf (416 Kb) - Абрамов С.К., Лукин В.В., Пономаренко Н.Н. Мера содержания фона на основе энтропии для поиска и сортировки изображений в базах данных // Радиоэлектронные и компьютерные системы.- 2007. - N2 (21). - С. 24-28.
mera.pdf (971 Kb) - Пономаренко Н.Н., Лукин В.В., Абрамов С.К., Зеленский А.А. Меры подобия изображений для поисковых систем // Радиоэлектронные и компьютерные системы. - 2007. - N2 (21). - С. 49-58.
opti.pdf (1.2 Mb) - Пономаренко Н.Н., Абрамов С.К., Лукин В.В., Царан А.С. Оптимизация весов многопараметровой меры подобия для поиска изображений // принята в журнал Системы обработки информации. - 2007.
ustoj.pdf (677 Kb) - Роенко А.А., Февралев Д.В., Пономаренко Н.Н., Лукин В.В. Применение устойчивых оценок параметров выборок данных при обработке изображений // Восточноевропейский журнал передовых технологий. - 2007. - N3/2 (27). - С. 21-31.

Дополнительные материалы (в pdf):

tablepri.pdf (77 Kb) - состав банка признаков изображений, использовавшихся при вычислении меры подобия.
tabledis.pdf (70 Kb) - состав банка расстояний между признаками, использовавшихся при вычислении меры подобия.

Примеры поиска изображений с помощью разработанной меры подобия:

Для вывода на экран примера поиска изображений по подобию заданному образцу (первые 270 найденных изображений, образец для поиска - на первом месте) нажмите на уменьшенный фрагмент иллюстрации.
Внимание! Размер файла каждой иллюстрации - около 1 Mb!

880 kb
Поиск паспортных фотографий (всего 6% ошибок)
910 kb
Пейзаж (закат солнца) - найдено много разных вариантов заката
1120 kb
Машина - найдено много машин с разным положением в пространстве
1450 kb
Поиск логотипов (дизайнер ищет свежие идеи)
980 kb
Поиск мотоциклов
890 kb
Еще пример поиска лиц людей
1280 kb
Виды курортов
1130 kb
Макросъемка и портретная съемка
1100 kb
Пейзажи с домами
1270 kb
Обложки журналов
960 kb
Объекты на однородном фоне

Иллюстрации к параметрам сортировки изображений:

Для каждого параметра приведены 96 изображений с наибольшим его значением (левая колонка), 96 изображений с наименьшим его значением (центральная колонка) и 96 случайных изображений, отсортированных по этому параметру (правая колонка).

230 kb
Сортировка по цветовой температуре
320 kb
Сортировка по цветовой температуре
320 kb
Сортировка по цветовой температуре
715 kb
Сортировка по цветовой насыщенности
80 kb
Сортировка по цветовой насыщенности
440 kb
Сортировка по цветовой насыщенности
760 kb
Сортировка по степени детализированности
80 kb
Сортировка по степени детализированности
540 kb
Сортировка по степени детализированности
430 kb
Сортировка по наличию объекта на однородном фоне
470 kb
Сортировка по наличию объекта на однородном фоне
420 kb
Сортировка по наличию объекта на однородном фоне
200 kb
Сортировка по числу точек телесного цвета
310 kb
Сортировка по числу точек телесного цвета

Иллюстрации практических ситуаций поиска:

Для тех, кто случайно попал на эту страницу, эти иллюстрации помогут понять, в каких ситуациях может быть нужен поиск изображений по подобию, и насколько сложно в каждой ситуации это сделать.

140 kb
Структурная схема
190 kb
Поиск изображения с хорошим разрешением по его уменьшенной копии (самый простой случай для поиска - можно искать только по форме объектов)
170 kb
Поиск изображения с хорошим качеством по его сильно сжатому варианту (самый простой случай для поиска - можно искать только по форме объектов)
120 kb
Поиск картины по ее фрагменту (сложный случай поиска - невозможно искать только по форме и нужно учитывать статистические характеристики изображений)
140 kb
Поиск изображений с разными пропорциями (сложный случай поиска - невозможно искать только по форме и нужно учитывать статистические характеристики изображений)
250 kb
Поиск фотографий с одной и той же фото-сессии (очень сложный случай поиска - форма объектов полностью отличается и нужно искать подобие только по статистическим характеристикам)
250 kb
Поиск картин одного и того же художника (самый сложный случай поиска - нужно учитывать очень тонкие подобия в локальных характеристиках изображений)
470 kb
Нереальная в обозримом будущем задача для поисковых ссистем (учет смысловых подобий: оба смотрят на смородину в предвкушении наслаждения ее вкусом)