Исследователи из Университета Брауна и Берлинского
технического университета разработали компьютерную программу, способную идентифицировать
различные объекты по схематичным наброскам. По словам разработчиков, приложение
справляется с поставленной задачей не намного хуже, чем живой зритель, и с
большой долей вероятности «угадывает» объект прямо в процессе рисования. Любопытная
разработка была впервые представлена вниманию общественности на недавней международной
конференции SIGGRAPH.
Современные компьютеры без труда распознают изображения,
набросанные «от руки». К примеру, правоохранительные органы давно пользуются
системой, способной находить снимок преступника в базе данных по предоставленному
карандашному рисунку. Однако, для того, чтобы процедура оказалась успешной,
изображение должно быть предельно реалистичным. Перед учеными из США и Германии
стоит более сложная задача. Они собираются научить компьютер распознавать
объект по абстрактному наброску.
К примеру, в ответ на просьбу нарисовать зайца многие люди
изобразят забавное «мультяшное» существо с большими ушами, выступающими зубами
и маленьким хвостом. При этом большинство зрителей без труда обнаружат на
рисунке искомое млекопитающее, несмотря на его слабое сходство с оригиналом. «Эти
карикатурные образы хорошо знакомы нам с детства. Именно так изображают зайцев
юные художники», — объясняет профессор Джеймс Хейс (James Hays) из Университета
Брауна. Компьютер, в свою очередь, лишен этого знания и не способен опознать
зайца лишь по паре длинных ушей.
Для достижения поставленной цели Хейсу и его коллегам из Берлина
пришлось создать обширную базу данных набросков, состоящую из 250 категорий. Для
заполнения базы ученые наняли большое количество добровольцев на «онлайновой» бирже
труда Amazon's Mechanical Turk, которые подготовили более 20 000 иллюстраций. Полученные
изображения были загружены в компьютер, и создаваемая программа прошла
серьезное обучение, пытаясь рассортировать их по категориям. А некоторое время
спустя был разработан специальный интерфейс, с помощью которого пользователи
могут создавать наброски, распознаваемые компьютером в режиме реального времени.
На данный момент программа способна безошибочно
идентифицировать объект в 56% случаев (при условии, что он относится к одной
из известных категорий). Такой результат можно назвать впечатляющим. Среди
живых людей точность распознавания предметов по схематичному наброску
составляет не более 73%.
Хейс и его коллеги планируют дальнейшее расширение базы
данных и собираются добавить в нее ряд дополнительных категорий. Возможно,
трудоемкий процесс создания нового контента будет оформлен в виде игры и в нем
смогут принять участие все желающие. Одно из приложений, предлагающее игрокам
изобразить тот или иной объект, уже доступно в Интернет-магазине сайте iTunes. В
будущем можно ожидать появления и других программ со схожей функциональностью.
Исследователи уверены, что их разработке найдется практическое
применение в самых разных областях. К примеру, инновационные поисковые
инструменты, создаваемые на базе предлагаемой технологии, значительно упростят
обнаружение нужной информации в глобальной сети.
По материалам сайтов ArsTechnica и GizMag.
|