Центральная исследовательская лаборатория (Central Research Laboratory) компании Hitachi создала технологию распознавания символов в субтитрах и бегущей строке в записях телепередач.
Возможность распознавать символы в субтитрах позволяет быстро
находить нужный момент в телепередаче. Ранее такое распознавание было сильно затруднено
из-за разницы в цветах символов в одной и той же строке, а также из-за
наложения букв на элементы оформления и изображение в кадре. По словам представителей
Hitachi, новая технология сохраняет приемлемый уровень распознавания даже в
таких условиях.
В ходе проведенного исследователями эксперимента было
проанализировано около 8 часов записей спортивных передач с распознаванием
человеческих имен в субтитрах. По окончании эксперимента удалось найти имена в 329
субтитрах, причем в 93% случаев эти имена были распознаны правильно.
В этом эксперименте компания Hitachi использовала видеоряд в
формате MPEG-2, а извлечение и распознавание символов проводилось на обычном ПК.
Процессы по распознаванию символов и сравнению их последовательности с заранее внесенным
списком имен выполнялись на процессоре с частотой 400 МГц. Емкость основного хранилища
данных составила всего около 20 Мбайт.
Распознавание символов в новой технологии Hitachi выполняется
в 4 этапа. 1-ый этап: из видеоряда вычленяются прямоугольные фрагменты кадра,
содержащие текст субтитров. 2-ой этап: из каждой строки найденных областей
извлекаются последовательности символов. 3-ий этап: Последовательности символов
делятся на области с отдельными буквами, а из каждой такой области извлекается
по одному символу. 4-ый этап: найденные последовательности символов
сравниваются с заранее определенными ключевыми словами.
Как заявляет компания Hitachi, 2-ой и 3-ий этапы в этой
технологии были разработаны с нуля. На втором этапе дополнительно выполняется удаление
ненужных графических элементов. На третьем этапе теперь обеспечивается точное
извлечение даже тех символов, цвет и яркость которых отличается от других
символов в этой же строке.
Пока компания Hitachi не определила, в какой сфере конкретно
будет применяться данная технология на практике. Тем не менее, Hitachi
собирается представить эту технологии сообществу экспертов на ежегодной общей
конференции института IEICE (Institute of Electronics, Information and
Communication Engineers), сообщает techon.nikkeibp.co.jp.
|