Двое ученых их Токийского университета собираются научить
компьютер петь естественным человеческим голосом. При этом речь идет не просто об очередной программе, способной синтезировать человеческую речь. Методика, предложенная Акио Ватанабе (Akio Watanabe) и Хитоши Иба (Hitoshi Iba), сделает вокальные партии, синтезированные с помощью компьютера, неотличимыми от исполнения талантливого живого вокалиста.
Компьютер достаточно давно научился не только синтезировать человеческий голос, но и имитировать живой вокал. Существует немало приложений, способных генерировать песни в «живом» исполнении на основе введенного текста и мелодии, одним из наиболее распространенных таких пакетов является Vocaloid. К
сожалению, несмотря на непрерывное усовершенствование подобных программ, идентифицировать компьютерного исполнителя по-прежнему может любой человек с хорошим слухом.
Опытные звукорежиссеры вынуждены вручную обрабатывать
аудиоматериал и делать исполнение более живым за счет добавления эффектов, таких как дрожание и вибрация. Очеловечивание синтезированного вокала представляет собой весьма сложный и трудоемкий процесс. Однако, даже после самой тщательной обработки в записи остаются «артефакты», выдающие искусственное происхождение оригинала. Акио Ватанабе (Akio Watanabe) и Хитоши
Иба (Hitoshi Iba) предлагают решить проблему с использованием инновационной методики, имитирующей процесс эволюции.
Созданная инженерами надстройка для системы Vocaloid,
позволяет звукорежиссеру прослушивать восемь вариантов синтезированного вокала, которые отличаются друг от друга различными настройками параметров. После прослушивания всех вариантов режиссер с помощью доступных ему элементов
управления отмечает насколько полно предложенные модификации соответствуют предъявляемым требованиям. На основании этих данных наиболее жизнеспособные образцы «эволюционируют» на следующую «ступень», в которой отсутствуют обнаруженные огрехи и недочеты. В предлагаемой схеме также действует и закон естественного отбора, согласно которому наиболее слабые варианты компьютерного исполнения выбывают из игры. После многократного повторения указанной процедуры компьютер выдаст идеальную вокальную партию, синтезированную компьютером.
Разработчики сравнивают предлагаемую методику не только с
процессом эволюции, но и с телевизионным конкурсом талантов, в котором «выживают» самые сильные исполнители. Впрочем, в отличие от телешоу, новая технология не столько отбирает лучших претендентов, сколько обеспечивает рождение будущих звезд виртуальной сцены непосредственно в процессе прослушивания.
По материалам сайта TheRegister.
|