-
Ученые из университета Аст-Англии разработали компьютерную программу, способную читать человеческую речь по губам.
Система следит за речью человека при помощи видеокамеры.
Чтобы программа смогла проанализировать видео, речь человека была разделена на две составляющие - фонемы (звуки речи какого-либо языка или диалекта) и виземы (визуальная фонема, цифровой снимок положения губ говорящего, используемый при последующем синтезе речи по технологиям SBVTS и VTS).
Выяснилось, что фонем больше, чем визем, поэтому для системы распознания потребовалась двухуровневая иерархическая система.
Сначала ученые обучали классификаторы соотносить виземы со звуками, затем количество классификаторов было увеличено с тем, чтобы каждой виземе соответствовало несколько фонем.
Пока при распознании непрерывной речи машина понимает только 10-15% сказанного. Отдельные фонемы распознаются машиной с точностью до 25%.
Программа будет усовершенствована и после этого её начнут применять в случаях, когда голоса на записи плохо слышны или аудиодорожка испорчена. Учёные надеются, что компьютерное чтение по губам поможет криминалистам раскрывать преступления.
medicaldaily
1990-2017 Сайт для детей www.klepa.ru © Все права защищены.Использование представленных материалов без предварительного письменного разрешения не допускается.