Microsoft создала программу перевода речи с сохранением голоса
Крупнейшая в мире ИТ-компания Microsoft завершает работу над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса того, кто говорит, написал в корпоративном блоге директор Microsoft по разработке Рик Рашид, сообщает TCH.ua.
Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сначала его речь распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.
Финальным этапом стал голосовой перевод его речи — Рашид произносил предложения на английском языке, а программа воспроизводила их на китайском с сохранением особенностей голоса топ-менеджера Microsoft.
"Наиболее значительным является то, что мы добились важной цели — смогли позволить англоязычному человеку, похожему на меня, провести презентацию на китайском, сохраняя свой голос", — отметил Рашид.
Данная технология явилась результатом совместных исследований корпорации Microsoft и университета Торонто. Несмотря на то, что специалисты усердно работали над программой в течение двух лет, программе не удается избежать некоторых ошибок, в частности при воспроизведении она ошибается на одном слове из семи-восьми, отмечает Devicebox.
Рашид признал наличие ошибок и отметил, что в течение ближайших лет эти упущения в программе будут устранены и появится беспрецедентная возможность практически полностью устранить языковой барьер. На вопрос о том, будет ли программа платной, и какова будет её стоимость, директор по разработкам не ответил.
Компания экспериментировала со статистическими моделями, которые способны лучше захватить вокальный диапазон человека.Перевод был неправильным в каждом четвертом слове, но компания Microsoft продолжала работать, и после некоторого периода работы с учеными из университета Торонто в 2010 году, они обнаружили, что они могли бы использовать технику, называемую Deep Neural Network, добавляет WorldScience.
Рашид пишет, что это было сделано "по образцу человеческого поведения мозга", в результате чего значительно улучшился процент успеха.