Создан заказ №1621582
31 декабря 2016
Практические аспекты построения систем распознавания речи
Как заказчик описал требования к работе:
Необходимо написать и оформить курсовую работу по информационным технологиям. Пишите, пожалуйста, сразу сколько будет стоить курсовая работа.
Фрагмент выполненной работы:
Введение
Задача распознавания речи заключается в том, чтобы восстановить по звуковому сигналу слова естественного языка произнесением, которого является этот звуковой сигнал. Данная задача, как правило, решается с помощью задания эталонов слов словаря и в дальнейшем сравнения звуковых сигналов с этими эталонами. Звуковой сигнал стоит понимать, как некоторого рода целочисленный вектор значений звукового давления, который измеряется в равностоящие друг от друга моментов времени. (работа была выполнена специалистами author24.ru) Важно отметить, что мощность пространства звуковых сигналов достаточно большая. И для того, чтобы решить задачу распознавания принято для начала равномерно разбить сигнал на окна одинаковой длины. Окна преобразуют из временной области в частотную, для того чтобы близость окон относительно простых метрик соответствовала близости участков сигналов «на слух». Следом необходимо решать задачу нахождения ряда соответствий между окнами звукового сигнала, а также окнами эталонов слов словаря. Основная же сложность последней задачи заключается в том, что в различных участях звукового сигнала и в различие произнесения одного и того же слова отличаются разной степенью сжатия или же растяжения.
Предельные возможности компьютера по распознаванию речи связаны прежде всего с тем, что человек, которого можно взять за эталон распознающей системы, распознает осмысленную речь, а компьютеру в полной мере это не дано. Компьютер принципиально не может с требуемой надежностью исправлять ошибки и неоднозначности распознавания, используя синтаксическую и семантическую связь слов предложения.
Слуховой аппарат человека позволяет ему с точностью до полупространства определить направление на источник полезного сигнала и отделить его от остальных звуковых источников.
Фонетические модели, используемые в программировании алгоритмов на ЭВМ, не точны, так как не используют всего многообразия факторов. Для задания фонетических эталонов обычно используют статистические методы, предполагающие, что акустические параметры фонем распределены по нормальному закону. В реальности картина намного сложнее, что приводит к тому, что точная модель эталонов звуков и слов должна включать в себя множество эталонных элементов (по одному на каждый вариант произнесения).
Дополнительно, картина осложняется тем, что все известные алгоритмы распознавания речи являются дикторазависимыми. После настройки на голос одного диктора распознающие системы дают удовлетворительные результаты распознавания для этого типа голоса, но хуже работают на других голосах. Надежность распознавания речи человеком, напротив, не зависит от типа голоса диктора.
Все вышесказанное приводит к тому, что распознавание речи компьютером обладает ограниченной надежностью, существенно повысить которую вероятно не удастся в будущем ни путем совершенствования алгоритмов распознавания, ни путем увеличения вычислительных мощностей компьютераПосмотреть предложения по расчету стоимости
Заказчик
заплатил
заплатил
500 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
Автор24
20 дней
Заказчик воспользовался гарантией, чтобы исполнитель повысил уникальность работы
3 января 2017
Заказ завершен, заказчик получил финальный файл с работой
5
Практические аспекты построения систем распознавания речи.docx
2017-01-06 17:05
Последний отзыв студента о бирже Автор24
Общая оценка
4
Положительно
Не доделал декодирование, нет описание к каждому декодированию... Пришлось три работы переделывать на защите...