+
Подробнее о работе
Гарантия сервиса Автор24
Уникальность не ниже 50%
Введение 3
1. Проблемы распознавания речи 5
2. Скрытые марковские модели 11
3. Нейронные сети 13
4. Стандартные акустические счетa 18
Заключение 23
Список литературы 24
1. Проблемы распознавания речи
На сегодняшний день общество вносит огромное количество средств на развитие know - how и научно-исследовательские разработки для решения проблем автоматического распознавания и понимания языка.
Это стимулируется практическими потребностями, связанными с созданием систем военного и коммерческого назначения. Можно отметить, что только в Европе объем продаж систем гражданского назначения составляет несколько миллиардов долларов. При этом следует обратить внимание на то, что в практическом использовании отсутствующие системы, которые считаются вершиной развития автоматического распознавания языка.
Проблема распознавания языка на сегодняшний день считается чрезвычайно серьезной и играет чрезвычайно большую роль в общении человека с машиной.
...
2. Скрытые марковские модели
Практически все наиболее известные системы распознавания речи, созданные за последние двадцать пять лет основаны на статистических принципах и используют аппарат СММ. Основные положения теории СММ были сформулированы и опубликованы на рубеже 60-х – 70-х гг. в серии статей Баума и др. исследователей [3], а первые практические результаты использования СММ в системах АРР описаны Бейкером [4] и Елинеком с коллегами из IBM [5]. Позднее были написаны несколько обзорных статей, которые позволили использовать теорию СММ в практических приложениях [6]. Для простоты рассмотрим пример марковской модели для звука, которая изображена на рис. 3. Эта модель состоит из последовательности состояний, обозначенных S1, S2, ..., S5, которые связаны мгновенными вероятностными переходами, изображенные стрелками и имеющие вероятность aij , т.е. вероятность перехода из i-го состояния в j-е. Возможны переходы только в следующее состояние и зацикливание.
...
3. Нейронные сети
Другим классом моделей, которые были использованы для акустико-фонетического моделирования речевого сигнала являются модели искусственных нейронных сетей (ИНС), структуры и принципы работы которых основываются на биологических моделях нервных систем, особенно на моделях головного мозга. Нейронные сети могут рассматриваться как разновидность самоорганизующихся алгоритмов и представляют собой множество однотипных и параллельно функционирующих элементов или нейронов, связанных между собой и “внешним миром” с помощью специально организованных связей. Нейрону в дискретные моменты времени по входным связям передается информация, на основе которой в соответствии с некоторыми принципами формируется выходной сигнал, который в свою очередь передается на входы других нейронов или во “внешний мир”. Таким образом, основным элементом нейронной сети является нейрон. Наиболее распространенной является модель нейрона МакКаллока-Питса (рис. 4), предложенная в 1943 г.
...
4. Стандартные акустические счетa
При распознавании речевой сигнал разбивается на участки (кадры) длительностью 10–30 мс. На кадре производится оценка вектора параметров, который рассматривается как наблюдение. Для каждого наблюдения (вектора параметров) вычисляется его правдоподобие в условиях данной акустической модели. Будем называть акустическим счетом величину правдоподобия наблюдаемых параметров, а также производные от нее функции, которые не зависят от других, неизвестных, параметров. Существует несколько вариантов оценок счета при известной длительности состояний слова. Наиболее часто используются средний счет:
где Nw – длительность (число наблюдений) слова w, sj – счет наблюдения j и центрированный средний счет:
(2)
где sj – средний счет, который вычислен для длительного промежутка времени.
...
1 Оппенгейн А.В., Шафер Р.В. Цифровая обработка сигналов – М.: Радио и связь, 1979. – 347 с.
2 Кузнецов В., Отт А. Автоматический синтез речи. – Таллинн: Валгус, 1989. – 135 с.
3 Baum L.E., Petrie T. Statistical inference for probabilistic functions of finite state Markov chains // Ann. Math. Stat.1966. Vol.37. pp. 1554-1563.
4 Baker J.K. The DRAGON system - An overview // IEEE Trans. on Acoust. Speech Signal Process. 1975. Vol. ASSP-23.No. 1. pp. 24-29
5 Елинек Ф. Распознавание непрерывной речи статистическими методами // ТИИЭР. 1976. T. 64. № 4. C. 131-160.
6 Левинсон С.Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985. Т. 73. № 11. С. 100-128.
7 McCulloch W. S., Pitts W. H. A logical calculus of ideas immanent in nervous activity // Bull. Math. Biophysics, 1943.Vol. 5. pp. 115-119.
8 Rosenblatt F. Principles of Neurodynamics // Spartan Books, New York, 1959. Русский перевод: Розетблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга).М.: Мир, 1965. 480 с.
9 Rumelhart D. E., Hinton G. E., Williams R. J. Learninginternal representations by error propagation // In: Rumelhart, D. E., G. E. Hinton, (eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1 Foundations., chapter 8. Bradford Books/MIT Press, Cambridge, MA, 1986 ISBN 0-262-18120-7.
10 Minsky M., Papert S. Perceptrons // Cambridge: MIT Press.1969.
11 Lippmann R.P. Neural nets for computing // IEEE ICASSP. 1988. Vol. 1, pp. 1-6.
12 Колмогоров А.Н. О представлении непрерывных функций неcкольких переменных в виде суперпозиции непрерывных функций одного переменного и сложения // ДАН АН СССР. 1957. T. 114. № 5. С. 953-956.
13 Цыпкин Я.З. Обучение и адаптация в автоматических системах // М.: Наука, 1968. 400 с.
14 Rachna Vijay Vargiya. Keyword spotting using normalization of posterior probability of confidence measures. Ms. Thesis in Computer Science, 2005, USA.
15 Программа DETware. Национальный институт стандартов США, NIST, http://www.nist.gov.
16 Young, S. The HTK BOOK. Ver. 2.1. Cambridge University, 1997.
Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям
Введение 3
1. Проблемы распознавания речи 5
2. Скрытые марковские модели 11
3. Нейронные сети 13
4. Стандартные акустические счетa 18
Заключение 23
Список литературы 24
1. Проблемы распознавания речи
На сегодняшний день общество вносит огромное количество средств на развитие know - how и научно-исследовательские разработки для решения проблем автоматического распознавания и понимания языка.
Это стимулируется практическими потребностями, связанными с созданием систем военного и коммерческого назначения. Можно отметить, что только в Европе объем продаж систем гражданского назначения составляет несколько миллиардов долларов. При этом следует обратить внимание на то, что в практическом использовании отсутствующие системы, которые считаются вершиной развития автоматического распознавания языка.
Проблема распознавания языка на сегодняшний день считается чрезвычайно серьезной и играет чрезвычайно большую роль в общении человека с машиной.
...
2. Скрытые марковские модели
Практически все наиболее известные системы распознавания речи, созданные за последние двадцать пять лет основаны на статистических принципах и используют аппарат СММ. Основные положения теории СММ были сформулированы и опубликованы на рубеже 60-х – 70-х гг. в серии статей Баума и др. исследователей [3], а первые практические результаты использования СММ в системах АРР описаны Бейкером [4] и Елинеком с коллегами из IBM [5]. Позднее были написаны несколько обзорных статей, которые позволили использовать теорию СММ в практических приложениях [6]. Для простоты рассмотрим пример марковской модели для звука, которая изображена на рис. 3. Эта модель состоит из последовательности состояний, обозначенных S1, S2, ..., S5, которые связаны мгновенными вероятностными переходами, изображенные стрелками и имеющие вероятность aij , т.е. вероятность перехода из i-го состояния в j-е. Возможны переходы только в следующее состояние и зацикливание.
...
3. Нейронные сети
Другим классом моделей, которые были использованы для акустико-фонетического моделирования речевого сигнала являются модели искусственных нейронных сетей (ИНС), структуры и принципы работы которых основываются на биологических моделях нервных систем, особенно на моделях головного мозга. Нейронные сети могут рассматриваться как разновидность самоорганизующихся алгоритмов и представляют собой множество однотипных и параллельно функционирующих элементов или нейронов, связанных между собой и “внешним миром” с помощью специально организованных связей. Нейрону в дискретные моменты времени по входным связям передается информация, на основе которой в соответствии с некоторыми принципами формируется выходной сигнал, который в свою очередь передается на входы других нейронов или во “внешний мир”. Таким образом, основным элементом нейронной сети является нейрон. Наиболее распространенной является модель нейрона МакКаллока-Питса (рис. 4), предложенная в 1943 г.
...
4. Стандартные акустические счетa
При распознавании речевой сигнал разбивается на участки (кадры) длительностью 10–30 мс. На кадре производится оценка вектора параметров, который рассматривается как наблюдение. Для каждого наблюдения (вектора параметров) вычисляется его правдоподобие в условиях данной акустической модели. Будем называть акустическим счетом величину правдоподобия наблюдаемых параметров, а также производные от нее функции, которые не зависят от других, неизвестных, параметров. Существует несколько вариантов оценок счета при известной длительности состояний слова. Наиболее часто используются средний счет:
где Nw – длительность (число наблюдений) слова w, sj – счет наблюдения j и центрированный средний счет:
(2)
где sj – средний счет, который вычислен для длительного промежутка времени.
...
1 Оппенгейн А.В., Шафер Р.В. Цифровая обработка сигналов – М.: Радио и связь, 1979. – 347 с.
2 Кузнецов В., Отт А. Автоматический синтез речи. – Таллинн: Валгус, 1989. – 135 с.
3 Baum L.E., Petrie T. Statistical inference for probabilistic functions of finite state Markov chains // Ann. Math. Stat.1966. Vol.37. pp. 1554-1563.
4 Baker J.K. The DRAGON system - An overview // IEEE Trans. on Acoust. Speech Signal Process. 1975. Vol. ASSP-23.No. 1. pp. 24-29
5 Елинек Ф. Распознавание непрерывной речи статистическими методами // ТИИЭР. 1976. T. 64. № 4. C. 131-160.
6 Левинсон С.Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985. Т. 73. № 11. С. 100-128.
7 McCulloch W. S., Pitts W. H. A logical calculus of ideas immanent in nervous activity // Bull. Math. Biophysics, 1943.Vol. 5. pp. 115-119.
8 Rosenblatt F. Principles of Neurodynamics // Spartan Books, New York, 1959. Русский перевод: Розетблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга).М.: Мир, 1965. 480 с.
9 Rumelhart D. E., Hinton G. E., Williams R. J. Learninginternal representations by error propagation // In: Rumelhart, D. E., G. E. Hinton, (eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1 Foundations., chapter 8. Bradford Books/MIT Press, Cambridge, MA, 1986 ISBN 0-262-18120-7.
10 Minsky M., Papert S. Perceptrons // Cambridge: MIT Press.1969.
11 Lippmann R.P. Neural nets for computing // IEEE ICASSP. 1988. Vol. 1, pp. 1-6.
12 Колмогоров А.Н. О представлении непрерывных функций неcкольких переменных в виде суперпозиции непрерывных функций одного переменного и сложения // ДАН АН СССР. 1957. T. 114. № 5. С. 953-956.
13 Цыпкин Я.З. Обучение и адаптация в автоматических системах // М.: Наука, 1968. 400 с.
14 Rachna Vijay Vargiya. Keyword spotting using normalization of posterior probability of confidence measures. Ms. Thesis in Computer Science, 2005, USA.
15 Программа DETware. Национальный институт стандартов США, NIST, http://www.nist.gov.
16 Young, S. The HTK BOOK. Ver. 2.1. Cambridge University, 1997.
Купить эту работу vs Заказать новую | ||
---|---|---|
0 раз | Куплено | Выполняется индивидуально |
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что
уровень оригинальности
работы составляет не менее 40%
|
Уникальность | Выполняется индивидуально |
Сразу в личном кабинете | Доступность | Срок 1—4 дня |
200 ₽ | Цена | от 200 ₽ |
Не подошла эта работа?
В нашей базе 85958 Рефератов — поможем найти подходящую