Автор24

Информация о работе

Подробнее о работе

Страница работы

Распознавание речи

  • 25 страниц
  • 2016 год
  • 46 просмотров
  • 0 покупок
Автор работы

user531428

Окончил Московский государственный университет им. М. В. Ломоносова

200 ₽

Работа будет доступна в твоём личном кабинете после покупки

Гарантия сервиса Автор24

Уникальность не ниже 50%

Фрагменты работ

Введение 3
1. Проблемы распознавания речи 5
2. Скрытые марковские модели 11
3. Нейронные сети 13
4. Стандартные акустические счетa 18
Заключение 23
Список литературы 24

1. Проблемы распознавания речи
На сегодняшний день общество вносит огромное количество средств на развитие know - how и научно-исследовательские разработки для решения проблем автоматического распознавания и понимания языка.
Это стимулируется практическими потребностями, связанными с созданием систем военного и коммерческого назначения. Можно отметить, что только в Европе объем продаж систем гражданского назначения составляет несколько миллиардов долларов. При этом следует обратить внимание на то, что в практическом использовании отсутствующие системы, которые считаются вершиной развития автоматического распознавания языка.
Проблема распознавания языка на сегодняшний день считается чрезвычайно серьезной и играет чрезвычайно большую роль в общении человека с машиной.
...

2. Скрытые марковские модели
Практически все наиболее известные системы распознавания речи, созданные за последние двадцать пять лет основаны на статистических принципах и используют аппарат СММ. Основные положения теории СММ были сформулированы и опубликованы на рубеже 60-х – 70-х гг. в серии статей Баума и др. исследователей [3], а первые практические результаты использования СММ в системах АРР описаны Бейкером [4] и Елинеком с коллегами из IBM [5]. Позднее были написаны несколько обзорных статей, которые позволили использовать теорию СММ в практических приложениях [6]. Для простоты рассмотрим пример марковской модели для звука, которая изображена на рис. 3. Эта модель состоит из последовательности состояний, обозначенных S1, S2, ..., S5, которые связаны мгновенными вероятностными переходами, изображенные стрелками и имеющие вероятность aij , т.е. вероятность перехода из i-го состояния в j-е. Возможны переходы только в следующее состояние и зацикливание.
...

3. Нейронные сети
Другим классом моделей, которые были использованы для акустико-фонетического моделирования речевого сигнала являются модели искусственных нейронных сетей (ИНС), структуры и принципы работы которых основываются на биологических моделях нервных систем, особенно на моделях головного мозга. Нейронные сети могут рассматриваться как разновидность самоорганизующихся алгоритмов и представляют собой множество однотипных и параллельно функционирующих элементов или нейронов, связанных между собой и “внешним миром” с помощью специально организованных связей. Нейрону в дискретные моменты времени по входным связям передается информация, на основе которой в соответствии с некоторыми принципами формируется выходной сигнал, который в свою очередь передается на входы других нейронов или во “внешний мир”. Таким образом, основным элементом нейронной сети является нейрон. Наиболее распространенной является модель нейрона МакКаллока-Питса (рис. 4), предложенная в 1943 г.
...

4. Стандартные акустические счетa
При распознавании речевой сигнал разбивается на участки (кадры) длительностью 10–30 мс. На кадре производится оценка вектора параметров, который рассматривается как наблюдение. Для каждого наблюдения (вектора параметров) вычисляется его правдоподобие в условиях данной акустической модели. Будем называть акустическим счетом величину правдоподобия наблюдаемых параметров, а также производные от нее функции, которые не зависят от других, неизвестных, параметров. Существует несколько вариантов оценок счета при известной длительности состояний слова. Наиболее часто используются средний счет:

где Nw – длительность (число наблюдений) слова w, sj – счет наблюдения j и центрированный средний счет:
(2)
где sj – средний счет, который вычислен для длительного промежутка времени.
...

1 Оппенгейн А.В., Шафер Р.В. Цифровая обработка сигналов – М.: Радио и связь, 1979. – 347 с.
2 Кузнецов В., Отт А. Автоматический синтез речи. – Таллинн: Валгус, 1989. – 135 с.
3 Baum L.E., Petrie T. Statistical inference for probabilistic functions of finite state Markov chains // Ann. Math. Stat.1966. Vol.37. pp. 1554-1563.
4 Baker J.K. The DRAGON system - An overview // IEEE Trans. on Acoust. Speech Signal Process. 1975. Vol. ASSP-23.No. 1. pp. 24-29
5 Елинек Ф. Распознавание непрерывной речи статистическими методами // ТИИЭР. 1976. T. 64. № 4. C. 131-160.
6 Левинсон С.Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985. Т. 73. № 11. С. 100-128.
7 McCulloch W. S., Pitts W. H. A logical calculus of ideas immanent in nervous activity // Bull. Math. Biophysics, 1943.Vol. 5. pp. 115-119.
8 Rosenblatt F. Principles of Neurodynamics // Spartan Books, New York, 1959. Русский перевод: Розетблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга).М.: Мир, 1965. 480 с.
9 Rumelhart D. E., Hinton G. E., Williams R. J. Learninginternal representations by error propagation // In: Rumelhart, D. E., G. E. Hinton, (eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1 Foundations., chapter 8. Bradford Books/MIT Press, Cambridge, MA, 1986 ISBN 0-262-18120-7.
10 Minsky M., Papert S. Perceptrons // Cambridge: MIT Press.1969.
11 Lippmann R.P. Neural nets for computing // IEEE ICASSP. 1988. Vol. 1, pp. 1-6.
12 Колмогоров А.Н. О представлении непрерывных функций неcкольких переменных в виде суперпозиции непрерывных функций одного переменного и сложения // ДАН АН СССР. 1957. T. 114. № 5. С. 953-956.
13 Цыпкин Я.З. Обучение и адаптация в автоматических системах // М.: Наука, 1968. 400 с.
14 Rachna Vijay Vargiya. Keyword spotting using normalization of posterior probability of confidence measures. Ms. Thesis in Computer Science, 2005, USA.
15 Программа DETware. Национальный институт стандартов США, NIST, http://www.nist.gov.
16 Young, S. The HTK BOOK. Ver. 2.1. Cambridge University, 1997.

Форма заказа новой работы

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Согласен с условиями политики конфиденциальности и  пользовательского соглашения

Фрагменты работ

Введение 3
1. Проблемы распознавания речи 5
2. Скрытые марковские модели 11
3. Нейронные сети 13
4. Стандартные акустические счетa 18
Заключение 23
Список литературы 24

1. Проблемы распознавания речи
На сегодняшний день общество вносит огромное количество средств на развитие know - how и научно-исследовательские разработки для решения проблем автоматического распознавания и понимания языка.
Это стимулируется практическими потребностями, связанными с созданием систем военного и коммерческого назначения. Можно отметить, что только в Европе объем продаж систем гражданского назначения составляет несколько миллиардов долларов. При этом следует обратить внимание на то, что в практическом использовании отсутствующие системы, которые считаются вершиной развития автоматического распознавания языка.
Проблема распознавания языка на сегодняшний день считается чрезвычайно серьезной и играет чрезвычайно большую роль в общении человека с машиной.
...

2. Скрытые марковские модели
Практически все наиболее известные системы распознавания речи, созданные за последние двадцать пять лет основаны на статистических принципах и используют аппарат СММ. Основные положения теории СММ были сформулированы и опубликованы на рубеже 60-х – 70-х гг. в серии статей Баума и др. исследователей [3], а первые практические результаты использования СММ в системах АРР описаны Бейкером [4] и Елинеком с коллегами из IBM [5]. Позднее были написаны несколько обзорных статей, которые позволили использовать теорию СММ в практических приложениях [6]. Для простоты рассмотрим пример марковской модели для звука, которая изображена на рис. 3. Эта модель состоит из последовательности состояний, обозначенных S1, S2, ..., S5, которые связаны мгновенными вероятностными переходами, изображенные стрелками и имеющие вероятность aij , т.е. вероятность перехода из i-го состояния в j-е. Возможны переходы только в следующее состояние и зацикливание.
...

3. Нейронные сети
Другим классом моделей, которые были использованы для акустико-фонетического моделирования речевого сигнала являются модели искусственных нейронных сетей (ИНС), структуры и принципы работы которых основываются на биологических моделях нервных систем, особенно на моделях головного мозга. Нейронные сети могут рассматриваться как разновидность самоорганизующихся алгоритмов и представляют собой множество однотипных и параллельно функционирующих элементов или нейронов, связанных между собой и “внешним миром” с помощью специально организованных связей. Нейрону в дискретные моменты времени по входным связям передается информация, на основе которой в соответствии с некоторыми принципами формируется выходной сигнал, который в свою очередь передается на входы других нейронов или во “внешний мир”. Таким образом, основным элементом нейронной сети является нейрон. Наиболее распространенной является модель нейрона МакКаллока-Питса (рис. 4), предложенная в 1943 г.
...

4. Стандартные акустические счетa
При распознавании речевой сигнал разбивается на участки (кадры) длительностью 10–30 мс. На кадре производится оценка вектора параметров, который рассматривается как наблюдение. Для каждого наблюдения (вектора параметров) вычисляется его правдоподобие в условиях данной акустической модели. Будем называть акустическим счетом величину правдоподобия наблюдаемых параметров, а также производные от нее функции, которые не зависят от других, неизвестных, параметров. Существует несколько вариантов оценок счета при известной длительности состояний слова. Наиболее часто используются средний счет:

где Nw – длительность (число наблюдений) слова w, sj – счет наблюдения j и центрированный средний счет:
(2)
где sj – средний счет, который вычислен для длительного промежутка времени.
...

1 Оппенгейн А.В., Шафер Р.В. Цифровая обработка сигналов – М.: Радио и связь, 1979. – 347 с.
2 Кузнецов В., Отт А. Автоматический синтез речи. – Таллинн: Валгус, 1989. – 135 с.
3 Baum L.E., Petrie T. Statistical inference for probabilistic functions of finite state Markov chains // Ann. Math. Stat.1966. Vol.37. pp. 1554-1563.
4 Baker J.K. The DRAGON system - An overview // IEEE Trans. on Acoust. Speech Signal Process. 1975. Vol. ASSP-23.No. 1. pp. 24-29
5 Елинек Ф. Распознавание непрерывной речи статистическими методами // ТИИЭР. 1976. T. 64. № 4. C. 131-160.
6 Левинсон С.Е. Структурные методы автоматического распознавания речи // ТИИЭР. 1985. Т. 73. № 11. С. 100-128.
7 McCulloch W. S., Pitts W. H. A logical calculus of ideas immanent in nervous activity // Bull. Math. Biophysics, 1943.Vol. 5. pp. 115-119.
8 Rosenblatt F. Principles of Neurodynamics // Spartan Books, New York, 1959. Русский перевод: Розетблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга).М.: Мир, 1965. 480 с.
9 Rumelhart D. E., Hinton G. E., Williams R. J. Learninginternal representations by error propagation // In: Rumelhart, D. E., G. E. Hinton, (eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1 Foundations., chapter 8. Bradford Books/MIT Press, Cambridge, MA, 1986 ISBN 0-262-18120-7.
10 Minsky M., Papert S. Perceptrons // Cambridge: MIT Press.1969.
11 Lippmann R.P. Neural nets for computing // IEEE ICASSP. 1988. Vol. 1, pp. 1-6.
12 Колмогоров А.Н. О представлении непрерывных функций неcкольких переменных в виде суперпозиции непрерывных функций одного переменного и сложения // ДАН АН СССР. 1957. T. 114. № 5. С. 953-956.
13 Цыпкин Я.З. Обучение и адаптация в автоматических системах // М.: Наука, 1968. 400 с.
14 Rachna Vijay Vargiya. Keyword spotting using normalization of posterior probability of confidence measures. Ms. Thesis in Computer Science, 2005, USA.
15 Программа DETware. Национальный институт стандартов США, NIST, http://www.nist.gov.
16 Young, S. The HTK BOOK. Ver. 2.1. Cambridge University, 1997.

Купить эту работу

Распознавание речи

200 ₽

или заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 200 ₽

Гарантии Автор24

Изображения работ

Страница работы
Страница работы
Страница работы

Понравилась эта работа?

или

1 ноября 2019 заказчик разместил работу

Выбранный эксперт:

Автор работы
user531428
4.8
Окончил Московский государственный университет им. М. В. Ломоносова
Купить эту работу vs Заказать новую
0 раз Куплено Выполняется индивидуально
Не менее 40%
Исполнитель, загружая работу в «Банк готовых работ» подтверждает, что уровень оригинальности работы составляет не менее 40%
Уникальность Выполняется индивидуально
Сразу в личном кабинете Доступность Срок 1—4 дня
200 ₽ Цена от 200 ₽

5 Похожих работ

Реферат

реферат ПРОЦЕССОРЫ С CISC - АРХИТЕКТУРОЙ

Уникальность: от 40%
Доступность: сразу
500 ₽
Реферат

Роль государства в создании информационного общества

Уникальность: от 40%
Доступность: сразу
200 ₽
Реферат

КОД МОРЗЕ

Уникальность: от 40%
Доступность: сразу
300 ₽
Реферат

Война ПК и книг

Уникальность: от 40%
Доступность: сразу
300 ₽
Реферат

использование системы moodle в образовательном процессе

Уникальность: от 40%
Доступность: сразу
100 ₽

Отзывы студентов

Отзыв Марина [email protected] об авторе user531428 2015-03-14
Реферат

+

Общая оценка 5
Отзыв ttt2121 об авторе user531428 2015-03-25
Реферат

Доволен работой автора

Общая оценка 5
Отзыв monte к----ов0 об авторе user531428 2015-02-27
Реферат

спасибо автору .работа выполнена прекрасно с соблюдением всех правил .

Общая оценка 5
Отзыв Lika4951 об авторе user531428 2015-12-29
Реферат

Лучший автор сайта!!

Общая оценка 5

другие учебные работы по предмету

Готовая работа

Роль нефти в современном мире - доклад

Уникальность: от 40%
Доступность: сразу
300 ₽
Готовая работа

Web-сайты….

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Методология и средства разработки информационно-аналитических систем

Уникальность: от 40%
Доступность: сразу
100 ₽
Готовая работа

Роль экономиста на всех стадиях цикла ИСЭ, как заказчика и пользователя.

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Векторная архитектура компьютеров

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Преобразования информативного акустического сигнала при воздействии его на инженерно-технические коммуникации защищаемых помещений

Уникальность: от 40%
Доступность: сразу
600 ₽
Готовая работа

Принципы устройства компьютеров: «Гарвардская архитектура»

Уникальность: от 40%
Доступность: сразу
210 ₽
Готовая работа

Развитие электронной коммерции в металлургии.

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Рынок труда в электронной промышленности.

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Уроавни сетевой безопасности(7 уровней)

Уникальность: от 40%
Доступность: сразу
280 ₽
Готовая работа

Производительность компьютера, зависимость от типа задач, измерение производительности

Уникальность: от 40%
Доступность: сразу
250 ₽
Готовая работа

Применение дистанционных технологий при обучении информатике и ИКТ в старших классах.

Уникальность: от 40%
Доступность: сразу
30 ₽