Другие журналы
|
электронный научно-технический журналИНЖЕНЕРНЫЙ ВЕСТНИКИздатель: Общероссийская общественная организация "Академия инженерных наук им. А.М. Прохорова".
Анализ подходов к решению задачи распознавания интенсивных кратковременных звуков
Инженерный вестник # 03, март 2015 УДК: 004.052
Файл статьи:
Ivanova_G.pdf
(920.52Кб)
В статье выполнен анализ подходов к решению задачи распознавания интенсивных кратковременных звуков (ИКЗ), которые возникают при выстрелах, хлопках, взрывах и имеют длительность менее 0,5 секунды и громкость значительно (на 15 и более дБ) выше, чем фоновые звуки. Выбран формат звукового файла, позволяющий распознавать ИКЗ в реальном времени. Выявлены факторы, которые необходимо учитывать при распознавании ИКЗ. Выполнен анализ применимости методов распознавания речи для распознавания ИКЗ. Предложен метод распознавания, основанный на простотой по сравнению с распознаванием речи форме звукового сигнала ИКЗ, и способ увеличения надежности распознавания. Список литературы 1. Фролов А.В., Фролов Г.В. Синтез и распознавание речи. Современные решения.– Ре-жим доступа: http://www.frolov-lib.ru/books/hi/ch05.html (дата обращения: 10.01.2015). 2. Кинтцель Т. Руководство программиста по работе со звуком = A Programmer's Guide to Sound: Пер. с англ. – М.: ДМК Пресс, 2000. 432 с, ил. (Серия «Для программистов»). 3. Распознавание речи. Режим доступа: http://habrahabr.ru/post/226143/ (дата обращения 1.12.2014 г.). 4. Костромицкий С.П. Распознавание длящихся звуков речи // Вестник Тамбовского уни-верситета. Серия Естественные и технические науки. 2003. №1. С. 204. 5. Компьютерное распознавание и порождение речи. Режим доступа: http://speech-text.narod.ru/chap4_1_1.html (дата обращения: 10.01.2015). 6. Савельев И.В. Курс общей физики. Механика, колебания и волны, молекулярная физи-ка. Том I М.: Наука, гл. ред. физ-мат. лит., 1970. — 508с. 7. Сравнение цифровых аудиоформатов. Режим доступа: https://ru.wikipedia.org/wiki/ (дата обращения: 10.01.2015). 8. Реверберация звука. Режим доступа: http://wikisound.org/Реверберация (дата обращения 10.01.2015). 9. Elinek F. Распознавание непрерывной речи статистическими методами // ТИИЭР 64. 1976. №4. С.131-160. 10. Кульков Я.Ю., Кропотов Ю.А. Анализ факторов снижения разборчивости речи в сис-темах громкоговорящей связи // ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛО-ГИИ. 2008. №1-3. С. 129-133. 11. Рудаков И.В., Романов А.С. Распознавание текстового изображения с учетом морфоло-гии слова // Наука и образование: электронное научно-техническое издание. 2012. № 4. Режим доступа: http://technomag.bmstu.ru/doc/350020.html (дата обращения 10.1.2015). 12. Галкин В.А., Чернуха С.Н. Исследование быстродействия нейросетевого распознавателя подчерка // Наука и образование: электронное научно-техническое издание. 2011. № 12. Режим доступа: http://technomag.bmstu.ru/doc/280351.html (дата обращения 10.01.2015). 13. Гапочкин А.В. Нейронные сети в системах распознавания речи // Science Time. 2014. №1. С. 29-36. 14. Нейронные сети для любопытных программистов. Режим доступа: http://habrahabr.ru/sandbox/76908/ (дата обращения 10.01.2015). Публикации с ключевыми словами: интенсивные кратковременные звуки, распознавание звуков, точность распознавания Публикации со словами: интенсивные кратковременные звуки, распознавание звуков, точность распознавания Тематические рубрики: Поделиться:
|
|
|||||||||||||||||||
|