Другие журналы

электронный научно-технический журнал

ИНЖЕНЕРНЫЙ ВЕСТНИК

Издатель: Общероссийская общественная организация "Академия инженерных наук им. А.М. Прохорова".

Анализ подходов к решению задачи распознавания интенсивных кратковременных звуков

Инженерный вестник # 03, март 2015
УДК: 004.052
Файл статьи: Ivanova_G.pdf (920.52Кб)
авторы: профессор Иванова Г. С., Кожушко В. В.

В статье выполнен анализ подходов к решению задачи распознавания интенсивных кратковременных звуков (ИКЗ), которые возникают при выстрелах, хлопках, взрывах и имеют длительность менее 0,5 секунды и громкость значительно (на 15 и более дБ) выше, чем фоновые звуки. Выбран формат звукового файла, позволяющий распознавать ИКЗ в реальном времени. Выявлены факторы, которые необходимо учитывать при распознавании ИКЗ. Выполнен анализ применимости методов распознавания речи для распознавания ИКЗ. Предложен метод распознавания, основанный на простотой по сравнению с распознаванием речи форме звукового сигнала ИКЗ, и способ увеличения надежности распознавания.

Список литературы
1.    Фролов А.В., Фролов Г.В. Синтез и распознавание речи. Современные решения.– Ре-жим доступа: http://www.frolov-lib.ru/books/hi/ch05.html (дата обращения: 10.01.2015).
2.    Кинтцель  Т. Руководство программиста по работе со звуком = A Programmer's Guide to Sound: Пер. с англ. – М.: ДМК Пресс, 2000. 432 с, ил. (Серия «Для программистов»).
3.    Распознавание речи. Режим доступа: http://habrahabr.ru/post/226143/ (дата обращения 1.12.2014 г.).
4.    Костромицкий С.П. Распознавание длящихся звуков речи // Вестник Тамбовского уни-верситета. Серия Естественные и технические науки. 2003. №1. С. 204.
5.    Компьютерное распознавание и порождение речи. Режим доступа: http://speech-text.narod.ru/chap4_1_1.html (дата обращения: 10.01.2015).
6.    Савельев И.В. Курс общей физики. Механика, колебания и волны, молекулярная физи-ка. Том I М.: Наука, гл. ред. физ-мат. лит., 1970. — 508с.
7.    Сравнение цифровых аудиоформатов. Режим доступа: https://ru.wikipedia.org/wiki/ (дата обращения: 10.01.2015).
8.    Реверберация звука. Режим доступа: http://wikisound.org/Реверберация (дата обращения 10.01.2015).
9.    Elinek F. Распознавание непрерывной речи статистическими методами // ТИИЭР 64. 1976. №4. С.131-160.
10.    Кульков Я.Ю., Кропотов Ю.А. Анализ факторов снижения разборчивости речи в сис-темах громкоговорящей связи // ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛО-ГИИ. 2008. №1-3. С. 129-133.
11.    Рудаков И.В., Романов А.С. Распознавание текстового изображения с учетом морфоло-гии слова // Наука и образование: электронное научно-техническое издание. 2012. № 4. Режим доступа: http://technomag.bmstu.ru/doc/350020.html (дата обращения 10.1.2015).
12.    Галкин В.А., Чернуха С.Н. Исследование быстродействия нейросетевого распознавателя подчерка // Наука и образование: электронное научно-техническое издание. 2011. № 12. Режим доступа: http://technomag.bmstu.ru/doc/280351.html (дата обращения 10.01.2015).
13.    Гапочкин А.В. Нейронные сети в системах распознавания речи // Science Time. 2014. №1. С. 29-36.
14.    Нейронные сети для любопытных программистов. Режим доступа: http://habrahabr.ru/sandbox/76908/ (дата обращения 10.01.2015).


Тематические рубрики:
Поделиться:
 
ПОИСК
 
elibrary crossref neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (499) 263-69-71
  RSS
© 2003-2024 «Инженерный вестник» Тел.: +7 (499) 263-69-71