Lab Speech Analyzer

0 1014
Speech Analyzer является свободным и профессиональным инструментом, который показывает различные графические изображения речи и звукозаписей. Это позволит вам выполнять фонетический анализ записей человеческого голоса (полный со спектрограммами, спектральным анализом, и т.д.), и этнологические изучения звукозаписей. Программа может показать вам до шести графических изображений того же самого звука или группу звуков в одном единственном экране, таким образом облегчающем для вас выполнять все виды сравнительного анализа. Все доступные графики могут быть полностью настроены, чтобы приспособить ваше предпочтение. Аналогично, можно создать новые шаблоны окна с комбинацией графиков, которые лучше приспосабливают ваши потребности.

Фонетические графики дадут вам точное воспроизведение на экране дисплея высоты и интенсивность речи или любой из ее компонентов (предложения, слова, фонемы, и т.д.). Одновременно, можно взять более внимательное рассмотрение в спектрограмме и спектре, с индикациями относительно его трех формант (F1 к F3). Они позволят вам идентифицировать гласные звуки легко и точно. Простой встроенный текстовый редактор пускает вам идентифицировать каждый звук с его записанным представлением или просто прибавлять ваши собственные аннотации. Что касается музыки, можно одновременно просмотреть melogram, тональную диаграмму взвешивания, величину, и нотный стан с нотами. Программное обеспечение MusicXML, и для импорта и для экспорта основанной на XML информации.

Speech Analyzer может открыть любой WAV, MP3, или файл WMA, хотя это также позволяет вам делать свои собственные записи, используя звуковую карту вашей системы. Это также предлагает вам поворотливый аудиоплеер, который позволит вам повторять и циклично выполнять любой фрагмент так много раз, как вы нуждаетесь. Можно создать свои собственные настройки с различными опциями воспроизведения, если, который можно тогда сохранить для будущего использования.

Speech Analyzer и обучение иностранному языку

Программа Speech Analyzer выделяется среди других продуктов анализа звучащей речи своими широкими возможностями. В первую очередь это связано с тем, что Speech Analyzer имеет возможность наложения одной визуализации звука поверх другой. Данная особенность программы приходится очень кстати пользователям, изучающим иностранный язык. Наложив визуализацию своего произношения на визуализацию речи диктора, можно увидеть свои недочеты.

Для того чтобы начать пользоваться данной возможностью Speech Analyzer необходимо выполнить следующие шаги, которые были распределены в 3 большие части:

1. Загрузите в программу аудио файл содержащий речь диктора или носителя языка. (Предпочтительно wav или mp3 формата). Для этого воспользуйтесь пунктом меню  File -> Open и укажите расположение файла.

SA1

2. Разделите речь диктора на отрезки, например слова или предложения. Это необходимо для удобства, т.к. произносить долгие отрезки речи каждый раз заново, чтобы посмотреть различия в одном сегменте, не целесообразно. Для деления файла можно воспользоваться средствами самой программы. Выберите отрезок звуковой дорожки на любой из визуализаций, передвинув зеленую границу в начало сегмента, а красную в конец.

SA2

 Затем нажмите одновременно клавиши Ctrl+A и отрезок выделится.

SA3

Можно нажать клавишу F8 чтобы прослушать выделенный сегмент и убедиться, что отмечен правильный отрезок. Затем необходимо выделить раздел главного меню Edit и кликнуть пункт Copy. Далее в этом же разделе меню пункт Paste as New File. Это действие заменит текущую звуковую дорожку на только что выделенную ее часть.

SA4

 После этого сохраняем данную часть как новый файл. Делается это выделением раздела главного меню File и выбором пункта Save As и указанием места хранения нового файла. Дальше необходимо заново открыть исходный файл, и по аналогии выделить и сохранить другой (другие) сегмент (ы). В конечном счете, вы получите набор файлов, содержащих интересующие вас отрезки речи диктора.

3. Загрузите любой из заранее подготовленных файлов прослушайте его нажатием F12 на клавиатуре. Затем выделите раздел главного меню Graphs и наведите курсор мыши на пункт Overlay, далее кликните пункт Record Overlay.  Появится окно записи звука. Произнесите прослушанную фразу или слово подобно диктору. Запись начнется автоматически, когда вы начнете говорить, и закончится, когда вы остановитесь. В результате произнесенная вами фраза визуализируется и отобразится поверх оригинальной желтым цветом. Это применимо к визуализациям изменения частоты основного тона и формы волны.

SA6

При этом программа автоматически отсекает тишину перед началом фразы. Как видно из примера выделенный отрезок речи диктора начинается с тишины (прямая линия в начале графика), которая длится около секунды. Затем волна приобретает энергию и начинается интенсивное звуковое колебание. Это диктор произносит приветствие «Hi!». Однако в записанной фразе тишины продолжительность в секунду не было, т.е. сразу было произнесено «Hi!». Это означает, что Speech Analyzer автоматически налаживает сказанную фразу на начало оригинальной, отсекая ненужную тишину. Это очень облегчает работу с произношением.

Для повторной записи наложения необходимо помолчать чуть-чуть, что будет интерпретировано программой как конец одной записи и начало другой.

Замечания

Визуализация изменения частоты основного тона очень проста. По ней мы в первую очереди можем оценивать правильность интонации, отмечая, где она возрастает, где падает, где держится ровно. Также можно оценивать правильность произнесения гласных, каждой гласной соответствуют свои частоты. Русский гласный звук в слове «лом» и английский в слове «dog» очень отличаются.

Визуализация формы волны очень сложна. Она показывает изменение амплитуды звукового колебания во времени.  Частота звуковых колебаний человеческой речи высока, поэтому многие звуки на визуализации выглядят сплошными. Но с опытом можно будет различать разные звуки, в особенности гласные. По данной визуализации можно оценить в первую очередь временные характеристики, например, длительность гласных, характеристики громкости (интенсивность), например, логическое ударение и частотные составляющие звука. По-настоящему данная визуализация информативна для ученых долго работающих в области фонетики. Каждый звук имеет свой собственный уникальный рисунок.

Нет комментариев