Маркел грей линейное предсказание речи

Alib.ru > Автор книги: маркел. Название: линейное предсказание речи

BS-9732719
подборки книг в подарки!
Все книги в продаже (3989254)
Загрузка книг проводится ежедневно в 9 и 23ч.

Маркел Дж.Д., Грэй А.Х. Линейное предсказание речи. Перевод с английского. Москва Связь 1980г. 308 с. Твердый переплет, Чуть увеличенный формат.
(Читайте описание продавца BS — Галина, Краснодарский край.) Цена: 880 руб. Купить
В книге излагается в полном объеме комплекс вопросов, связанных с обработкой речевых сигналов с помощью методов линейного предсказания. Представлены алгоритмы анализа речи и процедуры ее синтеза по множеству информативных параметров, доведенные до программ на языке ФОРТРАН. Рассмотрены вопросы реализации процедур анализа и синтеза речи с помощью специализированных вычислительных ЭВМ. Освещен ряд задач по передаче и распознаванию речевых сигналов на основе их цифрового представления и перспективы научных исследований в этой области. Книга предназначена для научных работников, специализирующихся в обасти разработки аппаратуры анализа и синтеза речевых сигналов.
Состояние: Удовлетворительное
Смотрите: фото – фото – фото – фото

Copyright &#169 1999 — 2021, Ведущий и K&#176. Все права защищены.
Вопросы, предложения пишите в книгу

Источник

Книга: Дж. Д. Маркел «Линейное предсказание речи»

В книге излагается в полном объеме комплекс вопросов, связанных с обработкой речевых сигналов с помощью методов линейного предсказания. Представлены алгоритмы анализа речи и процедуры ее синтеза по множеству информативных параметров, доведенные до программ на языке ФОРТРАН. Рассмотрены вопросы реализации процедур анализаи синтеза речи с помощью специализированных вычислителей и ЭВМ. Освещен ряд задач по передаче и распознаванию речевых сигналов на основе их цифрового представления и перспективы научных исследований в этой области. Книга предназначена для научных работников, специализирующихся в области разработки аппаратуры анализа и синтеза речевых сигналов. Воспроизведено в оригинальной авторской орфографии издания 1980 года (издательство «»Связь»»). Внимание! На данный товар не распространяются ни оптовые, ни накопительные скидки. Print-on-Demand — это технология печати книг по Вашему заказу на цифровом типографском оборудовании.

Издательство: «ЁЁ Медиа» (1980)

См. также в других словарях:

линейное предсказание с алгебраическим кодовым возбуждением и сопряженной структурой — Усовершенствованный алгоритм вокодера, который содержит две взаимосвязанных кодовых книги, одна из которых является рабочей, а вторая тестовой. Использование двух книг позволяет повысить качество распознавания речи при большом уровне шума.… … Справочник технического переводчика

линейное предсказание с возбуждением по усеченному остаточному сигналу — Усовершенствованный алгоритм адаптивного кодирования с предсказанием (АРС), согласно которому передается не весь остаточный сигнал, а только его низкочастотная часть, где сконцентрирована основная доля мощности. Применение RELP позволяет снизить… … Справочник технического переводчика

линейное предсказание с кодовым возбуждением — Алгоритм низкоскоростного сжатия речевого сигнала, основанный на использовании модели его передачи с линейным предсказанием и анализом спектра огибающей, что позволяет определить период основного тона речи. Основные характеристики вокодера CELP:… … Справочник технического переводчика

алгебраическое линейное предсказание с кодовым возбуждением и сопряженной структурой — Усовершенствованный алгоритм речевого кодирования с линейным предсказанием, в котором используются две кодовых книги, одна из которых является фиксированной, а вторая адаптивной. Использование двух книг позволяет повысить качество распознавания… … Справочник технического переводчика

GSM-FR — Full Rate или FR или GSM FR первый цифровой стандарт кодирования речи, использованный в телефонах GSM. Битрейт кодека 13 кбит/с. Качество звука очень низкое по сравнению с современными стандартами, но в начале 1990 х, когда он… … Википедия

вокодер с речевым возбуждением — Устройство преобразования речи, в котором спектральный анализ осуществляется с использованием вокодерных методов, а процедура определения основного тона речи заменена на линейное предсказание. Устройство с таким комбинированным способом… … Справочник технического переводчика

TETRA — (TErrestrial Trunked RAdio) открытый стандарт цифровой транкинговой радиосвязи, разработанный европейским институтом телекоммуникационных стандартов ETSI (European Telecommunications Standards Institute) для замены морально устаревшего… … Википедия

Pentium III — > Центральный процессор Производство … Википедия

ВЕЧНАЯ ЖИЗНЬ — термин, обозначающий причастность к вечному Божественному бытию; бесконечное существование, жизнь как не имеющая конца длительность; понятие, выражающее религ. и религиозно философские представления о высшей цели бытия человека, о его конечных… … Православная энциклопедия

Источник

Proceedings 2001

Contents

ОБ ОДНОМ ПОДХОДЕ К СИНТЕЗУ ГЛАСНЫХ ЗВУКОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ

Е.В. Березинская

Казанский государственный университет

Введение.

Для описания процесса речеобразования было предложено много различных математических моделей, но ни одна из них не позволяет объяснить все характеристики человеческой речи. Одной из наиболее простых моделей является линейная модель:

сигнал возбуждения ® система линейных фильтров ® речевой сигнал.

Различные системы синтеза речи на основе такой модели отличаются способом построения фильтров и выбором возбуждающего сигнала. Входной сигнал системы, как правило, представляет собой периодическую импульсную последовательность для вокализованных звуков и случайный шум с равномерным распределением для невокализованных звуков. Целью данной работы является исследование модели синтеза гласных звуков на основе линейного предсказания с многоимпульсным сигналом возбуждения.

Модель речеобразования на основе линейного предсказания

Линейная модель речеобразования в терминах z -преобразования описывается в виде соотношения

Сигнал возбуждения на входе модели голосовой щели обозначается e ( n ) и описывается функцией E ( z ) , G ( z ) – модель голосовой щели, V ( z ) – модель голосового тракта, L ( z ) – модель излучения губ.

Параметры фильтра A ( z ) определяются на основе анализа речевого сигнала. Упрощающие предположения позволяют сделать модель синтеза речи полюсной, т.е. считать, что A ( z ) содержит только нули, а фильтр 1/ A ( z ) содержит только полюсы. Тогда во временной области уравнение (3) выглядит так:

Элемент функции возбуждения e ( n ) может быть интерпретирован как погрешность предсказания отсчета действительного речевого сигнала s ( n ) по M предыдущим отсчетам (рис.1). Считается, что линейное предсказание отсчетов речевого сигнала эквивалентно линейной модели речеобразования. Параметры модели A ( z ) можно непосредственно определить из исходного речевого сигнала, минимизируя ошибку предсказания, например, по методу наименьших квадратов. Если получены значения параметров A ( z ), то речевой сигнал s ( n ) равен сигналу ошибки e ( n ), пропущенному через полюсной фильтр 1/ A ( z ). Если при вычислении обеспечивается достаточная точность, то устойчивость фильтра с характеристикой 1/А( z ) теоретически гарантируется.

При синтезе речи сигнал ошибки некоторым образом аппроксимируется. Обычно при синтезе гласных звуков в качестве входного сигнала e ( n ) берут последовательность единичных импульсов с периодом следования, равным периоду основного тона (рис.2). Качество полученных таким образом звуков, как правило, далеко от естественной речи. Усложненные модели, в которых кроме полюсов, учитываются и нули фильтров, обладают более высоким качеством. Другой подход к проблеме улучшения качества – использовать многоимпульсный сигнал возбуждения (несколько импульсов с разной амплитудой за один период) (рис.3). Импульсная последовательность строится таким образом, чтобы лучше приближать ошибку предсказания.

Обозначим u 0 ( n — n 0 ) последовательность, представляющую единичный импульс в точке n 0 ., тогда последовательность единичных импульсов с периодом Р будет равна

Многоимпульсная последовательность с амплитудами импульсов, равными A 1 , A 2 . Ai , и задержками n 2 . ni :

Спектр обоих последовательностей сосредоточен на частотах, кратных частоте основного тона, причем мощность спектра первого сигнала одинакова на каждой из этих частот. Мощность спектра второго сигнала на частоте w определяется выражением

Т.о. использование многоимпульсной последовательности позволяет изменять соотношение между гармониками основного тона, изменяя амплитуды и задержки импульсов.

Пример реализации модели синтеза с многоимпульсным возбуждением

Описанный метод применялся для синтеза изолированных гласных звуков, произнесенных различными дикторами. Почти во всех случаях приемлемые по качеству результаты получались при использовании от 2 до 6 импульсов на 1 период ОТ. Метод плохо применим при синтезе звука «и», вероятно из-за того, что в его спектре большую роль играют высокочастотные составляющие.

Рис.1. Погрешность линейного предсказания e ( n )= s ( n )- s `( n ) для изолированного звука «а» при M =15 и ее спектр

Рис.2. Стандартный сигнал возбуждения, используемый при синтезе гласных звуков, и его спектр.

Рис.3. Многоимпульсный сигнал возбуждения, аппроксимирующий ошибку предсказания на рис.1., и его спектр.

Рис.4. Спектрограммы естественного (слева) и синтезированного (справа) звуков «а».

Поскольку последовательность отсчетов, соответствующая гласным, является квазистационарной, то для большей естественности синтезированных звуков обычно генерируют импульсы со случайным периодом, в среднем равном периоду основного тона ( ± 5%). В нашей реализации период выбирался постоянным, а амплитуды импульсов – случайными ( ± 20% от заданных средних значений).

В примере, показанном на рисунках 1, 3 и 4, для синтеза звука «а» при частоте дискретизации 8Кгц использовалось 15 коэффициентов линейного предсказания, 3 значения амплитуд для 3-х импульсов, 2 значения задержки второго и третьего импульсов относительно первого, средняя длина периода основного тона и длительность сигнала, т.е. 22 величины. При этом синтезированный звук отличался естественностью, разборчивостью, и сохранялся тембр голоса диктора (рис.4.).

Заключение

Модель синтеза речи на основе линейного предсказания с использованием многоимпульсного сигнала возбуждения позволяет достичь неплохого качества для большинства гласных звуков. Важное достоинство модели – относительная простота оценки параметров фильтра A ( z ) , т.к. используются линейные процедуры обработки сигнала. Поскольку на этапе проверки метода параметры возбуждающего сигнала задавались вручную, то направлением дальнейшей работы сейчас является создание алгоритма для автоматического вычисления амплитуд и задержек импульсов для произвольного гласного звука.

ЛИТЕРАТУРА

  1. Маркел Дж., Грей А . Линейное предсказание речи. М.: Связь, 1980
  2. Сорокин В .Н. Синтез речи. М.: Наука, 1992
  3. Рабинер Л.Р., Шафер Р .В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981

Источник

Книга: Дж. Д. Маркел «Линейное предсказание речи»

В книге излагается в полном объеме комплекс вопросов, связанных с обработкой речевых сигналов с помощью методов линейного предсказания. Представлены алгоритмы анализа речи и процедуры ее синтеза по множеству информативных параметров, доведенные до программ на языке ФОРТРАН. Рассмотрены вопросы реализации процедур анализа и синтеза речи с помощью специализированных вычислителей и ЭВМ. Освещен ряд задач по передаче и распознаванию речевых сигналов на основе их цифрового представления и перспективы научных исследований в этой области. Книга предназначена для научных работников, специализирующихся в области разработки аппаратуры анализа и синтеза речевых сигналов. Воспроизведено в оригинальной авторской орфографии издания 1980 года (издательство «»Связь»»).

Издательство: «Книга по Требованию» (2012)

См. также в других словарях:

линейное предсказание с алгебраическим кодовым возбуждением и сопряженной структурой — Усовершенствованный алгоритм вокодера, который содержит две взаимосвязанных кодовых книги, одна из которых является рабочей, а вторая тестовой. Использование двух книг позволяет повысить качество распознавания речи при большом уровне шума.… … Справочник технического переводчика

линейное предсказание с возбуждением по усеченному остаточному сигналу — Усовершенствованный алгоритм адаптивного кодирования с предсказанием (АРС), согласно которому передается не весь остаточный сигнал, а только его низкочастотная часть, где сконцентрирована основная доля мощности. Применение RELP позволяет снизить… … Справочник технического переводчика

линейное предсказание с кодовым возбуждением — Алгоритм низкоскоростного сжатия речевого сигнала, основанный на использовании модели его передачи с линейным предсказанием и анализом спектра огибающей, что позволяет определить период основного тона речи. Основные характеристики вокодера CELP:… … Справочник технического переводчика

алгебраическое линейное предсказание с кодовым возбуждением и сопряженной структурой — Усовершенствованный алгоритм речевого кодирования с линейным предсказанием, в котором используются две кодовых книги, одна из которых является фиксированной, а вторая адаптивной. Использование двух книг позволяет повысить качество распознавания… … Справочник технического переводчика

GSM-FR — Full Rate или FR или GSM FR первый цифровой стандарт кодирования речи, использованный в телефонах GSM. Битрейт кодека 13 кбит/с. Качество звука очень низкое по сравнению с современными стандартами, но в начале 1990 х, когда он… … Википедия

вокодер с речевым возбуждением — Устройство преобразования речи, в котором спектральный анализ осуществляется с использованием вокодерных методов, а процедура определения основного тона речи заменена на линейное предсказание. Устройство с таким комбинированным способом… … Справочник технического переводчика

TETRA — (TErrestrial Trunked RAdio) открытый стандарт цифровой транкинговой радиосвязи, разработанный европейским институтом телекоммуникационных стандартов ETSI (European Telecommunications Standards Institute) для замены морально устаревшего… … Википедия

Pentium III — > Центральный процессор Производство … Википедия

ВЕЧНАЯ ЖИЗНЬ — термин, обозначающий причастность к вечному Божественному бытию; бесконечное существование, жизнь как не имеющая конца длительность; понятие, выражающее религ. и религиозно философские представления о высшей цели бытия человека, о его конечных… … Православная энциклопедия

Источник

Читайте также:  Список предсказаний для печенек
Оцените статью