litceysel.ru
добавить свой файл
1 ... 4 5 6 7

Литература

П.А. Шевченко, А.В. Шкуренко Декодер цифрового телевизионного сигнала высокой четкости: система на кристалле // Электроника: Наука, Технология, Бизнес. - 2007. - №8. - С. 62-66.

К. Быструшкин Современная элементная база для аналого-цифровых телевизоров TV/DVB // Электронные компоненты. - 2002. - №6. - С. 1-4.

П.А. Шевченко Платформа для разработки СБИС декодера ТВ-сигнала // Электроника: Наука, Технология, Бизнес – 2010 - №3 – С. 60-65.

П.А. Шевченко СБИС декодера цифрового телевизионного сигнала. Технология разработки // «Проблемы разработки перспективных микро- и наноэлектронных систем – 2010 (МЭС-2010)» Сборник трудов под общ. ред. академика РАН А.Л. Стемпковского. – М.: ИППМ РАН, 2010. – С. 320-325

К разрядности вычислителя БПФ при его реализации на процессоре Л1879ВМ1 (NM6403) О. Аксенов, Ю. Борисов, журнал "Цифровая обработка сигналов", No2, 2004, с.41-44


Audio Decoder Implementation on Digital Television Decoder VLSI К1879ХБ1Я


Shevchenko P., Mushkaev S.

RC “Module”

Digital audio decoder is one of key features of digital television receiver device. Good implementation of this feature defines quality of end user product. In this publication experience of practical implementation of audio decoder on digital television decoder VLSI К1879ХБ1Я is described.

анализ применения зон вынесенных ретрансляторов для беспроводной авиационной электросвязи

Назаров С.Н., Шагарова А.А.


Ульяновское высшее авиационное училище гражданской авиации (институт)

Для повышения эффективности радиосвязи ДКМ диапазона в беспроводной авиационной электросвязи (БАЭС) [1, 2, 3, 4] предлагается использовать сеть взаимосвязанных радиоцентров-ретрансляторов (РЦР), вынесенных за зону связи на расстояние более 2000 км и разнесенных в пространстве на расстояние не менее 250 км друг от друга, что обеспечивает низкий уровень пространственной корреляции значений отношения сигнал-помеха между ретрансляторами [6, 7, 8, 9, 10].


Для определения вероятности осуществления радиосвязи между ВС и ДП в сети с предлагаемой структурой были выполнены следующие действия [4, 5]. Определены вероятности радиосвязи с достоверностью не хуже заданного значения в радиолинии, образуемой между i-м воздушным судном и j-м радиоцентром – ретранслятором:

(1)

Определена вероятность осуществления радиодоступа с достоверностью не хуже заданного значения i-м воздушным судном к удаленной сети взаимосвязанных радиоцентров – ретрансляторов:

(2)


Определена вероятность осуществления радиосвязи с достоверностью не хуже заданного значения в канале удаленная сеть взаимосвязанных радиоцентров–ретрансляторов – диспетчерский пункт:




(3)


Определена вероятность осуществления радиосвязи с достоверностью не хуже заданного значения в канале воздушное судно – диспетчерский пункт: (4)


Применение вынесенных взаимосвязанных пространственно независимых точек приема позволяет повысить значения вероятностей радиосвязи по сравнению с использованием прямых каналов [8, 9, 10]. Однако предлагаемый способ организации СРС ДКМ не позволяет обеспечить требуемые значения вероятности осуществления радиосвязи, т.к. в [2] запрещается перестройка частот, что ограничивает возможность адаптации передатчика к изменению условий обмена информацией. Предлагается использовать несколько зон вынесенных РЦР. Структура такой сети показана на рис.1.

При перемещении ВС вдоль трассы вероятность осуществления радиосвязи ВС и ДП будет определяться выражением (5). , (5), где - вероятность установления связи между центральной станцией (ЦС) СРС ДКМ и ДП по высоконадежным каналам наземной сети связи; Рдост – вероятность осуществления доступа ВС к району вынесенных зон СРС ДКМ, значение которой определяется выражением в к-ой точке трассы (6). , (6)


где - вероятность радиодоступа ВС из к-ой точке трассы у j – ой зоне вынесенных РЦР; - вероятность установления радиосвязи между ВС в к-ой точке трассы и i-м РЦР j –ой зоны.



Рис. 1. Схема организации радиосвязи ДКМ диапазона в авиационной воздушной электросвязи

с использованием нескольких зон удаленных РЦР

Графики значений вероятностей осуществления радиодоступа ВС (рис.2), находящегося в к-ой точке трассы, к j-ой зоне РЦР показаны на рис. 4. Из графиков на рис. 2, где по оси ОХ отмечены точки трассы, а по оси ОУ – вероятности радиосвязи, видно, что для каждой точки трассы движения ВС существует зона РЦР к которой вероятность радиодоступа соответствует требуемым значениям. График значений вероятности радиодоступа ВС к району зон удаленных РЦР показан на рис.3. Из данного графика видно, применение предлагаемой структуры СРС ДКМ позволяет обеспечить требуемую вероятность связи ДП и ВС в полете.




Рис.2. Графики значений вероятностей радиосвязи с 1, 2, 3 зонами вынесенных РЦР



Рис. 3. График значений вероятностей радиодоступа к СРС ДКМ

Литература

1. Силяков, В. А. Системы авиационной радиосвязи: учеб. пособие / В. А Силяков, В. Н. Красюк / Под ред. В. А. Силякова. – СПб.: ГУАП СПб., 2004. –160 с.

2. Руководство по авиационной электросвязи (РС ГА-99). – М.: Изд-во ФСВТ России, 1999. - 88 с.

3. Качан, В. К. Средства радиосвязи управления воздушным движением: учеб. пособие для вузов ГА /В. К. Качан, В. В. Сокол, В. В. Тесовский – Киев: Вища школа, 1996. – 206 с.


  1. Прохоров, В.К. Методы расчета показателей эффективности радиосвязи /В.К. Прохоров, А.Н. Шаров. – Л.: ВАС, 1990. – 132 с.

5. Головин О.В., Системы и устройства коротковолновой радиосвязи / О.В. Головина, С.П. Простов / Под ред. О.В. Головина. – М.: Горячая линия – Телеком, 2006. – 598 с.

6. Комарович В.Ф. – О корреляции уровней случайных помех в радиоканалах коротковолнового диапазона / В.Ф. Комарович, В.Н. Сосунов // Радиотехника. – № 2. – 1973. – С. 100-102,

7. Комарович В.Ф. О частотно-пространственных резервах диапазона декаметро-вых волн / В.Ф. Комарович, В.Н. Сосунов, М.Я. Фарбирович // Радиотехника. – № 6. – 1978. – С.100 – 101;

8. Комашинский В.И. Пространственно-частотная адаптация в сетях связи с подвижными объектами / В.И. Комашинский, А.В. Максимов, О.П. Стратонов // Радиотехника. – №2. – 1997. – С. 3-7

9. Назаров, С.Н. Методы разнесенного приема в системах подвижной связи и широкополосного доступа /С. Н. Назаров, А. А. Шагарова //Автоматизация процессов управления. – № 3. – 2010. – С. 88 – 94.

10. Назаров С.Н. Моделирование и разработка алгоритмов функционирования сети радиосвязи декаметрового диапазона с применением сети вынесенных радиоцентров-ретрансляторов: дис. канд. техн. наук: 05.13.18, 05.12.13 / Назаров Сергей Николаевич. — Ульяновск : УлГТУ, 2005. — 190 с.


The analysis of application of areas of the taken out repeaters for wireless aviation telecommunication

Nazarov С., Shagarova A.

The Ulyanovsk higher aviation school of civil aircraft (institute)

For boosting of efficiency of radio communication HF of a range in wireless aviation telecommunication it is offered to use a network of the interconnected radio centres-repeaters, taken out for an exchange area on distance more than 2000 km and carried in space on distance not less than 250 km from each other that provides low level of spatial correlation of values of a carrier to interference between repeaters.


Application of the taken out interconnected spatially independent points of reception allows to boost values of probabilities of a radio communication in comparison with use of forward channels. However the offered way of organisation NRC HF does not allow to provide demanded values of probability of realisation of a radio communication since in retuning of frequencies is forbidden that limits possibility of adaptation of the transmitter to variation of terms of the exchange by the information. It is offered to use some areas taken out repeater.




СОВМЕСТНОЕ ИСПОЛЬЗОВАНИЕ ВЫНЕСЕННЫХ ЗОН РЕТРАНСЛЯТОРОВ ДЛЯ ОБМЕНА СООБЩЕНИЯМИ С ВОЗДУШНЫМИ СУДАМИ НА РАЗЛИЧНЫХ АВИАТРАССАХ


Назаров С.Н., Шагарова А.А.


Ульяновское высшее авиационное училище гражданской авиации (институт)


Применение нескольких зон вынесенных радиоцентров – ретрансляторов (РЦР) за зону связи для воздушных судов (ВС), осуществляющих полеты по одной авиатрассе (АТ) приведет к значительному увеличению стоимости телекоммуникационных услуг, предлагаемых авиационной электросвязью (АЭ). Это связано с тем, что для обслуживания небольшого количества низкоскоростных каналов радиосвязи ДКМ радиосвязи будет использован значительный ресурс множества РЦР. Для снижения затрат ресурс зон вынесенных РЦР должен использоваться в интересах множества ВС на различных авиатрассах авиакомпаний РФ. Для снижения затрат при использовании данного ресурса предлагается организация радиодоступа, показанная на рис.1.


Рис.1. Использование ресурса зон вынесенных радиоцентров – ретрансляторов

При осуществлении радиодоступа, как показано на рис.1, множество радиосредств ВС будут конкурировать за ресурс зон РЦР. При этом должны быть решены следующие задачи: реализация эффективного алгоритма множественного доступа к РЦР; распределение пространственного ресурса района зон вынесенных РЦР.


Согласно [1, 2, 3] в сетях радиосвязи ДКМ (СРС ДКМ) с использованием пространственного ресурса наибольшее применение находят протоколы со свободным случайным многостанционный доступом (ССМД).

На помехоустойчивость СРС ДКМ диапазона с ССМД оказывают влияние такие факторы как [1]: соотношение энергетических параметров сигнала и помехи; внутренние помехи, которые представляются в виде конфликтов, возникающих при наложении кадров.

Воздействие внутренних помех на помехоустойчивость приема пакетов определяется суммарным потоком, алгоритмом СМД, реализуемого в СРС ДКМ, и его параметрами. Суммарный поток создается новыми и повторно передаваемыми пакетами. Вероятность ошибки при поэлементном приеме пакетов, как показано в [1] может быть определена из выражения (1): , (1)

где с – кратность конфликта, которая указывает, сколько пакетов конфликтует с вновь поступившем в канал пакетом, Рс - вероятность возникновения конфликта кратность с, - вероятность ошибки приема элемента при конфликте кратность с, N – число абонентов в сети.

Для СРС ДКМ диапазона с ССМД при использовании узкополосных сигналов и каналов с релеевскими замираниями вероятность ошибки приема элемента при конфликте кратность с [1] определяется как (2):

(2), где , Pc – мощность элемента сигнала, Т - длительность элемента сигнала; - спектральная плотность мощности помехи; I0 – множество пакетов, конфликтующих с j – пакетом, значения элементов которых не совпадают со значениями элементов j – пакета; ID - множество пакетов, конфликтующих с j – пакетом, элементы которых изменяют свои значения на длительности элементов j – пакета; I1 – множество пакетов, конфликтующих с j – пакетом, значения элементов которых совпадают со значениями элементов j – пакета.


Вероятность возникновения конфликта кратности с, как показано в [4], для ССМД с немедленной передачей пакетов определяется выражением (3): , (3)

где G – параметр пуассоновского потока пакетов, создаваемых корреспондентами сети. В [1] G определяется выражением(4): , (4)

где N –число корреспондентов в сети; χ – параметр, отражающий состояние СРС ДКМ с ССМД, который определяется отношением количество корреспондентов сети, находящихся в режиме конфликта, к общему числу корреспондентов в сети; λ, r – интенсивность поступления в сеть новых и повторно передаваемых пакетов; Тк – длительность пакета.

В СРС ДКМ диапазона с ССМД передача пакета может осуществляться L раз до момента его успешного приема. Тогда процесс передачи можно рассматривать как L попыток доступа к разделяемому ресурсу радиосвязи ДКМ диапазона. Попытки доступа являются независимыми, так как в каждой попытке осуществляется доступ к новому элементу ресурса: временному интервалу, частоте, РЦР. Поэтому, передачу пакета данных от ВС к РЦР можно рассматривать как последовательность независимых испытаний.

Для оценки вероятностно – временных характеристик СРС ДКМ с ССМД вводятся следующие ограничения [1]: передача пакетов от ВС к РЦР осуществляется в произвольные моменты времени в общем канале; все N корреспондентов СРС ДКМ статистически однородны: распределение интервалов времени между передаваемыми пакетами описываются экспоненциальным законом с параметрами λ, r; внутреннее состояние СРС ДКМ определяется величиной параметра χ; если ВС находится в состоянии повторной передачи пакета, новый пакет ВС не генерируется; все пакеты передаются по каналу радиосвязи с одинаковой скоростью и имеют постоянную длительность Tk.

Для СРС ДКМ с рассматриваемой структурой характерны трассы большой протяженности, в которых находит применение асинхронный способ с немедленной передачей пакета (НПП) и ССМД. При реализации асинхронного способа и алгоритма ССМД-НПП ВС передает новый пакет немедленно при его поступлении в сторону РЦР. Повторные передачи осуществляются через экспоненциально распределенные интервалы времени. Эти интервалы являются независимыми. Функция распределения времени доведения пакетов от ВС к РЦР определяется как [5]:


, (5), где N1- количество попыток передачи пакета; p(N1=k) – вероятность того, что число повторных попыток передачи равно к; p(tд ≤ Tдоп.) – вероятность доставки пакета за время, не превышающее заданное значение Тдоп., при количестве повторных передач N1.

Вероятность повторных передач p(N1=k) [5] определяется соотношением(6):

, (6), где Qr – вероятность передачи пакета в сети.

Значение длительности каждой стадии передачи пакета в ПСР является независимым и имеет смещенное на Тп = Тк+tкв показательное распределение с плотностью распределения(7) [1, 5]: (7)

Применение преобразования Лапласа – Стилтьеса к выражению (7) позволяет получить выражение для функции распределения суммы независимых значений длительности стадий передачи пакета в ПСР, которое представляет собой разновидность специального распределения Эрланга [4]. Это выражение определяет вероятность своевременной доставки пакетов за N1=k попыток:

, (8)

Подстановкой в выражение (5) выражения (6) и (8) получают выражения функции распределения значения времени доставки пакета в ПСР (9):

, (9)

где[1] , - вероятность приема вновь поступившего пакета при к попытках передачи и в условиях конфликта кратности с.


Определение вероятности осуществляется на основе модели радиоканала при пакетной передачи сообщений с учетом ошибок при поэлементном приеме в условиях возникновения конфликтов. Передаваемые в ПСР пакеты включают М однотипных блоков. Вероятность правильного приема пакета [8] определяется как (10): , (10)

где - вероятность правильного приема i-го блока пакета; - вероятность не обнаружения ошибки в принимаемом блоке пакета; m = tп+1, tп – кратность ошибок, обнаруживаемых помехоустойчивым кодом; Рош – вероятность ошибки при приеме элемента пакета в условиях конфликта кратности с, значение которой определяется по выражению (2); R – коэффициент экспоненциальной корреляции релеевских замираний между элементами сигнала во времени.

Литература


  1. Шаров А.Н.Сети радиосвязи с пакетной передачей информации. /А.Н.Шаров, В.А. Степанец, В.И. Комашинский / под ред. А.Н. Шарова. - СПб.: ВАС, 1994. - 216 с.

  2. Назаров С.Н. Применение динамического программирования при распределении пространственного ресурса радиосвязи декаметрового диапазона / С.Н. Назаров //Инфокоммуникационные технологии. - 2007. - Т.5, №2. – с.70 – 74.

  3. Шаров А.Н. Автоматизированные сети радиосвязи / А.Н. Шаров - Л.: ВАС, 1988. - 170 с.

  4. Шнепс М.А. Система распределения информации. Методы расчета. Справочное пособие. / М.А. Шнепс - М.: Связь, 1976. - 344с.

  5. Кокс Д.Р., Смит В.Л. Теория восстановления / Д.Р. Кокс. - М.: Сов.радио, 1967. - 300 с.


Abstract

Application of several areas of the taken out radio centres – repeaters for an exchange area for the aircrafts which are carrying out flights on one air route will lead to substantial growth of cost of the telecommunication services offered by aviation telecommunication. It is coupled by that for service of a small amount of low-speed radio intercommunication channels HF of a radio communication the considerable operational life of set of the radio centres – repeaters will be used. For build-down of expenses the operational life of areas of the taken out radio centres – repeaters should be used in interests of set of aircrafts on various air routes of airlines of the Russian Federation. For build-down of expenses the organisation a network exchange in which set of radio sets of aircrafts in a mode of plural access will contact repeaters is offered. The management system will be supervised by quality of a signal reception on various repeaters from aircrafts and to carry out distribution of repeaters for communication conducting.






повышение вероятности успешного хэндовера для высокомобильных абонентов

Назаров С.Н.

Ульяновское высшее авиационное училище гражданской авиации (институт)


Для решения задачи использования в сетях широкополосного доступа мобильных станций (МС) с высокой скоростью перемещения предлагаются следующие подходы: осуществить доработку стандарта IEEE 802.16е-2005, где указать в качестве основного способа режим макро-диверсифицированного хэндовера (Macro diversity handover MDHO) при взаимодействии МС со всеми БС из активного набора (Active Set), при этом доступ МС к множеству БС будет осуществляться на основе пространственно разнесенного приема сигнала; применять адаптивные FEC – схемы и повторной передачи управляющих сообщений для повышения значения вероятности успешного хэндовера МС, осуществляющей перемещение между БС с высокой скоростью.

В качестве МС рассмотрим воздушное судно (ВС). ВС осуществляет передвижение по трассе на высоте h и скорость Vm. Для расчета частоты Доплера используется выражение (1) .




(1)

где


f0 – рабочая частота связи; Vm – скорость движения ВС; с – скорость распространения света.




Рис.1. Схема доступа ВС к БС при движении по трассе


БС1…БСN – базовые станции; α – угол между вектором скорости движения ВС и направлением на БС; (X1i,Y1j,0) – координаты БС, (X0i,Y0j,h) – координаты ВС.

График значений частоты Доплера для каналов связи, образуемых между ВС и i-ой БС, показан на рис. 2. Как видно из рис.2 при нахождении ВС в точке трассы полета с координатами (X0i,Y0j,h) существует БС с координатами (X1i,Y1j,0), в канале связи которой с ВС, значение fд мало. Следовательно, при организации сети широкополосного доступа, фрагмент структуры которой показан на рис.3, для МС с высокой скоростью передвижения будет значительно снижено влияние эффекта Доплера. При такой организации сеть работает в режиме MDHO согласно стандарту IEEE 802.16e-2005




Долгота расположения БС

Рис.2. Значение частоты Доплера для каналов связи ВС с БС, расположенными вдоль трассы полета

.



БС 1

БС N


Рис.3. Структура функционирования сети широкополосного доступа на основе стандарта IEEE 802,16e, МС которой осуществляют передвижение с высокой скоростью.

Определение вероятности успешной процедуры хэндовера

Передача МС между БС основана на нескольких сообщениях процедуры установления связи, переданных успешно [1]. Вероятность успешного осуществления процедуры хэндовера определяется выражением (2). , (2)

где M - число управляющих сообщений, i= 1…M-1, Ni =1, 2, 3….. – число повторов при передаче i-го сообщения хэндовера, pi - вероятность случайного события Аi, заключающееся в том, что i - е управляющее сообщение успешно получено MС или БС, , где - вероятность битовой ошибки при γb - отношении мощности полученного бита к мощности шума в канале на длительности бита,- длина сообщения в битах. График значений вероятности успешного хэндовера показан на рис.4. Из графиков на рис.4 видно, что успешная вероятность передачи, Pусп., уменьшается с увеличением вероятности ошибки в символе Рвb). При использовании повторной передачи значение вероятности успешного хэндовера значительно повышается.


Таким образом, успешный хэндовер - это функция двух важных параметров – вероятности битовой ошибки и числа повторных передач управляющих сообщений. В практической сети WiMAX оба параметры связаны со скоростью передвижения MС. Вероятности битовой ошибки увеличивается как результат эффекта Доплера для МС с более высокой скоростью, что требует увеличение числа повторных передач сообщений, чтобы завершить процедуру хэндовера. В то же время, БС с более высокой скоростью перемещения требует более быстрого переключение между БС. Из-за этих двух эффектов, чем выше скорость MС, тем более быстро снижаются вероятности успешного хэндовера.





Рис. 4. Графики зависимости значений вероятности успешного хэндовера от вероятности битовых ошибок, где М = 5, Ni = 50, L= 250 битов.


Согласно работам [2] влияние эффекта Доплера на количественные отношения вероятности битовой ошибки и скорости MС может быть проанализировано с использованием модели Кларка - Джейкса. В этой модели рассматриваются быстрые и медленные замирания в релеевском канале, а среднее отношение энергии сигнала к мощности шума на длительности бита передаваемой информации представляется выражением (3). , (3), где , N - число поднесущих канала OFDM, J0 – функция Бесселя нулевого порядка, Ts - продолжительность K-го символа используемой схемы модуляции, переданный на поднесущей, N0 - шумовая мощность, Еб - энергия сигнала на длительности бита передаваемой информации.

Во время процедуры хэндовера WiMAX управляющие сообщения главным образом состоят из небольших пакетов данных, размер которых составляет 50-60 байтов. Для данного FEC – кода повышение избыточности данных повышает его исправляющую способность. Для заданной скорости MС можно оценить размер FEC – кода для обеспечения требуемой вероятности успешного хэндовера, используя выражение (4).


, (4)

где S - общее количество повторных передач определяется из выражения (5). . (5)

Значение определяется типом применяемого кода FEC. При использовании кода Рида-Соломона значение определяется из выражения (6). , (6)

- кратность исправления ошибок кода, N – длина сообщения, k число информационных бит в сообщении. Тогда, число избыточных битов, N − k, может быть определено аналитически. На рис. 5 показаны графики значений числа избыточных бит N − k, требуемых в сообщении при различных скоростях MС, чтобы достигнуть трех различных вероятностей успешного хэндовера: 0.5, 0.8 и 0.99.



Рис. 5. Размер избыточных данных как функция скорости MС, где оригинальный незащищенный

пакет состоит из k = 250 битов.


Литература

1. Zhiwei Y. Seamless High-Velocity Handover Support in Mobile WiMAX Networks / Y. Zhiwei, L. Huang, C.-C. Jay Kuo // in Proceedings of Vehicular Technology Conference. – 2007. – P. 1573-1578.

2. Leung K. K. Mobility support for IEEE 802.16d wireless networks / K. K. Leung, S. Mukherjee, and G. E. Rittenhouse // in Proceedings of WCNC. – 2005. – P. 1446-1452.


Boosting of probability successful handover for Highly mobile subscribers

Nazarov S.

The Ulyanovsk higher aviation school of civil aircraft (institute)


For the decision of a problem of use in networks of broadband access of mobile stations with a relocating HS following approaches are offered: to carry out retrofit work of standard IEEE 802.16е-2005, where to point as the fundamental way a mode Macro diversity handover at interaction mobile station with all base stations from an active set, thus access mobile station to set base stations will be carried out on the basis of spatially diversity reception of a signal; to apply adaptive FEC – the circuit and repeated transmission of operating messages to boosting of value of probability successful handover mobile station, carrying out relocating between base stations with a HS.




ВЫЧИСЛЕНИЕ ИНФОРМАТИВНЫХ ПАРАМЕТРОВ РЕЧИ НА ОСНОВЕ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ

Новоселов С.А., Веселов И.А., Новиков А.Е.


Ярославский государственный университет имени П.Г. Демидова

150000, Россия, Ярославль, ул. Советская, 14, Тел. (4852) 79-77-75. dcslab@uniyar.ac.ru

Введение. Человек выделяет классы объектов из множества, учитывая физические параметры этих объектов, которые он способен воспринимать (цвет, форма, звук и др.). Речевые сигналы классифицируются человеком на основе физических особенностей звуковых колебаний. Возможность выделения звуков разного типа из общего потока звуковых колебаний позволяет людям обмениваться информацией через акустическую среду. Человек научился, как генерировать «информационные единицы», так и выделять их из звукового потока. Многообразие языков человеческого общения говорит о том, что существует множество вариантов таких «информационных единиц», которые соответствуют разным языкам. Вся сложность задачи автоматического распознавания речи заключается в том, как описать такой «информационный элемент» и в какие именно физические параметры звукового сигнала человек вкладывает информационное содержание.


Мел-шкала. Восприятие человеком слуховых ощущений оценивается не частотой звука, а психоакустической величиной – высотой тона, причем высокочастотные звуки человек воспринимает (слышит) как высокие тоны, а низкочастотные – как низкие [1]. Сам термин "высота тона" трактуется как "качество звука, определяемое субъективно человеком на слух" [2]. Единицей высоты тона определен Мел. Она устанавливается декларативно - как "внесистемная единица высоты звука", а количественная оценка высоты тонов основывается на статистической обработке данных о субъективном восприятии звука [3]. Результаты исследований показывают, что высота звука связана главным образом с частотой колебаний, но зависит также от уровня громкости звука и его тембра. Звуковые колебания частотой 1000 Гц при эффективном звуковом давлении 2•10−3 Па (то есть при уровне громкости 40 фон), воздействующие спереди на наблюдателя с нормальным слухом, вызывают у него восприятие высоты звука, оцениваемое по определению в 1000 Мел. Звук частоты 20 Гц при уровне громкости 40 фон обладает по определению нулевой высотой (0 Мел). Обобщенная формула перевода частоты поступающего в уxo звука (Герц) в высоту воспринимаемого слухом тона (Мел) имеет следующий вид

Обратное преобразование

Экспериментальный факт, что человек неодинаково воспринимает разные частоты одинаковой амплитуды, необходимо учитывать при создании алгоритмов обработки речи.

Распознавание речевых команд. Все современные алгоритмы распознавания речи можно условно разделить на два основных этапа: этап предварительной обработки, фильтрации и выделения информативных параметров речи и этап непосредственного сравнения входящей реализации команды с множеством заранее созданных реализаций эталонов. На втором этапе в рассматриваемом алгоритме в качестве классификатора применяется аппарат скрытых Марковских моделей [4]. На первом этапе информативные параметры речи извлекаются с помощью вейвлет-преобразования сигналов.


Идея дискретного вейвлет-анализа состоит в представлении сигнала последовательностью образов с разной степенью детализации (многомасштабный анализ), что позволяет выявлять локальные особенности сигнала и классифицировать их по интенсивности [5]. Дискретное симметричное вейвлет-преобразование осуществляется с использованием цифровых низкочастотного и высокочастотного вейвлет-фильтров и блоков децимации. На каждом шаге спектр сигнала разбивается на две равные полосы. При 8-ми уровневом разложении спектр разбивается на 256 полос. Сигнал с полосой частот 4 кГц (речь) будет разбит на 256 подполос по 15,625 Гц. На рис. 1 представлен график зависимости ширины подполосы вейвлет-разложения в Мел-шкале от номера при стандартном разложении (полосы пронумерованы от 1 до 256 начиная с нижних частот).



Рис 1. Стандартное вейвлет-разложение в Мел-шкале.

Для более точного соответствия Мел-шкале необходимо модифицировать двоичное дерево разложения. А именно: суммировать энергии соседних полос сигнала на высоких частотах. Предложены различные способы модификации стандартного симметричного вейвлет-разложения.


Способ 1

Способ 2

Рис 2. Предлагаемые способы модификации стандартного симметричного вейвлет-разложения.

Способ 1. Объединение полос происходит в тот момент, когда их общая ширина (в Мел) не превосходит величину первой полосы (25 Мел). При этом способе после объединения остается 108 полос (зависимость ширины полосы от номера представлен на рис. 2).


Способ 2. Объединение полос происходит в тот момент, когда измнение ширины максимально симметрично отноительно величины первой полосы (25 Мел). При этом способе после объединения остается 89 полос.

Исследования. В работе сравниваются 3 алгоритма распознавания речевых команд. «Стандартный» алгоритм использует в качестве информативных параметров энергии вейвлет-полос стандартного симметричном разложения. Два других – энергии вейвлет-полос модифицированного разложения (по двум разным способам). Тестирование проводилось на речевой базе, которая состоит из цифр, произнесённых на русском языке одним диктором, по 30 образцов для каждой. Все сигналы выровнены по энергии.

В таблице представлена вероятность верного распознавания команд для трех алгоритмов.


Команда

«Стандартный»

Способ 1

Способ 2

«ноль»

0,93

0,87

1,00

«один»

0,80

0,90

1,00

«два»

0,87

0,90

1,00

«три»

0,97

0,97

1,00

«четыре»

0,80

0,97


0,80

«пять»

0,90

0,97

1,00

«шесть»

0,90

0,90

1,00

«семь»

1,00

0,80

0,93

«восемь»

0,80

1,00

0,93

«девять»

0,97

0,87

0,97

средняя вероятность

0,89

0,91

0,96

Выводы. В работе предложены методы извлечения информационных параметров из речевого сигнала на основе вейвлет-разложения. Учет того факта, что человек воспринимает не частоту звука, а высоту тона, позволяет улучшить алгоритмы автоматического распознавания речевых команд. Вероятность верного распознавания команды повышается в среднем на 2-7% при базе, состоящей из 300 сигналов.

Литература

1. Гельфанд С. А. Слух: введение в психологическую и физиологическую акустику. /Пер. с англ. - М.: Медицина. - 1984.

2. БСЭ. - Т.5. -1971. - С.543.

3. Русаков И.Г. //БСЭ. - Т.16. - 1974. - С.38-39.

4. Рабинер Л.Р. Скрытые Марковские модели и их применение в избранных приложениях при распознавании речи: Обзор. // ТИИЭР, е. 77, №2, февраль 1989.


5. Воробьёв В.П., Грибунин В.Г. Теория и практика вейвлет-преобразования. – СПб.: Военный университет связи, 1999. - 204 c.


SPEECH INFORMATIVE PARAMETRS CALCULATING METHOD BASED ON WAVELET TRANSORM

Novoselov S., Veselov I., Novikov A.

Yaroslavl State University
14 Sovetskaya st., Yaroslavl, Russia 150000. Phone: 7-4852-797775. dcslab@uniyar.ac.ru


Introduction. The person allocates objects classes from a set by taking into account physical parameters of these objects which can be perceived by people (color, form, sound, etc.). Speech signals are classified by the person on the basis of sound fluctuations physical features. The different type sounds allocation opportunity from the stream of sound fluctuations allows people to communicate through the acoustic environment. The person has learned, both to generate «information units», and to allocate them from a sound stream. The human dialogue languages variety leads to there is a set of «information units» which correspond to different languages. The automatic speech recognition problem complexity is how to describe an «information element» and in what sound signal physical parameters the person puts the information.

Mel scale. The person perception of acoustical sensations is not estimated by sound frequency, but psychoacoustics term – tone height, and the person hears high-frequency sounds as high tones, and low-frequency – as low. The term "tone height" is treated as "the sound quality determined subjectively by the person on hearing". Mel is a tone height unit. The quantitative tones height estimation is based on statistical data processing about subjective sound perception. Results of researches show, that the sound height is mainly connected to frequency of fluctuations, but also depends on a sound loudness level and its timbre. Sound fluctuations by frequency of 1000 Hz at effective sound pressure 2•10−3 Pa (that is at a loudness level of 40 Phons), influencing in front on the observer with normal hearing, cause in him perception of sound height, estimated on definition in 1000 Mel. The sound of frequency of 20 Hz at a loudness level of 40 Phons has by definition in zero height (0 Mel). The generalized transform formula from frequency sound (Hertz) to tone height (Mel):


The experimental fact, that the person unequally perceives different frequencies of same amplitude, it is necessary to take into account at speech processing algorithms creation.

Recognition of speech commands. All modern speech recognition algorithms consist of two basic stages: a predesign stage, filtrations and allocation of informative parameters of speech and a stage of direct comparison of entering command with set of beforehand created standards. Markov models [1] are applied as the qualifier the second stage in considered algorithm. Informative parameters of speech are taken with the help of wavelet-transform [1].

Researches. 3 algorithms of recognition of speech commands are compared. The "Standard" algorithm uses energies of wavelet-bands standard symmetric decomposition as informative parameters. Others two use the modified decomposition. Testing speech base consist of the digits announce in Russian by one announcer, on 30 samples for every digit. All signal has equal energies. The true command recognition probability raises on the average on 2-7 %.

References


  1. Benesty, Sondhi, Huang (Eds.) Springer Handbook of Speech Processing. // Springer 2008.









Цифровая обработка сигналов и ее применение

Digital signal processing and its applications



<< предыдущая страница