litceysel.ru
добавить свой файл
  1 ... 2 3 4 5 6 7

Литература

[1] D.A. Reynolds, R.C. Rose, “Robust Text-Independent Speaker Identification Using Gaussian Mixture Speaker Models,” in Proc. IEEE ICASSP, Vol. 3, No. 1, pp. 72–83, January 1995.

[2] W.-C. Chen, C.-T. Hsieh, E. Lai, “Multiband approach to Robust Text-Independent Speaker Identification”, in IJCLCLP, Vol. 9, No. 2, pp. 63–76, ACLCLP, August 2004.

[3] V. Wan, W.M. Campbell, “Support vector machines for speaker verification and identification,”, in Proc. IEEE NNSPX’00, Vol. 2, pp. 775–784, 2000.

[4] S. Fine, J. Navratil, R.A. Gopinath “A Hybrid GMM/SVM Approach to Speaker Identification,”, in Proc. IEEE ICASSP’01, Vol. 1, pp. 417–420, Salt Lake City, USA, 2001.

[5] A.P. Dempster, N.M. Laird, D.B. Rubin “Maximum likelihood from Incomplete Data via the EM Algorithm”, Journal of the Royal Statistical Society, Series B, Vol. 39, No. 1, pp. 1–38, 1997.

[6] J. MacQueen, “Some Methods for Classification and Analysis of Multivariate Observations,” in Proc. 5th Berkeley Symp. On Math. Stat. and Prob., Vol. 1, pp. 281–297, 1967

[7] D. Arthur, S. Vassilvitskii, “k-means++: The Advantages of Careful Seeding”, presented in SODA, 2007.

[8] Y. Linde, A. Buzo, R. Gray, “An Algorithm for Vector Quantizer Desing,” in IEEE Trans. on Communications, Vol. 28, pp. 84–94, 1980.

[9] J. Bezdek, Pattern Recognition with Fuzzy Objective Function Algorithms, Plenum Press, New York, 1981.

[10] D.E. Gustafson, W.C. Kessel, “Fuzzy Clustering with a Fuzzy Covariance Matrix,” in Proc. of IEEE CDC, 1979.

[11] J.P. Campbell, “Speaker Recognition: A Tutorial”, in Proc. of the IEEE, Vol. 85, No. 9, pp. 1437–1462, 1997.

[13] H. Lee, S. Chang, D. Yook, “A Voice Trigger System using Keyword and Speaker Recognition for Mobile Devices”, in IEEE Trans. on Consumer Electronics, Vol. 55, Issue 4, pp. 2377–2384, 2009.


[14] P. Li, J. Liang, B. Xu, “A Novel Instance Matching Based Unsupervised Keyword Spotting System”, in 2nd Int. Conf. on Innovative Computing, Information and Control (ICICIC’07), pp. 550–555, 2007.


Работа выполнена при поддержке ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009–2013 годы.


COMPARISON OF CLUSTERING ALGORITHMS FOR SPEAKER IDENTIFICATION


Lubimov N., Mikheev E., Lukin A.


Moscow Lomonosov State University, Moscow, Russia


In this paper we consider the problem of text-independent speaker identification that refers to acoustic recognition research. Many different techniques have been presented over past several decades. A state-of-the-art technique uses Gaussian Mixtures (GMM) for modeling speaker data distribution presented by MFCC [1] or LPCC [2] features. The classification is obtained by choosing the speaker class with maxi-mum likelihood on the observed data. More complex approach considers the discriminative capability of methods like Support Vector Machine (SVM) in order to separate different acoustic classes. A hybrid system for speaker identification presented in [4] successfully combines advantages of GMM’s generative capability and SVM’s discriminative power by introducing Fisher kernel.

We examine the simplest scheme for construction of a speaker identification system having 3 major stages: 1) pre-processing, 2) initial clustering in feature space, 3) Gaussian mixture model parameter re-estimation. There are many different successful techniques proposed for the pre-processing step. The Expectation-Maximization (EM) algorithm used for Gaussian mixture parameter re-estimation is also well documented. On the other hand, it is not obvious how to initialize the recurrent formula of the EM algorithm in this task, because it is known that convergence properties of the EM algorithm strongly depend on initial approximation. An interesting problem is: which type of initial clustering in feature space should be used to obtain better results? In this paper we describe some existing methods for making an initial approximation of in the EM procedure, and show how these methods affect to final speaker recognition rate. Using different algorithms for feature space clustering we construct several classifiers for speaker identification. We perform comparison between them using identification rate error on a speaker database with telephone-quality signals. Our main goals are to compare the performance of fuzzy and hard clustering methods, and also examine the influence of deterministic and random initializations of the EM algorithm.


We have performed the comparison of different clustering methods for speaker identification: the standard K-means clustering, K-means++, Linde-Buzo-Gray, Fuzzy C-means, and Gustafson-Kessel algorithms. It has been found that Gaussian mixture model performance depends on deterministic properties of EM initialization method. Linde-Buzo-Gray (LBG) method outperforms other non-fuzzy clustering approaches probably because of natural arrangement of cluster centers along principal components of the data, rather than random choice used in K-means or K-Means++. Fuzzy clustering algorithms show better results because they are more deterministic and use complete dataset during clustering iterations. All of the tested clustering algorithms except Gustafson-Kessel divide the dataset into spherical clusters. Gustafson-Kessel finds ellipsoids, so it shows best result.




ПАРАМЕТРИЧЕСКАЯ АВТОКАЛИБРОВКА ЦИФРОВОЙ АНТЕННОЙ РЕШЕТКИ


Нечаев Ю.Б., Макаров Е.С., Пешков И.В.


Воронежский государственный университет


Одним из приложений современной теории методов углового сверхразрешения являются системы подвижной радиосвязи с использованием пространственного разделения пользователей. Недостатком традиционных методов диаграммоформирования является ограничение разрешающей способности конечной апертурой антенной решетки, что и обуславливает популярность параметрических методов, с помощью которых можно достичь неограниченной разрешающей способности при условии бесконечного отношения сигнал/шум и полного соответствия модели, описывающей принимаемые данные, реальности.

На практике, однако, как разрешающая способность алгоритмов, так и точность оценки угловых параметров ограничены шумом и ошибками модели описания. Современные средства цифровой обработки сигналов позволяют разработчикам пеленгационных систем реализовывать схемы обработки различной степени изощренности, в которых задача углового сверхразрешения параметризуется относительно неизвестных (или известных неточно) значений отклика антенной решетки, избегая тем самым решения трудоемкой задачи дифракции плоской электромагнитной волны на антенных элементах.


Для реализации концепции пространственного разделения пользователей возможно использование следующего подхода. Проводится оценка угловых координат пользователей системы связи и последующее формирование оптимальной ДН в режимах приема и передачи. При этом качество функционирования системы связи во многом определяется точностными характеристиками подсистемы оценки угловых координат, которые в свою очередь зависят от адекватности математической модели, описывающей амплитудно-фазовые соотношения между антенными элементами.

В настоящей работе проведен статистический анализ точностных характеристик подсистемы оценки угловых координат, входящей в состав цифровой антенной решетки. Выполнен сравнительный анализ методов автокалибровки антенной решетки, предложен новый алгоритм коррекции неидентичностей приемных каналов и с помощью метода статистических испытаний показано его превосходство над существующими.

Для цифровой антенной решетки из N антенных элементов (АЭ) комплексный вектор выходных сигналов описывается выражением: , где М-мерный вектор сигналов; N-мерный шумовой вектор, A(θm) — NM матрица направляющих векторов при приеме M сигналов с направлений , k – дискретные моменты времени, C - NN матрица взаимного влияния АЭ, - NN матрица комплексных коэффициентов передачи каналов приема.

Пусть и - стационарные случайные процессы, шум предполагается гауссовским с нулевым средним, сигналы и шум в каналах некоррелированы, отсутствует корреляция между шумом каналов, тогда пространственная корреляционная матрица может быть записана в следующем виде [1]:


, где (…)H – эрмитово сопряжение, Rss- ковариационная матрица сигналов, - матрица, составленная из сигнальных собственных векторов, соответствующих М наибольшим собственным числам, - матрица, составленная из шумовых собственных векторов, соответствующих (N-М) наименьшим собственным числам, и - диагональные матрицы сигнальных и шумовых собственных значений, соответственно.

Задача автокалибровки сводится к определению координат источников радиоизлучения при наличии ошибок в каналах и без дополнительных калибровочных устройств. Значения угловых координат абонентов, а также ошибки, возникающие в каналах, определяются путем минимизации целевых функций, соответствующих далее описываемым методам.


  1. Метод Фридландера-Вайса [1].

Целевая функция метода: , где - углы приходы радиосигналов. Матрицы C
и определяются итеративно до тех пор, пока целевая функция не сойдется.

  1. Метод Ванга-Кедзоу [1].

Метод основан на использовании алгоритма оптимизации Ньютона-Гаусса с применением ортогонализации Грама-Шмидта. Целевая функция метода: , где D – матрица ошибок расположения АЭ, – комплексный вектор M1, - скалярный коэффициент, - вектор сигнального подпространства.


  1. Метод Эстели-Свиндлехарста-Оттерстена [1].

Целевая функция метода: , где , - операция поэлементного умножения матриц, - псевдоинверсия Мура-Пенроуза, .

Вектор ошибок определяется как собственный вектор матрицы , соответствующий наименьшему собственному значению этой матрицы.

4. Предлагаемый метод.

Целевая функция метода выглядит следующим образом: где .

Шаг 1. Определение амплитудных ошибок.

Вектор амплитудных ошибок находится из главной диагонали матрицы : , n = 1…N

Шаг 2. Определение первоначальных значений фаз вектора .

Полные фазовые сдвиги вектора определяются алгоритмом оптимизации, первоначальные значения которого можно получить, используя стандартный метод MUSIC и вектор .


Шаг 3. Определение значений .

Для минимизации функции по используется алгоритм наискорейшего спуска.

Шаг 4. Определение углов прихода сигналов.

На этом шаге определяются углы ИРИ по найденным значениям .

Анализ точности оценки угловых координат абонентов проводилась для пятиэлементной кольцевой АР с межэлементным расстоянием в половину длины волны. Отношение сигнал-шум (ОСШ) в каналах принималось равным 40 дБ, с тем, чтобы исключить его влияние на характеристики алгоритмов калибровки. В каналы вносились независимые амплитудные и фазовые случайные ошибки, число статистических испытаний для каждого значения ошибок и ОСШ равнялось 250. Токи, наводимые в нагрузках антенных элементов вследствие взаимного влияния, полагались пренебрежимо малыми (что эквивалентно единичной матрице взаимного влияния). Углы прихода сигналов принимались равными 25 и 85 относительно первого АЭ. На рис. 1 представлены зависимости среднеквадратического отклонения (СКО) оценки угла прихода сигнала от СКО амплитудных (а) и фазовых (б) ошибок.



а) б)

MUSIC Метод Фридландер-Вайса Метод Ванга-КедзоуМетод Эстели-Свиндлехарста-Оттерсона Предложенный метод


Рис. 1 Зависимость СКО пеленгов ИРИ от СКО амплитудных (а) и фазовых (б) ошибок


Из рисунков видно, что предложенный метод превосходит по характеристикам существующие. Лишь алгоритм Ванга-Кедзоу сходен по точности коррекции с предложенным, однако оценки пеленгов при его применении остаются слегка смещенными. Отметим также линейную зависимость СКО пеленгования от СКО ошибки, вносимой в каналы приема.

Литература


  1. Qiong L. An Overview of Self-Calibration in Sensor Array Processing / L. Qiong, G. Long, Y. Zhongfu // Proceeding of 6th International Symposium on Antennas, Propagations and EM Theory. – 2003. – № 28. – P. 279 – 282.


METHOD FOR SMART ANTENNA PARAMETRIC AUTO-CALIBRATION


Nechaev Yu., Makarov E., Peshkov I.

Voronezh State University


Modern high-resolution DOA algorithms are often used in smart antenna applications when digital beamforming is fulfilled under a priori knowledge of users' angular coordinates. The issue of their popularity is ability to resolve users whose DOA's lie inside Rayleigh limit. Under infinite observation time and/or infinite signal-to-noise ratio resolution of infinitely closely spaced emitters can be achieved if signal model used for DOA estimation corresponds real conditions.

In practice, resolution characteristics and DOA performance are limited by noise and errors in model assumed for received signals. These errors are due to mutual coupling between antenna elements, scatterers in the vicinity of antenna array, imbalance of I/Q components etc.

This paper reviews three self-calibration methods for application in smart antennas, outlines their advantages and disadvantages. Some kind of their comparative analysis is given and new algorithm is proposed which outperforms existing algorithms in the sense of DOA mean-square error. Advantages of proposed algorithm are illustrated via Monte-Carlo simulations.


Complex vector of signals on N antenna elements can be given by formula below:

, where М-dimension signal vector; N- dimension noise vector, A(θm)NM array manifold for DOA's , k – discrete time, C
- NN coupling matrix, - NN complex matrix describing receiving channel imperfections.

We will assume auto-calibration as DOA estimation under receiving channel imperfections without any additional measurements or devices, only through software calculations.

We propose new method with steps given below:

Objective function: where .

Step 1. Amplitude errors calculation: , n = 1…N

Step 2. Calculation of initial phase shift values in .

Calculation through MUSIC method with known .

Step 3. Calculation of .

Minimization of objective function on through steepest descent algorithm.


Step 4. Определение углов прихода сигналов.

DOA calculation with known .

Statistical analysis through Monte-Carlo simulations for five-element circular array has shown that proposed method outperforms previously developed algorithms in the sense of MSE for high SNR's and in the absence of mutual coupling between antenna elements. Comparison fulfilled with Friedlander-Weiss, Wang-Cadzow and Astely-Swindlehurst-Ottersten algorithms. Only Wang-Cadzow method shows performance close to proposed algorithm' performance but Wang-Cadzow method gives slightly biased DOA estimates.




Реализация аудио декодера на СБИС декодера цифрового телевизионного сигнала К1879ХБ1Я

Шевченко П.А., Мушкаев С.В.



<< предыдущая страница   следующая страница >>