Оцениваем пропускную способность MIMO канала (алгоритм Water-pouring прилагается)

Предисловие

В лето 2016 от всем известного события вашему покорному слуге в числе группы других студентов удалось побывать на лекциях профессора Мартина Хаардта по тематике MIMO, проводимых им в рамках международной магистерской программы «Communication and Signal Processing». Но, к сожалению, полторы недели из двух я довольно сильно проболел — и поэтому тогда ряд тем просто выпал у меня из сферы достаточного понимания… Однако, уже по прошествии некоторого времени разбор основ MIMO стал моим хобби — не оставлять же дело незаконченным.

По-немногу всё это выросло в ряд небольших конспектов-семинаров, не поделиться которыми, наверное, было бы неправильным. И вот сегодня, в честь Дня связи, мне бы хотелось разобрать с вами тему пропускной способности MIMO канала — тему несложную, но всё же вызывающую определенные трудности у студентов (и не только у студентов).

Людям непричастным может казаться, что увеличение количества приёмных и предающих антенн в рамках названной технологии ровно на столько же увеличивает и пропускную способность системы: например, если поставить 2 антенны на приёмной стороне и 2 антенны на передающей (MIMO 2×2), то пропускная способность однозначно увеличится в 2 раза. Но так ли это хотя бы в теории? Попробуем разобраться!


Более формальную версию на английском языке можно найти по ссылке и в моём GitHub репозитории.
В рамках данной статьи мы не будем рассматривать вопросы корреляции антенн и прочие вопросы реализации. Ограничимся дистиллированной теорией — для начала.
Модель принятого сигнала

Прежде чем мы начнем говорить о пропускной способности, разберемся сначала с математическим описание полученного сигнала (received signal). К этой части стоит отнестись достаточно внимательно, так как очень многое будет проистекать именно из этой формулы:

где — мощность передатчика, — количество передающих антенн, — передаваемые символы, — аддитивный шум, а — матрица коэффициентов передачи канала (фактически, процесс затухания — fading).

Размерность матрицы составляет , где — количество приемных антенн.
Для нескольких временных замеров канал будет иметь следующий вид:

Для справки:
Возможно, для более сложных рассчетов и моделей вы захотите использовать один из самых популярных для того инструментов — MatLab. В таком случае, стоит учесть, что там используется немного другая структура данных: строками являются временные замеры (snapshots), количество столбцов соответствует количеству передающих антенн , измерению «вглубь» (lateral dimension) соответствует .

Формула (1) легко может быть адаптирована и под частные случаи MIMO.

MISO (Multiple Input Single Output — несколько передающих антенн и одна приемная):

где — это вектор .

SIMO (Single Input Multiple Output — несколько приемных антенн и одна передающая):

где — это вектор

SISO (Single Input Single Output — по одной антенне на приемной и передающей сторонах):

Вроде бы, пока несложно.

Всё дальнейшее рассмотрение можно поделить на два больших кейса: информация о состоянии канала (CSI — channel state information) неизвестна передатчику (CU — Channel Unknown) и информация о состоянии канала известна передатчику (CK — Channel Known).

Выше мы рассмотрели случай, когда канал неизвестен для передатчика (open-loop case, передача без обратной связи). Другими словами, мы не можем, в силу отсутствия необходимой информации, выбрать какое-либо эффективное направление, и поэтому идем по самому простому пути: передаем равную мощность через все антенны (тракты, пути распространения). Следовательно, усиление каждого пути распространения (path gain) равно 1:

Сформулируем, что такое усиление пути: усиление пути распространения (или вес антенны — antenna weight) означает распределение выходной мощности, пропорциональное «силе» определенной трассы:

где — один из изначальных символов ().

Веса антенн ограничены количеством передающих антенн:

где ранг канальной матрицы.

Другими словами, мы выделяем больше мощности для хороших каналов (путей распространения) и меньше энергии для плохих каналов.

Возникает вопрос: как эффективно распределить мощность?

Если канал известен (closed-loop case — с обратной связью), мы можем использовать расширенные сценарии передачи с некоторыми дополнительными алгоритмами обработки сигналов. Например, с линейными подходами такими, как предварительное кодирование (pre-coding) и пост-обработка (post-processing).

Разберемся, что означают два последних термина.

Если у нас есть CSI на передающей стороне, т.е. матрица , эту самую матрицу мы можем математически обработать. Например, применив алгоритм SVD (Singular Value Decomposition).

Обратите внимание, что матрица — диагональная матрица, а элементы её диагонали (сингулярные значения) — это, по сути своей, коэффициенты передачи уникальных путей распространения. Иначе говоря, если мы добьемся перемножения нашего сигнала на матрицу сингулярных значений , а не на полную канальную , то канал MIMO распадется на массив параллельных SISO каналов.

Значит матрица линейного предварительного кодирования (фильтра) должна быть , а матрица линейной пост-обработки (демодулятор) (H обозначает эрмитово сопряжение).

Очевидно, что для случая с неизвестным каналом и равны единичным (identity) матрицам.

Теперь, зная всё выше отмеченное, давайте переопределим модель принятого сигнала:

Отметим, что:

  • имеет те же статистические свойства, что и ;
  • Собственные значения (eigen values) являются квадратами сингулярных значений (singular values) матрицы канала ().

Схематически это можно представить как:

Рис. 1. Схема пре-кодирования и пост-обработки [1, с.67 ].

Рис. 2. Схема модального разложения , когда канал известен передатчику и приёмнику [1, с.67 ].

Азы разобраны — можем приступать непосредственно к пропускной способности!

Пропускная способность (capacity)

Я думаю, все, кто изучал теорию информации, помнят, что термин пропускной способности пришёл к нам именно из этой дисциплины. Обычно (на моём студенческом веку) рассмотрение останавливалось на классическом случае AWGN канала, однако формулу относительно легко можно вывести и для случая MIMO канала с замираниями.

Чтобы не перепечатывать в очередной раз выкладки из книжек, я постарался оформить всё более или менее красочно и от руки — дабы придать формулам жизни, так сказать. Надеюсь, такой формат будет менее утомительным.


Ну, надеюсь, мой почерк и мой английский не сильно помешали восприятию информации, однако всё же давайте, проговорим основную мысль:

  • Да, пропускная способность канала MIMO может рассматриваться как сумма пропускной способности каналов SISO.
  • Однако, сумма эта ограничена рангом канала!

Алгоритм Water-pouring

Как видно из формулы пропускной способности известного на передающей стороне канала (CK — Channel Known), распределение энергии по антеннам можно оптимизировать. Для этого воспользуемся алгоритмом Water-pouring (заполнение водой) [1, с.68-69]:

import numpy as np
from numpy import linalg as LA
import matplotlib.pyplot as plt

def waterpouring(Mt, SNR_dB, H_chan):
SNR = 10**(SNR_dB/10)
r = LA.matrix_rank(H_chan)
H_sq = np.dot(H_chan,np.matrix(H_chan, dtype=complex).H)
lambdas = LA.eigvals(H_sq)
lambdas = np.sort(lambdas)[::-1]
p = 1;
gammas = np.zeros((r,1))
flag = True
while flag == True:
lambdas_r_p_1 = lambdas[0:(r-p+1)]
inv_lambdas_sum = np.sum(1/lambdas_r_p_1)
mu = ( Mt / (r — p + 1) ) * ( 1 + (1/SNR) * inv_lambdas_sum)
for idx, item in enumerate(lambdas_r_p_1):
gammas[idx] = mu — (Mt/(SNR*item))
if gammas[r-p] < 0: #due to Python starts from 0
gammas[r-p] = 0 #due to Python starts from 0
p = p + 1
else:
flag = False
res = []
for gamma in gammas:
res.append(float(gamma))
return np.array(res)

Тестируем:

Mt = 3
SNR_db = 10
H_chan = np.array([[1,0,2],[0,1,0], [0,1,0]], dtype = float)
gammas = waterpouring(Mt, SNR_db, H_chan)
print(‘Rank of the matrix: ‘+str(LA.matrix_rank(H_chan)))
print(‘Gammas:n’+str(gammas))

>>> Rank of the matrix: 2
>>> Gammas:
>>> [1.545 1.455]

Что ж, выглядит разумно:
1) количество задействованных передающих антенн равно рангу канала;
2) сумма весов антенн равна количеству передающих антенн.

Два предельных случая

А теперь давайте немного отвлечемся и порешаем задачки на понимание.

Найдём, к примеру, чему будут равны коэффициенты при SNR стремящемся к и (в логарифмическом, конечно же, масштабе, ибо отрицательных мощностей не бывает).

Вспоминаем формулу соответствия между децибелами и разами:

где — мощность передаваемого сигнала (для наших задач она эквивалентна энергии символа ), а — мощность шума (в нашей задаче равна спектральной плотности шума ).

Значит в линейном масштабе будет:

Смотрим на основные формулы алгоритма:

где — это итератор, начинающийся с 1, — ранг канальной матрицы, — i-ое собственное значение «квадрата» канальной матрицы. Гаммы считаем по следующей формуле:

Начинаем рассуждать:

Если , то и . Следовательно, . Для первой итерации остаётся:

Подставляем к гаммам:

Резюмируем:

При бесконечно большой энергии передачи или бесконечно малых шумах ничего особого выдумывать, скажем так, не нужно — равномерно распределяем мощность между передающими антеннами (с оглядкой на ранг канальной матрицы).

Рассуждаем дальше:

А чему соответствует случай SNR стремящийся к ? Здесь даже не будем лезть в математику, рассудим логически: случай этот соответствует либо бесконечно большим шумам, либо нулевой мощности передачи. Значит, так и так, система наша, считайте, не функционирует. Поэтому и вопрос с гаммами отпадает автоматически…

Вот такие иногда вопросы попадаются на экзамене у профессора.

Считаем пропускную способность (наконец-то!)
def siso_capacity(H_chan, SNR_dB):
SNR = 10**(SNR_dB/10)
c = np.log2(1 + SNR*(np.abs(H_chan)**2))
return c

def openloop_capacity(H_chan, SNR_dB):
SNR = 10**(SNR_dB/10)
Mt = np.shape(H_chan)[1]
H_sq = np.dot(H_chan,np.matrix(H_chan, dtype=complex).H)
lambdas = LA.eigvals(H_sq)
lambdas = np.sort(lambdas)[::-1]
c = 0
for eig in lambdas:
c = c + np.log2(1 + SNR*eig/Mt)
return np.real(c)

def closedloop_capacity(H_chan, SNR_dB):
SNR = 10**(SNR_dB/10)
Mt = np.shape(H_chan)[1]
H_sq = np.dot(H_chan,np.matrix(H_chan, dtype=complex).H)
lambdas = LA.eigvals(H_sq)
lambdas = np.real(np.sort(lambdas))[::-1]
c = 0
gammas = waterpouring(Mt, SNR_dB, H_chan)
for idx, item in enumerate(lambdas):
c = c + np.log2(1 + SNR*item*gammas[idx]/Mt)
return np.real(c)

Mr = 4
Mt = 4
H_chan = (np.random.randn(Mr,Mt)
+ 1j*np.random.randn(Mr, Mt))/np.sqrt(2) #Rayleigh flat fading

c = openloop_capacity(H_chan, 10)
print(c)
c = closedloop_capacity(H_chan, 10)
print(c)
c = siso_capacity(H_chan[0,0], 10)
print(c)

>>> 11.978909197556913
>>> 12.342571770086721
>>> 3.9058582578551193

Кажется, работает. Переходим к более предметным оценкам.

Ergodic capacity

Как видно из примеров выше, работаем мы со случайными процессами. И, честно говоря, ошибочно делать какие-либо выводы о случайных процессах по одной реализации. Даже при условии постоянного в статистическом смысле канала нужно некоторое усреднение по достаточно большому множеству.

Здесь нам и пригодится понятие эргодической пропускной способности (ergodic capacity):

где обозначает мат. ожидание (expected value).

Моделируем.

Mr = 4
Mt = 4
counter = 1000
SNR_dBs = [i for i in range(1, 21)]
C_MIMO_CU = np.empty((len(SNR_dBs), counter))
C_MIMO_CK = np.empty((len(SNR_dBs), counter))
C_SISO = np.empty((len(SNR_dBs), counter))
C_SIMO = np.empty((len(SNR_dBs), counter))
C_MISO_CU = np.empty((len(SNR_dBs), counter))
C_MISO_CK = np.empty((len(SNR_dBs), counter))

for c in range(counter):
H_MIMO = (np.random.randn(Mr,Mt) + 1j*np.random.randn(Mr, Mt))/np.sqrt(2)
H_SISO = H_MIMO[0,0]
H_SIMO = H_MIMO[:,0].reshape(Mr,1)
H_MISO = H_MIMO[0,:].reshape(1,Mt)
for idx, SNR_dB in enumerate(SNR_dBs):
C_MIMO_CU[idx, c] = openloop_capacity(H_MIMO, SNR_dB)
C_MIMO_CK[idx, c] = closedloop_capacity(H_MIMO, SNR_dB)

C_SISO[idx, c] = siso_capacity(H_SISO, SNR_dB)
C_SIMO[idx, c] = openloop_capacity(H_SIMO, SNR_dB)

C_MISO_CU[idx, c] = openloop_capacity(H_MISO, SNR_dB)
C_MISO_CK[idx, c] = closedloop_capacity(H_MISO, SNR_dB)

C_MIMO_CU_erg = np.mean(C_MIMO_CU, axis=1)
C_MIMO_CK_erg = np.mean(C_MIMO_CK, axis=1)

C_SISO_erg = np.mean(C_SISO, axis=1)
C_SIMO_erg = np.mean(C_SIMO, axis=1)

C_MISO_CU_erg = np.mean(C_MISO_CU, axis=1)
C_MISO_CK_erg = np.mean(C_MISO_CK, axis=1)

plt.figure(figsize=(7, 5), dpi=600)

plt.plot(SNR_dBs, C_MIMO_CU_erg,’g-o’, label=’$M_R=4$, $M_T=4$ (CU)’)
plt.plot(SNR_dBs, C_MIMO_CK_erg,’g-v’, label=’$M_R=4$, $M_T=4$ (CK)’)

plt.plot(SNR_dBs, C_MISO_CU_erg, ‘m-o’, label=’$M_R=1$, $M_T=4$ (CU)’)
plt.plot(SNR_dBs, C_MISO_CK_erg, ‘m-v’, label=’$M_R=1$, $M_T=4$ (CK)’)

plt.plot(SNR_dBs, C_SISO_erg, ‘k-‘, label=’$M_R=1$, $M_T=1$’)
plt.plot(SNR_dBs, C_SIMO_erg, ‘c-‘, label=’$M_R=4$, $M_T=1$’)

plt.title(«Ergodic Capacity»)
plt.xlabel(‘SNR (dB)’)
plt.ylabel(‘Capacity (bps/Hz)’)
plt.legend()
plt.minorticks_on()
plt.grid(which=’major’)
plt.grid(which=’minor’, linestyle=’:’)
plt.show()


Рис.3. Кривые пропускной способности для разных схем передачи. Сравните с [1, c. 74].

Итак, мы видим, что

  • случай MIMO ожидаемо превосходит остальные, а с увеличением SNR необходимость в знании канальной матрицы уменьшается (см. пример с бесконечностями).
  • SIMO превосходит MISO при условии незнания передатчиком канала (мощность в MISO разделяется по всем антеннам, а не оптимально) и совпадает с MISO в случае известного канала.
  • SISO ожидаемо плетется в хвосте.

И царит над всем его величество ранг канальной матрицы, не позволяющий однозначно сопоставлять увеличение количества антенн с увеличением скорости передачи.

Такие дела.

Литература

(книжка хоть и одна, но какая!)

  • Paulraj, Arogyaswami, Rohit Nabar, and Dhananjay Gore.
    Introduction to space-time wireless communications. Cambridge university press, 2003.
  • Оставить комментарий