H2-Norm und Kovarianz lineare Systeme

In Octave oder Matlab steht uns mit covar eine Methode zur Verfügung, mit welcher wir die stationäre Kovarianz des Zustandsvektors $x$ und die stationäre Kovarianz des Ausgangsvektors $y$ berechnen können. In Python existiert derzeit eine solche Methode weder in scipy noch in control.

Dabei ist covar wieder mit der $H_{2}$ -Norm verbunden.

Kovarianz eines zeitdiskretes Systems

Gegeben sei ein lineares System, das von Eingängen mit weißem Gauß’schen Rauschen gesteuert wird. Dieses Rauschen ist also kein Kontrolleingang sondern eine Störung. In Form eines Zustandsraums wird dieses System wie folgt dargestellt:

$\begin{aligned} x_{k + 1} & = A x_{k} + B w_{k} \\ y_{k} & = C x_{k} + D w_{k} \end{aligned}$

wobei $A \in R^{n \times n}$ , $B \in R^{n \times p}$ , $C \in R^{q \times n}$ und $D \in R^{q \times p}$ . $n$ , $m$ und $p$ beschreiben die Anzahl der Zustände, Eingänge bzw. Ausgänge des linearen Systems.

Bei den Eingangsstörungen $w$ handelt es sich um weißes Gauß’sches Rauschen mit der Spektraldichte $Σ_{w} \in R^{m \times m}$ mit Nullmittelwert. Anders ausgedückt: Der Erwartungswert von $w$ ist $E (w_{k}) = 0$ und seine Kovarianzmatrix ist $E (w_{k} w_{l}^{T}) = Σ_{w} δ_{k l}$ , wobei das Kronecker-Symbol duch

$δ_{k l} = {\begin{cases} 1 für k = l \\ 0 für k \neq l \end{cases}$

gegeben ist.

Analyse stochastischer linearer Systeme

Wir wollen hier nun stochastische zeitdiskrete zeitinvariante lineare Systeme analysieren. Dafür verwenden wir ein etwas andere Notation. Um den zeitlichen Zusammenhang stärker herauszustellen schreiben wir statt $x_{k}$ , $x [k]$ .

Gegeben sei das System

$\begin{aligned} x [k + 1] & = A x [k] + B w [k] . \end{aligned}$

Der Anfangszustand $x [0]$ ist ein Zufallsvektor, dessen Erwartungswert und Kovarianzmatrix wir kennen,

$\begin{array}{r} E {x [0]} = μ_{x} [0] = 0 E {[x [0] - μ_{x} [0]] [x [0] - μ_{x} [0]]^{T}} = Σ_{x} [0] . \end{array}$

Der Eingangsvektor ${w_{k}}$ ist ein (vom Anfangszustand $x [0]$ unabhäniges) weißes Rauschen, dessen momentanen Erwartungswert und Autokovarianzmatrix wir kennen,

$\begin{aligned} E {w [k]} = μ_{w} [k] = 0 & für k \geq 0 \\ E {[w [k] - μ_{w} [k]] [w [l] - μ_{w} [l]]^{T}} = Σ_{w} δ_{k l} & für k, l \geq 0 mit Σ_{w} = Σ_{w}^{T} \geq 0 \\ E {[w [k] - μ_{w} [k]] [x [0] - μ_{x} [0]]^{T}} = 0. & für k \geq 0 (Unkorreliertheit) . \end{aligned}$

Der momentane Erwartungswert des Zustandsvektors kann offenbar aus der folgenden zeitdiskreten Bewegungsgleichung berechnet werden:

$\begin{aligned} μ_{x} [k + 1] & = E (A x_{k} + B u_{k}) = A μ_{x} [k] + B μ_{w} [k] = 0 \\ μ_{x} [0] & = E {x [0]} = 0 \end{aligned}$

Da der Vektor-Zufallsprozeß ${w_{k}}$ ein weißes Rauschen und vom Anfangsvekor $x [0]$ unabhängig ist, kann die momentane Kovarianzmatrix $Σ_{k}$ des Zustandsvektors $x_{k}$ ebenfalls rekursiv berechnet werden:

$\begin{aligned} Σ_{x} [k + 1] & = E {[x [k + 1] - μ_{x} [k + 1]] {[x [k + 1] - μ_{x} [k + 1]]}^{T}} \\ = E {[A (x [k] - μ_{x} [k]) + B (w [k] - μ_{w} [k])] {[A (x [k] - μ_{x} [k]) + B (w [k] - μ_{w} [k])]}^{T}} \\ = A Σ_{x} [k] A^{T} + B Σ_{w} B^{T} \\ Σ_{x} [0] & = Σ_{x} [0] \end{aligned}$

Für eine stabile Matrizen $A$ konvergiert diese Gleichung gegen die Lyapunov Gleichung

$Σ_{x} = A Σ_{x} A^{T} + B Σ_{w} B^{T} = 0.$

Die Kovarianzmatrix des Ausgangs $y$

$\begin{aligned} Σ_{y} [k] & = E {y [k] y [k]^{T}} \\ = E {[C x [k] + D w [k]] [C x [k] + D w [k]]^{T}} \\ = C Σ_{x} [k] C^{T} + D Σ_{w} D^{T} \end{aligned}$

konvergiert für stabile System zu

$Σ_{y} = C Σ_{x} C^{T} + D Σ_{w} D^{T} = 0.$

Für instabile System (Spektralradius $ρ (A) > 1$ ) sind die Kovarinazmatrizen unendlich.

Die Verbindung zur $H_{2}$ -Norm ist nun mit

$‖ G ‖_{2}^{2} = lim_{k \to \infty} E (y_{k} y_{k}^{T}) = t r (c o v a r (G)) = t r (Σ_{y})$

gegeben. Die $H_{2}$ -Norm ist ein Mass für die Energie am Ausgangs eines Systems, welches von einem weißen Gauß’schen Rauschen am Eingang angetrieben wird.

Tipp

Wir verwenden im Code statt $Σ$ die Buchstaben $P$ und $W$ . Ähnliche Notationen werden von vielen Programmpaketen verwendet:

$Σ_{x} = P_{x} Σ_{y} = P_{y} Σ_{w} = W$

Zusammengefasst lässt sich ein Zustandsraumverfahren wie folgt berechnen:

Berechne eine Zustandsrealisierung aus der Übertragungsfunktion

$G (z) := [\begin{array}{cc} A & B \\ C & D \end{array}]$

Löse die Lyapunov Gleichung, (dabei muss gelten $P_{x} \geq 0$ )

$\begin{aligned} P_{x} & = A P_{x} A^{T} P_{x} + B W B^{T} = 0 \\ P_{y} & = C P_{x} C^{T} + D W D^{T} \end{aligned}$

Code

import numpy as np
import scipy.linalg as linalg
import scipy.signal as signal


import warnings
warnings.filterwarnings("error")

def covar_d(A,B,C,D,W):
    """ naive implementation of covar for linear time-discrete systems (d-LTI)
        (there might be better ways to do that)
    """
    
    if np.all(np.abs(linalg.eigvals(A)) <= 1):
        Px = linalg.solve_discrete_lyapunov(A.T, B@W@B.T)
        Py = C@Px@C.T + D@W@D.T   
    else:
        Px = np.inf
        Py = np.inf
    return [Px, Py]

def covar_d_data(tout,yout,xout):
    """ data based approximation of covar for linear time-discrete systems (d-LTI)
        (there might be better ways to do that)
    """
    
    # catch overflow
    try:
        Px = xout.T@xout/len(tout)
        Py = yout.T@yout/len(tout)
    except RuntimeWarning:
        Px = np.inf
        Py = np.inf
    return [Px, Py]

Stabiles System

Ad_stable = np.array([[0.5, 0.1],[0.1, 0.5]])
print(np.abs(linalg.eigvals(Ad_stable)) <= 1.)

Bd = np.array([[0.],[1.]])
Cd = np.eye(2)*0.5
Dd = np.zeros((2,1))
Wd = np.eye(1)*5

Px, Py = covar_d(Ad_stable,Bd,Cd,Dd,Wd)
print(Px)
print(Py)

[ True  True]
[[0.15174655 0.46502976]
 [0.46502976 6.73069392]]
[[0.03793664 0.11625744]
 [0.11625744 1.68267348]]

Wir wollen die modellbasierte Variante mit einer datenbasierten Variante vergleichen. Dazu erzeugen wir Eingangsdaten und Ausgangsdaten.

G_sys = signal.StateSpace(Ad_stable, Bd, Cd, Dd,  dt=1.)
w_in = np.sqrt(Wd)*np.random.randn(100000)
tout, yout, xout = signal.dlsim(G_sys, w_in.T)

Px_data, Py_data = covar_d_data(tout, yout, xout)
print(Px_data)
print(Py_data)

[[0.15053712 0.45885585]
 [0.45885585 6.70173513]]
[[0.03763428 0.11471396]
 [0.11471396 1.67543378]]

print(linalg.norm(Px - Px_data)/linalg.norm(Px))
print(linalg.norm(Py - Py_data)/linalg.norm(Py))

0.004474953153232987
0.004474953153232987

Beide Varianten stimmen sehr gut überein. Die Differenz erklärt sich einerseits durch die endlichen Daten und die numerische Ungenaugikeit. np.float128 könnte bessere Ergebnisse liefern.

Instabiles System

Ad_unstable = np.array([[1.5, 0.1], [0.1, 1.5]])
print(np.abs(linalg.eigvals(Ad_unstable)) < 1.)

Px, Py = covar_d(Ad_unstable,Bd,Cd,Dd,Wd)
print(Px)
print(Py)

[False False]
inf
inf

G_sys = signal.StateSpace(Ad_unstable, Bd, Cd, Dd, dt=1.)
w_in = np.sqrt(Wd)*np.random.randn(100000)
tout, yout, xout = signal.dlsim(G_sys, w_in.T)

Px_data, Py_data = covar_d_data(tout,yout,xout)
print(Px_data)
print(Py_data)

inf
inf

Die Kovarianmatrizen werden zu groß und erzeugen deshalb eine Laufzeitwarnung, welche abgefangen wird.

Fazit

Die Kovarianzmatrizen kommen in vielen wissenschaftlichen Aufsätzen zum Einsatz, vor allem in Aufsätzen in denen Schätzer analysiert werden (Kalmanfilter, Systemidentifikation, Adaptive Regelung, Bestärkendes Lernen, …).

Die Kovarianzmatrizen stehen mit der $H_{2}$ in Verbindung, was für die Implementierungsebene von Bedeutung ist.

Referenzen

Optimal Sampled-Data Control Systems (Tongwen Chen und Bruce Francis, 1994)
Essentials of Robust Control (Kemin, Zhoun, John C. Doyle, 1997)
Regelungstechnik, Mathematische Grundlagen, Entwurfsmethoden, Beispiele (Geering, 2004)