linearna algebra

Razne karakterizacije 2x 2 matrica traga nula

Matea Perković(1) i Rajna Rajić(2) 
(1) Osnovna škola Granešina, Granešina 1, Zagreb
(2) Rudarsko-geološko-naftni fakultet, Sveučilište u Zagrebu, Pierottijeva 6, Zagreb
Sažetak
U ovom radu dajemo nekoliko karakterizacija 2\times 2 kompleksnih matrica traga nula, koje se temelje na Hamilton–Cayleyjevom teoremu.

1Uvod

Označimo s \mathbb{M}_{n}(\mathbb{C}) algebru svih kompleksnih kvadratnih matrica reda n, a s I jediničnu matricu reda n. Trag matrice A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}), u oznaci \text{tr}\,A, definira se kao zbroj njezinih dijagonalnih elemenata;

\text{tr}\,A=\sum_{i=1}^{n}a_{ii}.

Preslikavanje A\mapsto \text{tr}\,A je linearan funkcional na prostoru \mathbb{M}_{n}(\mathbb{C}), tj. vrijedi

\text{tr}(\alpha A+\beta B)=\alpha\text{tr}\,A+\beta\text{tr}\,B

za sve A,B\in\mathbb{M}_{n}(\mathbb{C}) i sve \alpha,\beta\in\mathbb{C}. Također, za A,B\in\mathbb{M}_{n}(\mathbb{C}) vrijedi

\text{tr}(AB)=\text{tr}(BA), \quad \text{tr}\,A^{T}=\text{tr}\,A, \quad \text{tr}\,A^{*}=\overline{\text{tr}\,A},

gdje smo s A^{T} označili transponiranu, a s A^{*} adjungiranu matricu matrice A. Unitarno slične matrice imaju isti trag, tj. za svaku unitarnu matricu U\in\mathbb{M}_{n}(\mathbb{C}) vrijedi

\text{tr}(U^{*}AU)=\text{tr}\,A.

Prema teoremu o Schurovoj dekompoziciji (\cite[teorem 3.3]{Z}), za svaku matricu A\in\mathbb{M}_{n}(\mathbb{C}) sa svojstvenim vrijednostima \lambda_{1}, \lambda_{2}, \dots, \lambda_{n} postoji unitarna matrica U\in\mathbb{M}_{n}(\mathbb{C}) takva da je U^{*}AU gornjotrokutasta matrica čiju dijagonalu čine svojstvene vrijednosti od A; pišemo

U^{*}AU =\begin{pmatrix} \lambda_{1} & & \ast\\ & \ddots & \\ 0 & & \lambda_{n} \end{pmatrix}.

Uočimo da je trag matrice jednak zbroju njezinih svojstvenih vrijednosti.

 

Poznato je da je svaka n\times n kompleksna matrica traga nula unitarno slična matrici čija je glavna dijagonala sastavljena od samih nula ([7]). Također, karakterizacija takvih matrica moguća je u terminima komutatora ([1, 12]). Prisjetimo se, A\in\mathbb{M}_{n}(\mathbb{C}) je komutator ako postoje matrice B,C\in\mathbb{M}_{n}(\mathbb{C}) takve da je A=BC-CB. Dakle, u općenitom slučaju vrijedi sljedeći rezultat (čiji dokaz se može naći i u [5]).

Teorem 1. Za A\in\mathbb{M}_{n}(\mathbb{C}) sljede\'ce tvrdnje su međusobno ekvivalentne:
(a) \text{tr}\,A=0;
(b) A je komutator dviju matrica;
(c) postoji unitarna matrica U\in\mathbb{M}_{n}(\mathbb{C}) takva da su svi dijagonalni elementi matrice U^{*}AU jednaki nuli.


U ovom radu dajemo nekoliko karakterizacija kompleksnih matrica traga nula koje su svojstvene samo matricama reda 2. Ove su karakterizacije dobivene uz pomoć Hamilton–Cayleyjevog teorema, koji se smatra jednim od najznačajnijih rezultata u linearnoj algebri. O raznim interesantnim primjenama ovog teorema na kvadratne matrice reda 2 (npr. pri rješavanju binomnih matričnih jednadžbi, Pellovih diofantskih jednadžbi, pri određivanju općih članova nizova definiranih pomoću sustava linearnih rekurzivnih re\-la\-ci\-ja, pri računanju potencija matrica reda 2 u terminima njihovih elemenata i svojstvenih vrijednosti i dr.) zainteresirani čitatelj može više pronaći u [10] (v. također [9]).

2Rezultati

Karakteristični (svojstveni) polinom matrice A\in\mathbb{M}_{n}(\mathbb{C}) definira se kao

k_{A}(\lambda)=\det(\lambda I-A),

gdje smo s \det(\cdot) označili determinantu matrice. Karakteristični polinom k_{A} ima n kompleksnih nultočaka, i to su karakteristične (svojstvene) vrijednosti matrice A. Za kvadratnu matricu

A=\begin{pmatrix} a & b \\ c & d \\ \end{pmatrix}

karakteristični polinom glasi

\begin{array}{rcl} k_{A}(\lambda) & = & \det(\lambda I-A)=\begin{vmatrix} \lambda -a & -b \\ -c & \lambda -d \\ \end{vmatrix}=(\lambda -a)(\lambda -d)-bc\\ & = & \lambda^{2}-(a+d)\lambda+ad-bc\\ & = & \lambda^{2}-(\text{tr}\,A)\lambda+\det A. \end{array}

Prema Hamilton–Cayleyjevom teoremu svaka kvadratna matrica poništava svoj karakteristični polinom; stoga vrijedi

(1)
A^{2}-(\text{tr}\,A)A+(\det A)I=0.

Odavde direktno slijedi jedna karakterizacija 2\times 2 matrica traga nula:

(2)
\text{tr}\,A=0 \Leftrightarrow A^{2}=-(\det A)I.

Za kvadratnu matricu A kažemo da je nilpotentna ako je A^{k}=0 za neki k\in\mathbb{N}. Nilpotentna matrica je singularna. Zaista, ako je A^{k}=0 za neki k\in\mathbb{N}, tada je prema Binet–Cauchyjevom teoremu 0=\det(A^{k})=(\det A)^{k} pa je \det A=0. Sljedeći rezultat pokazuje da su nilpotentne matrice jedine singularne matrice reda 2 koje imaju trag jednak nuli.

Teorem 2. Ako je A\in\mathbb{M}_{2}(\mathbb{C}) singularna matrica, tada su sljedeće tvrdnje međusobno ekvivalentne:
(a) \text{tr}\,A=0;
(b) \text{tr}(A^{2})=0;
(c) A^{2}=0;
(d) postoji k\in\mathbb{N},k\ge 2, tako da je A^{k}=0.

Dokaz.. (a)\Leftrightarrow(c) slijedi iz (2). Prema (1) imamo A^{2}=(\text{tr}\,A)A pa djelujući na tu jednakost funkcijom traga dobivamo \text{tr}(A^{2})=(\text{tr}\,A)^{2} te je stoga (a)\Leftrightarrow(b). Jasno je da (c) povlači (d). Obratno, neka je A^{k}=0 za neki k\in\mathbb{N},k\ge 2. Iz A^{2}=(\text{tr}\,A)A induktivno se dobije A^{k}=(\text{tr}\,A)^{k-1}A pa slijedi (\text{tr}\,A)^{k-1}A=0 odnosno \text{tr}\,A=0 i stoga A^{2}=0. Time smo pokazali (c)\Leftrightarrow(d), čime je teorem dokazan.
\ \blacksquare


Za matricu A\in\mathbb{M}_{n}(\mathbb{C}) kažemo da je skalarna ako je A=\lambda I za neki \lambda\in\mathbb{C}. Za neskalarne matrice reda 2 vrijedi i neka vrsta obrata Hamilton–Cayleyjevog teorema.

Teorem 3. \cite[teorem 2.6]{PF} Neka je A\in\mathbb{M}_{2}(\mathbb{C}) te \alpha,\beta\in\mathbb{C} takvi da je A^{2}-\alpha A+\beta I=0. Ako A nije skalarna matrica, onda je \text{tr}\,A=\alpha i \det A=\beta.

Dokaz.. Prema pretpostavci i prema (1) vrijedi
(3)
(\alpha-\text{tr}\,A)A=(\beta-\det A)I.
Ako je \text{tr}\,A\neq\alpha, onda je A=\frac{\beta-\det A}{\alpha-\text{tr}\,A}I, tj. A je skalarna matrica, što je kontradikcija s pretpostavkom. Prema tome, \text{tr}\,A=\alpha pa prema (3) slijedi \det A=\beta.
\ \blacksquare


Sada imamo još jednu karakterizaciju (neskalarnih) 2\times 2 matrica traga nula.

Korolar 4. Ako A\in\mathbb{M}_{2}(\mathbb{C}) nije skalarna matrica, tada su sljedeće tvrdnje međusobno ekvivalentne:
(a) \text{tr}\,A=0;
(b) A^{2} je skalarna matrica.

Dokaz.. (a)\Rightarrow(b) slijedi iz (2).

Pretpostavimo sada da vrijedi (b). Tada je A^{2}=-\beta I za neki \beta\in\mathbb{C}. Prema teoremu 3 vrijedi \text{tr}\,A=0 (i \det A=\beta).
\ \blacksquare


 

U nastavku dajemo karakterizaciju 2\times 2 kompleksnih matrica traga nula u terminima Robertsove okomitosti. U tu svrhu najprije uvedimo pojmove koji će nam za to trebati.

U kompleksnom unitarnom prostoru (X,(\cdot,\cdot)) uobičajeno je okomitost dvaju vektora x,y\in X definirati pomoću skalarnog produkta: x\perp y ako je (x,y)=0. Ako je \Vert \cdot\Vert norma inducirana tim skalarnim produktom, tj.

\Vert x\Vert =\sqrt{(x,x)} \quad (x\in X),

onda se okomitost dvaju vektora unitarnog prostora X može na različite načine iskazati u terminima te norme. Jedna mogućnost je

(x,y)=0\Leftrightarrow \Vert x+\lambda y\Vert =\Vert x-\lambda y\Vert \quad \forall \lambda\in\mathbb{C}.

Zaista, kako je

\begin{array}{rcl} \Vert x+\lambda y\Vert ^{2} & = & (x+\lambda y,x+\lambda y)\\ & = & (x,x)+\bar{\lambda}(x,y)+\lambda (y,x)+|\lambda|^{2}(y,y)\\ & = & \Vert x\Vert ^{2}+2\text{Re}(\bar{\lambda}(x,y))+|\lambda|^{2}\Vert y\Vert ^{2}\\ \end{array}

te

\Vert x-\lambda y\Vert ^{2}=\Vert x\Vert ^{2}-2\text{Re}(\bar{\lambda}(x,y))+|\lambda|^{2}\Vert y\Vert ^{2},

to je \Vert x+\lambda y\Vert =\Vert x-\lambda y\Vert za svaki \lambda\in\mathbb{C} ako i samo ako je \text{Re}(\bar{\lambda}(x,y))=0 za svaki \lambda\in\mathbb{C}. Sada je jasno da (x,y)=0 povlači \Vert x+\lambda y\Vert =\Vert x-\lambda y\Vert za svaki \lambda\in\mathbb{C}. Obratno, ako je \Vert x+\lambda y\Vert =\Vert x-\lambda y\Vert za svaki \lambda\in\mathbb{C}, onda se izborom \lambda=1 dobije \text{Re}(x,y)=0 dok \lambda =i daje \text{Re}(\bar{i}(x,y))=0 odnosno \text{Im}(x,y)=0. Prema tome, (x,y)=0.

Stoga je smisleno okomitost u proizvoljnom kompleksnom normiranom prostoru (X,\Vert \cdot\Vert ) definirati na način da su vektori x,y\in X okomiti ako je \Vert x+\lambda y\Vert =\Vert x-\lambda y\Vert za svaki \lambda\in\mathbb{C}. Takvu definiciju okomitosti dvaju vektora uveo je D. B. Roberts 1934. godine u radu [11]. U daljnjem ćemo Robertsovu okomitost dvaju vektora x,y\in X označavati s x\perp_{R}y. Iz definicije Robertsove okomitosti jasno je da je ovaj tip okomitosti:

1. nedegeneriran: x\perp_{R} x \Leftrightarrow x=0;
2. homogen: x\perp_{R} y\Rightarrow \alpha x \perp_{R} \beta y za sve \alpha,\beta\in\mathbb{C};
3. simetričan: x\perp_{R} y\Leftrightarrow y\perp_{R} x.

Međutim, za razliku od okomitosti inducirane skalarnim produktom, Robert\-so\-va okomitost nije aditivna, tj. iz x\perp_{R} y i x\perp_{R} z ne slijedi nužno x\perp_{R} (y+z), te isto tako iz x\perp_{R} y i z\perp_{R} y ne slijedi nužno (x+z)\perp_{R}y. Ovaj tip okomitosti općenito ne zadovoljava svojstvo egzistencije, u smislu da za svaka dva vektora x,y\in X postoji \lambda\in\mathbb{C} sa svojstvom x\perp_{R} (\lambda x+y). Više o tome zainteresirani čitatelj može naći u npr. radu [3].

Znamo da je prostor \mathbb{M}_{n}(\mathbb{C}) kompleksnih kvadratnih matrica reda n unitaran uz skalarni produkt definiran kao

(A,B):=\text{tr}(B^{*}A) \quad (A,B\in\mathbb{M}_{n}(\mathbb{C})).

Matrična norma \Vert A\Vert _{F}=(\text{tr}(A^{*}A))^{1/2} na \mathbb{M}_{n}(\mathbb{C}) inducirana tim skalarnim produktom naziva se Frobeniusova norma (odnosno Hilbert–Schmidtova nor\-ma). U tom (unitarnom) prostoru se okomitost dviju kvadratnih matrica iskazuje u terminima traga:

A\perp B \, \Leftrightarrow \,\text{tr}(B^{*}A)=0.

Stoga je i matrice traga nula moguće okarakterizirati u terminima okomitosti inducirane ovim skalarnim produktom. Naime,

(4)
\text{tr}\,A=0 \,\Leftrightarrow \, A\perp I.

Prostor \mathbb{M}_{n}(\mathbb{C}) je normiran (ali ne i unitaran) s obzirom na matričnu (ope\-ratorsku) normu induciranu euklidskom normom na prostoru \mathbb{C}^{n}. Naime, na unitarnom prostoru \mathbb{C}^{n} snabdjevenom skalarnim produktom

(x,y)=\sum_{i=1}^{n}x_{i}\overline{y}_{i},

gdje su x=(x_{1},\dots,x_{n}),y=(y_{1},\dots, y_{n})\in\mathbb{C}^{n}, euklidska norma vektora x=(x_{1},\dots, x_{n})\in\mathbb{C}^{n} definira se kao

\Vert x\Vert =\sqrt{(x,x)}=\Big(\sum_{i=1}^{n}|x_{i}|^{2}\Big)^{\frac{1}{2}}.

Preko standardne ortonormirane baze prostora \mathbb{C}^{n}, algebra \mathbb{M}_{n}(\mathbb{C}) poistovjećuje se s algebrom \mathbb{B}(\mathbb{C}^{n}) svih linearnih ope\-ra\-to\-ra koji djeluju na \mathbb{C}^{n}. Pritom vektore prostora \mathbb{C}^{n} pišemo kao jednostupčane matrice. Na \mathbb{M}_{n}(\mathbb{C}) uvodi se matrična (operatorska) norma inducirana euklidskom normom na \mathbb{C}^{n};

\left\Vert A\right\Vert = \displaystyle\max_{\left\Vert x\right\Vert =1} \left\Vert Ax\right\Vert \quad (A\in\mathbb{M}_{n}(\mathbb{C})).

Ovako definirana matrična norma je unitarno invarijantna, tj. \Vert UAV\Vert =\Vert A\Vert za sve unitarne matrice U,V\in\mathbb{M}_{n}(\mathbb{C}). Ova norma ima svojstvo konzi\-stentnosti (submultiplikativnosti), tj. vrijedi \Vert AB\Vert \le \Vert A\Vert \,\Vert B\Vert za sve A,B\in\mathbb{M}_{n}(\mathbb{C}). Osim toga, \Vert A^{*}\Vert =\Vert A\Vert te \Vert A^{*}A\Vert =\Vert A\Vert ^{2} za sve A\in\mathbb{M}_{n}(\mathbb{C}).

Označimo sa \sigma(A) spektar matrice A\in\mathbb{M}_{n}(\mathbb{C}), tj. skup svih njezinih svoj\-stve\-nih vrijednosti, a s \rho(A) spektralni radijus matrice A;

\rho(A)=\max\lbrace |\lambda|:\,\lambda\in\sigma(A)\rbrace .

Općenito vrijedi \rho(A)\le \Vert A\Vert. Ako je A normalna matrica (tj. vrijedi A^{*}A=AA^{*}), onda je \rho(A)=\Vert A\Vert .

Kvadratna matrica A je pozitivno semidefinitna ako je A hermitska (tj. A^{*}=A) te ako su sve njezine svojstvene vrijednosti nenegativne. Norma pozitivno semidefinitne matrice jednaka je njezinoj najvećoj svojstvenoj vrijednosti. Ako je A\in\mathbb{M}_{2}(\mathbb{C}), tada su svojstvene vrijednosti matrice A nultočke svojstvenog polinoma

k_{A}(\lambda)=\lambda^{2}-(\text{tr}\,A)\lambda+\det A,

a to su brojevi

\lambda_{1,2}=\frac{1}{2}\left(\text{tr}\,A\pm\sqrt{\text{tr}^{2}(A)-4\det A}\right).

Stoga je norma pozitivno semidefinitne matrice A\in\mathbb{M}_{2}(\mathbb{C}) jednaka

(5)
\Vert A\Vert =\frac{1}{2}\left(\text{tr}\,A+\sqrt{\text{tr}^{2}(A)-4\text{det}\,A}\right).

Budući da je matrica A^{*}A pozitivno semidefinitna, norma te matrice može se računati pomoću (5). Kako je \Vert A\Vert ^{2}=\Vert A^{*}A\Vert , to se norma proizvoljne kompleksne matrice reda 2 također računa primjenom formule (5), tj. vrijedi

\Vert A\Vert ^{2}=\frac{1}{2}\left(\text{tr}(A^{*}A)+\sqrt{\text{tr}^{2}(A^{*}A)-4\det(A^{*}A)}\right) \quad (A\in\mathbb{M}_{2}(\mathbb{C})).

Na normiranom prostoru \mathbb{M}_{n}(\mathbb{C}) snabdjevenom operatorskom normom, može se promatrati Robertsova okomitost dviju matrica: A\perp_{R} B ako je \Vert A+\lambda B\Vert =\Vert A-\lambda B\Vert za svaki \lambda\in\mathbb{C}. Zanima nas može li se 2\times 2 matrice traga nula i u ovom slučaju, kao što je to u slučaju unitarnog prostora \mathbb{M}_{2}(\mathbb{C}) (v. (4)), okarakterizirati u terminima Robertsove okomitosti. Odgovor je potvrdan, kao što pokazuje sljedeći teorem. Teorem je dokazan u radu [2] (v. također [3]), gdje je proučavana Robertsova okomitost elemenata C^{*}-algebri. (čitatelja upućujemo na [4, 6, 8] kao osnovnu literaturu o C^{*}-algebrama.) Ovdje dajemo alternativni (algebarski) dokaz u jednom posebnom slučaju, tj. za elemente C^{*}-algebre kompleksnih matrica reda 2, a koji se temelji na Hamilton–Cayleyjevom teoremu.

Teorem 5. Za A\in\mathbb{M}_{2}(\mathbb{C}) sljedeće tvrdnje su međusobno ekvivalentne:
(a) \text{tr}\,A=0;
(b) A\perp_{R} I.

Dokaz.. Označimo
T_{\lambda}=(A+\lambda I)^{*}(A+\lambda I) \quad (\lambda\in\mathbb{C}).
Tada je T_{\lambda} pozitivno semidefinitna matrica te prema (5) vrijedi
(6)
\Vert A+\lambda I\Vert ^{2}=\Vert T_{\lambda}\Vert =\frac{1}{2}\left(\text{tr}\,T_{\lambda}+\sqrt{\text{tr}^{2}(T_{\lambda})-4\det T_{\lambda}}\right).

(a)\Rightarrow(b) Pretpostavimo da je \text{tr}\,A=0. Prema teoremu 1 postoji unitarna matrica U\in\mathbb{M}_{2}(\mathbb{C}) takva da su svi dijagonalni elementi matrice U^{*}AU jednaki nuli. Budući da je operatorska norma unitarno invarijantna, bez smanjenja općenitosti možemo pretpostaviti da je A matrica oblika
A=\begin{pmatrix} 0 & a \\ b & 0 \\ \end{pmatrix}
za neke a,b\in\mathbb{C}. Tada je
T_{\lambda}=\begin{pmatrix} \bar{\lambda} & \bar{b} \\ \bar{a} & \bar{\lambda} \\ \end{pmatrix}\begin{pmatrix} \lambda & a \\ b & \lambda \\ \end{pmatrix}=\begin{pmatrix} |\lambda|^{2}+|b|^{2} & \bar{\lambda}a+\lambda \bar{b} \\ \lambda \bar{a}+\bar{\lambda} b & |\lambda|^{2}+|a|^{2} \\ \end{pmatrix}.
Stoga je
\begin{array}{rcl} \text{tr}\,T_{\lambda} & = & 2|\lambda|^{2}+|a|^{2}+|b|^{2},\\ \det T_{\lambda} & = & (|\lambda|^{2}+|b|^{2})(|\lambda|^{2}+|a|^{2})-(\bar{\lambda}a+\lambda \bar{b})(\lambda \bar{a}+\bar{\lambda} b)\\ & = & |\lambda|^{4}+|a|^{2}|b|^{2}-\bar{\lambda}^{2}ab-\lambda^{2}\bar{a}\bar{b},\\ \end{array}
pa je \text{tr}\,T_{\lambda}=\text{tr}\,T_{-\lambda} i \det T_{\lambda}=\det T_{-\lambda} za svaki \lambda\in\mathbb{C}. Prema (6) zaključujemo da je \Vert A+\lambda I\Vert =\Vert A-\lambda I\Vert za svaki \lambda\in\mathbb{C}, tj. A\perp_{R} I.

 

(b)\Rightarrow(a) Pretpostavimo da je A\perp_{R} I. Prema teoremu o Schurovoj dekompoziciji postoji unitarna matrica U\in\mathbb{M}_{2}(\mathbb{C}) takva da je matrica U^{*}AU gor\-njo\-tro\-kutasta. Zbog unitarne invarijantnosti operatorske norme bez sma\-nje\-nja općenitosti možemo pretpostaviti da je A matrica oblika
A=\begin{pmatrix} a & b \\ 0 & c \\ \end{pmatrix}
za neke a,b,c\in\mathbb{C}.

(i) Razmotrimo najprije slučaj b=0. Tada je A dijagonalna matrica pa je
\Vert A+\lambda I\Vert =\max\lbrace |a+\lambda|,|c+\lambda|\rbrace .
Stoga je A\perp_{R} I ekvivalentno uvjetu
(7)
\max\lbrace |a+\lambda|,|c+\lambda|\rbrace =\max\lbrace |a-\lambda|,|c-\lambda|\rbrace \quad (\lambda\in\mathbb{C}).
Uvrstimo li u (7) redom \lambda =-a,\lambda=-c i \lambda =\frac{1}{2}(a+c), imamo
\begin{array}{rcl} |a-c| & = & \max\lbrace 2|a|,|a+c|\rbrace ,\\ |a-c| & = & \max\lbrace 2|c|,|a+c|\rbrace ,\\ |a-c| & = & \max\lbrace |3a+c|,|a+3c|\rbrace .\\ \end{array}

Pretpostavimo najprije da je |a-c|=|a+c|. Tada je \text{Re}(a\bar{c})=0 pa je
|3a+c|^{2}=9|a|^{2}+|c|^{2}, \quad |a+3c|^{2}=|a|^{2}+9|c|^{2}.
Kako je |3a+c|\le |a-c|, slijedi 9|a|^{2}+|c|^{2}\le |a|^{2}+|c|^{2} pa je a=0. Također, iz |a+3c|\le |a-c| slijedi |a|^{2}+9|c|^{2}\le |a|^{2}+|c|^{2} pa je c=0. Zaključujemo da je \text{tr}\,A=0.

Uzmimo sada da je |a-c|\neq |a+c|. Tada je |a-c|=2|a|=2|c|. Stoga je
4|a|^{2}=|a-c|^{2}=|a|^{2}+|c|^{2}-2\text{Re}(a\bar{c})=2|a|^{2}-2\text{Re}(a\bar{c})
pa je |a|^{2}=-\text{Re}(a\bar{c}). Zapišimo a=|a|e^{i\varphi} i c=|a|e^{i\psi}, pri čemu su \varphi,\psi\in\mathbb{R}. Tada je a\bar{c}=|a|^{2}e^{i(\varphi-\psi)} pa iz |a|^{2}=-\text{Re}(a\bar{c})=-|a|^{2}\cos(\varphi-\psi) slijedi \cos(\varphi-\psi)=-1. Tada je \varphi-\psi=\pi pa je c=-a, tj. \text{tr}\,A=0.

 

(ii) Razmotrimo slučaj b\neq 0. Tada je
T_{\lambda}=\begin{pmatrix} \overline{a+\lambda} & 0 \\ \bar{b} & \overline{c+\lambda} \\ \end{pmatrix}\begin{pmatrix} a+\lambda & b \\ 0 & c+\lambda \\ \end{pmatrix}=\begin{pmatrix} |a+\lambda|^{2} & b(\overline{a+\lambda}) \\ \bar{b}(a+\lambda) & |b|^{2}+|c+\lambda|^{2} \\ \end{pmatrix}.
Prema (6), A\perp_{R} I je ekvivalentno uvjetu \Vert T_{\lambda}\Vert =\Vert T_{-\lambda}\Vert za svaki \lambda\in\mathbb{C}, odnosno uvjetu
\text{tr}\,T_{\lambda}-\text{tr}\,T_{-\lambda}=\sqrt{\text{tr}^{2}(T_{-\lambda})-4\det T_{-\lambda}}-\sqrt{\text{tr}^{2}(T_{\lambda})-4\det T_{\lambda}} \quad (\lambda\in\mathbb{C}),
odakle se kvadriranjem ove jednakosti dobije
\text{tr}\,T_{\lambda}\text{tr}\,T_{-\lambda}-2\det T_{-\lambda}-2\det T_{\lambda}=\sqrt{\text{tr}^{2}(T_{-\lambda})-4\det T_{-\lambda}}\sqrt{\text{tr}^{2}(T_{\lambda})-4\det T_{\lambda}}
te zatim ponovnim kvadriranjem slijedi
(8)
(\det T_{-\lambda}-\det T_{\lambda})^{2}=(\text{tr}\,T_{-\lambda}-\text{tr}\,T_{\lambda})(\det T_{-\lambda}\text{tr}\,T_{\lambda}-\det T_{\lambda}\text{tr}\,T_{-\lambda})
za svaki \lambda\in\mathbb{C}. Uočimo da je za svaki \lambda\in\mathbb{C}
(9)
\text{tr}\,T_{\lambda} =|a+\lambda|^{2}+|c+\lambda|^{2}+|b|^{2},
(10)
\det T_{\lambda}=|a+\lambda|^{2}|c+\lambda|^{2}.
Uvrstimo li \lambda =a i \lambda=c redom u (8), korištenjem izraza (9) i (10) dobije se
(11)
4|a|^{4}|a+c|^{4}=(4|a|^{2}+|a+c|^{2}-|a-c|^{2})|a|^{2}|a+c|^{2}(|a-c|^{2}+|b|^{2}),
(12)
4|c|^{4}|a+c|^{4}=(4|c|^{2}+|a+c|^{2}-|a-c|^{2})|c|^{2}|a+c|^{2}(|a-c|^{2}+|b|^{2}).

Pretpostavimo da je a+c\neq 0. Pokazat ćemo da ta pretpostavka dovodi do kontradikcije.

Ako je a=0, tada iz (12) slijedi |c|^{6}|b|^{2}=0 pa zbog b\neq 0 imamo c=0. No, to je u suprotnosti s pretpostavkom a+c\neq 0.

Slično, ako je c=0, tada iz (11) slijedi |a|^{6}|b|^{2}=0 pa zbog b\neq 0 imamo a=0. No, to je također u suprotnosti s pretpostavkom a+c\neq 0.

Prema tome, a\neq 0,c\neq 0,a+c\neq 0, pa iz (11) i (12) imamo
(13)
4|a|^{2}|a+c|^{2}=(4|a|^{2}+|a+c|^{2}-|a-c|^{2})(|a-c|^{2}+|b|^{2}),
(14)
4|c|^{2}|a+c|^{2}=(4|c|^{2}+|a+c|^{2}-|a-c|^{2})(|a-c|^{2}+|b|^{2}).
Odavde slijedi
\frac{|a|^{2}}{|c|^{2}}=\frac{4|a|^{2}+|a+c|^{2}-|a-c|^{2}}{4|c|^{2}+|a+c|^{2}-|a-c|^{2}},
odnosno
|a|^{2}(4|c|^{2}+|a+c|^{2}-|a-c|^{2})=|c|^{2}(4|a|^{2}+|a+c|^{2}-|a-c|^{2}),
što je ekvivalentno s
(15)
(|a|^{2}-|c|^{2})(|a+c|^{2}-|a-c|^{2})=0.
Kada bi vrijedilo |a+c|=|a-c|, tada bi iz (13) slijedilo b=0 što je u suprotnosti s našom pretpostavkom. Prema tome, |a+c|\neq |a-c| pa iz (15) slijedi |a|=|c|. Tada se uvrštavanjem \lambda =ai u (8) te nakon sređivanja dobivenog izraza dobije |b|^{2}\text{Im}^{2}(a\bar{c})=0, odakle zbog b\neq 0 slijedi \text{Im}(a\bar{c})=0. Prema tome, a\bar{c}\in\mathbb{R}. Zapišimo a=|a|e^{i\varphi} te c=|a|e^{i\psi} pri čemu su \varphi,\psi\in\mathbb{R}. Tada je a\bar{c}=|a|^{2}e^{i(\varphi-\psi)} pa zbog a\bar{c}\in\mathbb{R} slijedi \sin(\varphi-\psi)=0. Zato je \psi=\varphi ili \psi=\varphi-\pi. Kako slučaj \psi=\varphi-\pi vodi na c=-a što je u suprotnosti s našom pretpostavkom, zaključujemo da je \psi=\varphi odnosno c=a. Tada iz (13) slijedi |b|^{2}=2|a|^{2}. Uvrstimo li \lambda=\frac{1}{2}a u (8), nakon sređivanja dobivenog izraza imamo a=0, a vidjeli smo da je to u suprotnosti s našom pretpostavkom a+c\neq 0.

Zaključujemo da pretpostavka a+c\neq 0 vodi do kontradikcije, pa je stoga a+c=0, odnosno \text{tr}\,A=0. Time je teorem dokazan.
\ \blacksquare


Karakterizacija matrica traga nula opisana u teoremu 5 općenito ne vrijedi za matrice reda većeg od 2, kao što pokazuju sljedeći primjeri.

Primjer 6. Neka je n\in\mathbb{N},n\gt 2, te neka je A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}) dijagonalna matrica s elementima na glavnoj dijagonali a_{11}=-1,a_{22}=\dots=a_{nn}=1. Tada vrijedi
\Vert A+\lambda I\Vert =\max\lbrace |1-\lambda|,|1+\lambda|\rbrace , \quad \Vert A-\lambda I\Vert =\max\lbrace |1+\lambda|,|1-\lambda|\rbrace ,
pa je \Vert A+\lambda I\Vert =\Vert A-\lambda I\Vert za svaki \lambda\in\mathbb{C}, tj. A\perp_{R} I. Uočimo da je \text{tr}\,A=n-2\neq 0.

Primjer 7. Neka je n\in\mathbb{N},n\gt 2, te neka je A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}) dijagonalna matrica s elementima na glavnoj dijagonali a_{11}=1-n,a_{22}=\dots=a_{nn}=1. Tada je \text{tr}\,A=0. Kako je
\Vert A+I\Vert =\max\lbrace 2,n-2\rbrace , \quad \Vert A-I\Vert =n,
to je \Vert A+I\Vert \neq \Vert A-I\Vert za svaki prirodni broj n\gt 2, pa zaključujemo A\not\perp_{R} I.


Na kraju dajemo karakterizaciju 2\times 2 regularnih kompleksnih matrica traga nula u terminima Robertsove okomitosti.

Teorem 8. \cite[lema 2.1]{PF} Za regularnu matricu A\in\mathbb{M}_{2}(\mathbb{C}) vrijedi
A^{-1}=\frac{1}{\det A}\left( (\text{tr}\,A)I-A\right), \quad \text{tr}\,A^{-1}=\frac{\text{tr}\,A}{\det A}.

Dokaz.. Pomnože li se obje strane jednakosti (1) s A^{-1}, dobije se
A-(\text{tr}\,A) I+(\det A)A^{-1}=0,
odnosno
(16)
A^{-1}=\frac{1}{\det A}\left( (\text{tr}\,A)I-A\right).
Djelujemo li tragom na (16), dobije se
\text{tr}\,A^{-1}=\frac{1}{\det A}\left(( \text{tr}\,A)(\text{tr}\,I)-\text{tr}\,A\right)=\frac{\text{tr}\,A}{\det A},
čime je tvrdnja dokazana.
\ \blacksquare


Ako je A\in\mathbb{M}_{2}(\mathbb{C}) regularna matrica, tada iz teorema 8 slijedi

(17)
\text{tr}\,A=0\,\Leftrightarrow\, \text{tr}\,A^{-1}=0.

Jasno je da (17) ne vrijedi općenito za matrice reda većeg od 2.

Iz (17) i teorema 5 direktno dobivamo sljedeći rezultat za regularne matrice reda 2.

Korolar 9. Ako je A\in\mathbb{M}_{2}(\mathbb{C}) regularna matrica, tada su sljedeće tvrdnje međusobno ekvivalentne:
(a) \text{tr}\,A=0;
(b) \text{tr}\,A^{-1}=0;
(c) A\perp_{R} I;
(d) A^{-1}\perp_{R} I.
Bibliografija
[1] A. A. Albert, B. Muckenhoupt, On matrices of trace zero, Michigan Math. J. 4 (1957), 1–3.
[2] Lj. Arambašić, T. Berić, R. Rajić, Roberts orthogonality and Davis–Wielandt shell, Linear Algebra Appl. 539 (2018), 1–13.
[3] Lj. Arambašić, R. Rajić, On Birkhoff–James and Roberts orthogonality, Spec. Matrices 6 (2018), 229–236.
[4] J. Dixmier,C^{*}-Algebras}, North-Holland, Amsterdam, 1981.
[5] M. Kožul, R. Rajić, Matrice traga nula, Math.e 26 (1) (2014), 31–41.
[6] G. J. Murphy, {C^{*}-Algebras and Operator Theory}, Academic Press, Boston, 1990.
[7] W. V. Parker, Sets of complex numbers associated with a matrix, Duke Math. J. 15 (3) (1948), 711–715.
[8] G. Pedersen, {C^{*}-Algebras and Their Automorphism Groups}, Academic Press, London–New York, 1979.
[9] M. Perković, Primjene Hamilton–Cayleyjevog teorema na kvadratne matrice reda2}, diplomski rad, PMF – Matematički odsjek, Sveučilište u Zagrebu, 2018.
[10] V. Pop, O. Furdui, Square Matrices of Order2}, Springer International Publishing AG, 2017.
[11] D. B. Roberts, On the geometry of abstract vector spaces, Tôhoku Math. J. 39 (1934), 42–59.
[12] K. Shoda, Einige Sätze über Matrizen, Japan J. Math. 13 (1936), 361–365.
[13] F. Zhang, Mathrix Theory. Basic Results and Techniques, 2nd edition, Springer-Verlag, New York, 2011.
 

 

Matrix Reshish alat za matrice i sustave linearnih jednadžbi

Vlado Halusek, Tibor Rodiger i Marijana Špoljarić


 

Ključne riječi: matrice, operacije s matricama, sustavi linearnih jednadžbi, matrični kalkulator



Sažetak

Matrice u visokoškolskoj matematici nezaobilazni su dio sadržaja kojeg studenti moraju savladati. Shvaćanje pojma matrica ne predstavlja velik problem za studente kao ni operacije transponiranja, zbrajanja i oduzimanja. Problemi nastaju kod množenja, traženja inverza i rješavanja sustava linearnih jednadžbi primjenom Gaussove metode transformacija. Matrix Reshish je mrežna stranica koja je prilagođena za korištenje putem mobilnih uređaja, a sadrži matrični kalkulator. Kalkulator je koncipiran tako da daje rješenje postavljenog zadatka korak po korak, što uvelike olakšava studentu uvježbavanje rješavanja zadatka.





1Uvod

U brojnim se slučajevima zbog preglednosti podaci zapisuju u tablicama. Ako se s takvim tablicama mogu izvoditi određene računske operacije, onda se one zovu matricama. Zapisivanje podataka pomoću matrica omogućuje kodiranje različitih oblika njihove povezanosti i potom ispitivanje postoji li među određenim objektima neka od mogućih veza. Matrice se između ostalog koriste za zapisivanje i obradu podataka, za različito modeliranje u ekonomici, u kompjutorskoj grafici itd. [str. 69]- [4].

Linearna algebra pomoću matrica omogućuje:

(1) sažet način pisanja sustava linearnih jednadžbi, čak i jako velik sustav,
(2) traženje rješenja linearnih jednadžbi i provjeru postojanja rješenja računanjem determinante [str. 54]- [3].


Matrice se mogu množiti samo ako prva od njih ima toliko stupaca koliko druga ima redaka, pri čemu se kao rezultat dobije matrica koja ima redaka kao i prva, a stupaca kao druga matrica. Dakle, matrica C_{(m,p)} koja je umnožak dviju matrica može se dobiti samo ako te dvije matrice imaju oblik A_{\left(m,n\right)} i B_{(n,p)}, to jest

A_{\left(m,n\right)} \cdot B_{(n,p)} =C_{(m,p)} .

Osnovno pravilo množenja matrica je da na mjesto (i, j) u umnošku matrica dolazi umnožak i-tog retka prve matrice i j-tog stupca druge matrice. Taj umnožak se računa po elementima tako da se pomnoži prvi element i-tog retka s prvim elementom j-tog stupca, drugi element i-tog retka s drugim elementom j-tog stupca itd. Na kraju se vrijednost elementa (i, j) dobije tako da sve te umnoške zbrojimo. To možemo prikazati na sljedeći način:

c_{ij} =\sum _{k=1}^{n}a_{ik} b_{kj} ,i\in \left\lbrace 1,2,3,...,m\right\rbrace ;j\in \left\lbrace 1,2,3,...,n\right\rbrace [str. 199]- [5].

Studenti s lakoćom znaju prepoznati koje matrice mogu množiti, a koje ne. Najčešća greška koju rade kod množenja matrica je da krenu s množenjem i-tog retka prve matrice i j-tog stupca druge matrice za prva dva retka matrice, a zatim nastave množenje tako da stupac množe retkom. Isto tako, često pogriješi kod samog množenja i predznaka umnoška. Kod kvadriranja matrice studenti najčešće svaki element matrice kvadriraju i ne koriste pravilo za umnožak dviju matrica, odnosno

A^{2} =A\cdot A.

Kod traženja inverza matrice najčešće će se koristiti determinantama, a rijetko kada svođenjem na reducirani oblik pomoću elementarnih transformacija:

(1) dvije jednadžbe zamijene mjesto,
(2) jednadžbu sustava množi se s konstantom različitom od nule,
(3) jedna jednadžba, pomnožena konstantom, pribroji se drugoj jednadžbi [str. 194]- [1],

koje se koriste u Gaussovom postupku. Elementarnim transformacijama dolazi se do jedinične matrice s lijeve strane proširene matrice. To zahtijeva kreativnost i predviđanje bar dva koraka unaprijed što će se dogoditi s matricom, a studenti najčešće ne znaju ni kako započeti rješavanje zadatka pogotovo ako su svi elementi u prvom stupcu različiti od jedan.

Kalkulatori koje studenti najčešće imaju omogućavaju rješavanje osnovnih računskih operacija s matricama do reda 3\times 3. I oni daju rješenje postavljenog problema bez postupka kojim se došlo do tog rješenja. Upravo zbog toga studenti kalkulatorima i kontrolom rješenja u zbirkama zadataka mogu pronaći samo točno rješenje, ali ako su pogriješili ne mogu pronaći grešku i najčešće odustaju od potrage za rješenjem. Kako bi studenti savladali ishode učenja o matricama i sustavima linearnih jednadžbi, a time i položili predmet kojeg su slušali, može im pomoći matrični kalkulator na Internet stranici http://matrix.reshish.com/ i http://matrix.reshish.com/.



2Matrix Reshish

Matrix Reshish [9] je mrežna stranica s besplatnim online matričnim kalkulatorom. Algoritam kojeg koristi Matrix Reshish temelji se na Binet-Cauchyevom teoremu1 i LU rastavu2. Zbog toga je numerički stabilan, a složenost mu je \mathcal{O}=n^{3}. Reshish Matrix kalkulator omogućava izračunavanje svih osnovnih matričnih operacija i metoda koje se koriste za rješavanje sustava linearnih jednadžbi (tablica 1).

\eject Tablica 1. Popis metoda i operacija nad matricama koje omogućava Reshish Matrix kalkulator
 

Naziv metode na engleskom jeziku Naziv metode na hrvatskom jeziku Opis metode/operacije
Gauss-Jordan Elimination Gauss-Jordanova eliminacija Rješavanje sustava linearnih jednadžbi primjenom Gauss-Jordanove metode eliminacije. Kalkulator rješava jednostavne sustave i neodređene sustave koji imaju beskonačno mnogo rješenja. U slučaju beskonačno mnogo rješenja dobit će se ovisnost jedne varijable o drugoj. Koeficijenti linearnih jednadžbi mogu biti i kompleksni brojevi
Cramer's Rule Cramerovo pravilo Rješavanje sustava linearnih jednadžbi primjenom Cramerovog pravila. Koeficijenti linearnih jednadžbi mogu biti i kompleksni brojevi. Kalkulator rješava svaku determinantu sustav posebno
Inverse Matrix Method Metoda inverza matrica Rješavanje sustava linearnih jednadžbi primjenom metode inverzne matrice. Koeficijenti linearnih jednadžbi mogu biti i kompleksni brojevi
Matrix Rank Rang matrice Izračunavanje ranga matrice
Determinant Determinanta Izračunavanje determinante matrice
Inverse Matrix Inverz matrice Izračunavanje inverza matrice Gaussovom metodom eliminacije
Matrix Power Kvadriranje matrice Izračunavanje kvadrata zadane matrice
Matrix Transpose Trensponirana matrica Izračunavanje transponirane matrice
Matrix Multiplication Množenje matrica Izračunavanje umnoška dviju matrica. Matrice mogu biti i jednodimenzionalne (vektor) tako da se može izračunati umnožak vektora, matrice i vektora i obrnuto
Matrix Addition/ Substraction Zbrajanje i oduzimanje matrica Izračunavanje zbroja i razlike dviju matrica

Izvor: autori

Matrix Reshish omogućava ne samo rješenje postavljenog problema, nego i detaljan proces rješavanja, korak po korak, u nizu jednostavnih tablica. Ovaj način prikaza rješenja omogućava korištenje ovog alata za učenje i poučavanje. Za svaku metodu i operaciju koja se koristi dano je objašnjenje. Postoji mobilna verzija mrežne stranice, odnosno stranica je prilagođena korištenju na mobilnim uređajima. Sve mogućnosti kalkulatora moguće je koristiti ukoliko postoji Internet veza. Svaka od ovih opcija koje nudi matrični kalkulator vrlo je jednostavan i intuitivan za korištenje kako će se i vidjeti u daljnjem tekstu na primjeru Cramerovog pravila, traženja inverza matrice i množenja matrica.





2.1Cramerovo pravilo

Zbog lakšeg praćenja načina rješavanja tijekom objašnjavanja korištenja Kalkulatora za Cramerovo pravilo rješavat će se sustav tri jednadžbe s tri nepoznanice

\begin{array}{rrr} {2x_{1} -2x_{2} +x_{3} =3} \\ {3x_{1} +x_{2} -x_{3} =7} \\ {x_{1} -3x_{2} +2x_{3} =0} \end{array}

čija su rješenja x_{1} =2,x_{2} =0 i x_{3} =-1.

Klikom na Cramer's Rule u padajućem izborniku na mrežnoj stranici može se izračunati rješenje sustava linearnih jednadžbi pomoću Cramerovog pravila (slika 1).

Slika 1. Izgled Cramer's Rule Calculator


 



Izvor: autori

Otvaranjem Cramer's Rule Calculator prvo treba odabrati red kvadratne matrice (Matrix dimension). Kalkulator izračunava rješenja sustava do 100 jednadžbi s 100 nepoznanica (slika 2).

Slika 2. Odabir dimenzije sustava




 



Izvor: autori

Klikom na Set matrix pojavljuje se novi prozor u kojem možemo vratiti sustav koji smo prethodno računali klikom na Restore Matrix. Ukoliko rješava sustav koji ima koeficijente kompleksne brojeve potrebno je kliknuti na Complex numbers. U padajućem izborniku Fractional postoji mogućnost odabira zapisa rješenja koje može biti u obliku razlomka ili decimalnog broja. U tablici svaki redak \left(1,2,3\right) predstavlja jednadžbu, a stupac nepoznanice jednadžbi \left(X_{1} ,X_{2} ,X_{3} \right). U ćeliji koja je presjek stupca X_{1} i retka 1 upisuje se koeficijent prve jednadžbe koji se nalazi uz prvu nepoznanicu x_{1}, u ćeliji koja je presjek stupca X_{2} i retka 1 upisuje se koeficijent prve jednadžbe koji se nalazi uz drugu nepoznanicu x_{2}, u ćeliji koja je presjek stupca X_{3}i retka 1 upisuje se koeficijent prve jednadžbe koji se nalazi uz treću nepoznanicu x_{3}i u presjek 1. retka i stupca bupisuje se slobodan član prve jednadžbe. Na isti način se popunjavaju ostali redovi (slika 3).

Slika 3. Upis koeficijenata zadanog sustava jednadžbi




 



Izvor: autori

Reset omogućava brisanje svih podataka koji su unijeti. Fill empty cells with zero omogućava popunjavanje praznih ćelija s nulama, odnosno potrebno je u tablicu unijeti samo koeficijente različite od nule. Klikom na Solve dobiva se rješenje sustava.



Slika 4. Prikaz rješenja sustava









Izvor: autori

Rješenje se prikazuje u standardnom obliku za svaku nepoznanicu. U donjem desnom uglu prikazat će se vrijeme potrebno za traženje rješenja zadanog sustava linearnih jednadžbi, a klikom na Show solution prikazat će se korak po korak koji je računat kako bi se došlo do rješenja (slika 4).



Slika 5. Prikaz detaljnog rješenja




 



Izvor: autori

U detaljnom rješenju prikazane su sve matrice čije se determinante određuju i kvocijent određenih determinanti kako bi se dobilo rješenje (slika 5). Iza svakog zapisa matrice i pripadne determinante postoji opcija Very detailed solution. Klikom na Calculate apart prikazat će se u novom prozoru izračun odabrane determinante.

Slika 6. Prikaz izračuna determinante
 



Izvor: Autori

Izračun determinante provodi se svođenjem matrice na gornjotrokutastu matricu pomoću elementarnih transformacija i primjene svojstva da je determinanta trokutaste matrice jednaka umnošku elemenata na glavnoj dijagonali (slika 6).

Ukoliko je za uneseni sustav linearnih jednadžbi determinanta glavne matrice, odnosno matrice koja se sastoji od koeficijenata uz nepoznanice sustava linearnih jednadžbi, jednaka nuli, program upućuje na Gauss-Jordanove eliminacije kako bi se dobilo rješenje sustava ukoliko ih ima beskonačno (slika 7).

Slika 7. Rješenje se ne može dobiti primjenom Cramer's Rule Calculator


 



Izvor: autori

Klikom na Show soulution prikazat će se izračun determinante čija je vrijednost nula.





2.2Inverz matrice

Zbog lakšeg praćenja načina rješavanja tijekom objašnjavanja korištenja Kalkulatora za inverz matrica tražit će se inverz matrice

A=\left[\begin{array}{cc} {1} & {-1} \\ {2} & {3} \end{array}\right].

Klikom na Inverse Matrix u padajućem izborniku na mrežnoj stranici možete izračunati inverz matrice (slika 8).


Slika 8. Izgled Inverse Matrix kalkulatora




 



Izvor: Autori

Otvaranjem Inverse Matrix Calculator prvo morate odabrati red kvadratne matrice (Matrix dimension). Kalkulator izračunava invez matrice do 100-tog reda. Klikom na Set matrix pojavljuje se novi prozor u kom se upisuju elementi matrice.



Slika 9. Upis matrice


 



Izvor: Autori

Novi prozor za upis elemenata matrice ima sve opcije (Restore matrix, Complex numbers, Reset, Fill empty cells with zero, Calculate) koje su opisane kod Cramer's Rule Calculatora. Novost je opcija Very detailed solution koja ispisuje korak po korak u traženju inverza elementarnim transformacijama (slika 9).

Slika 10. Prikaz rješenja




 



Izvor: autori

Prikaz rješenja je u matričnom obliku (slika 10). U donjem desnom uglu prikazat će se vrijeme potrebno za izračunavanje inverza, a klikom na Show solution prikazat će se korak po korak koji je računat kako bi se došlo do rješenja (slika 11).



Slika 11. Detaljan prikaz rješenja


 



Izvor: autori

U detaljnom prikazu rješenja svaka matrica popraćena je s riječima opisanom radnjom u tom koraku. Prvo je izračunata determinanta zadane matrice i provjereno je li ona različita od nule. Odabirom opcije Very detailed solution, odnosno klikom na Calculate apart prikazat će se u novom prozoru. Determinanta se izračunava svođenjem matrice na gornjotrokutastu matricu pomoću elementarnih transformacija i primjene svojstva da je determinanta trokutaste matrice jednaka umnošku elemenata na glavnoj dijagonali.





2.3Množenje matrica

Zbog lakšeg praćenja u primjeru traži se umnožak matrica

A=\left[\begin{array}{cc} {\begin{array}{c} {1} \\ {0} \\ {1} \end{array}} & {\begin{array}{c} {2} \\ {-2} \\ {1} \end{array}} \end{array}\right] i B=\left[\begin{array}{c} {\begin{array}{ccc} {2} & {0} & {-1} \end{array}} \\ {\begin{array}{ccc} {1} & {0} & {4} \end{array}} \end{array}\right].

A\cdot B=\left[\begin{array}{cc} {\begin{array}{c} {1} \\ {0} \\ {1} \end{array}} & {\begin{array}{c} {2} \\ {-2} \\ {1} \end{array}} \end{array}\right]\cdot \left[\begin{array}{c} {\begin{array}{ccc} {2} & {0} & {-1} \end{array}} \\ {\begin{array}{ccc} {1} & {0} & {4} \end{array}} \end{array}\right]=\left[\begin{array}{ccc} {4} & {0} & {7} \\ {-2} & {0} & {-8} \\ {3} & {0} & {3} \end{array}\right].

Klikom na Matrix Multiplication u padajućem izborniku na mrežnoj stranici možete izračunati umnožak matrica (slika 12).
Slika 12. Izgled Matrix Multiplication kalkulatora




 



Izvor: autori

Otvaranjem Matrix Multiplication Calculator prvo morate odabrati tip matrica (Matrix dimension) koje se množe. Kalkulator izračunava umnožak matrica do tipa 100\times 100. Ukoliko korisnik unese tip matrice koji se ne može množiti, odnosno prva matrica nema onoliko stupaca koliko druga ima redaka, sama aplikacija će automatski promijeniti broj redaka druge matrice ili broj stupaca prve matrice ovisno o tome koju ste dimenziju prvu unijeli. Klikom na Set matrix pojavljuje se novi prozor u kojem se upisuju elementi matrice.

Slika 13. Upis elemenata matrica A i B


 



Izvor: autori

Elementi matrice A unose se u prvi prozor, a elementi druge matrice u prozor do njega (slika 13). Novi prozor za upis elemenata matrice ima sve opcije (Restore matrix, Complex numbers, Reset, Fill empty cells with zero, Calculate) koje su opisane kod prethodna dva opisana primjera. Klikom na Calculate izračunat će se umnožak matrica.

Slika 14. Prikaz umnoška matrica A i B




 



Izvor: autori

Prikaz rješenja je u matričnom obliku (slika 14). U donjem desnom uglu prikazat će se vrijeme potrebno za izračunavanje umnoška, a klikom na Show solution prikazat će se korak po korak koji je računat kako bi se došlo do rješenja (slika 15).

Slika 15. Detaljan prikaz rješenja


 



Izvor: autori

Prikaz detaljnog rješenja se temelji na prikazu matrice u kojem je naznačen element koji se računa, a iznad matrice je zbroj umnožaka koji daje taj element. Element c_{11} nalazi se u prvom retku i prvom stupcu matrice umnoška zadanih matrica. Njegovu vrijednost dobije se zbrajanjem umnožaka prvog retka matrice A i prvog stupca matrice B

c_{11} =1\cdot 2+2\cdot 1=4.



3Prednosti i nedostaci Reshish Matrix kalkulatora

Matrični kalkulator Reshish Matrix besplatan je alat dostupan na računalima i mobilnim uređajima bez dodatnih instalacija. Jedan od nedostataka ovog alata je što se može koristiti samo uz dostupnost internetske veze. Najveća prednost ovog alata je što omogućava 10 različitih operacija s matricama uz detaljan opis svakog koraka računanja rješenja i to matričnog zapisa i opisa riječima.

Tablica 2. Prednosti i nedostaci Reshish Matix alata


 

Prednosti Nedostaci
numerički stabilan algoritam, složenosti \mathcal{O}=n^{3} ne temelji se na kombinatornom algoritmu
dostupan besplatno internetska veza
nije potrebna instalacija Laplaceov razvoj
dostupan na mobilnim uređajima množenje matrice skalarom
10 različitih operacija rješavanje složenijih zadataka s slijedom računskim operacijama
u aritmetici pomičnog zareza Cramerovo pravilo je mnogo točnije  
detaljan ispis koraka rješenja  
upis matrica do tipa 100\times 100  

Izvor: autori

Izračun determinante matrice u svakoj ponuđenoj operaciji, u kojoj ju je potrebno računati, računa se pomoću svođenja matrice na trokutastu matricu i računanje pomoću elemenata na glavnoj dijagonali. Nijedna operacija ne pruža mogućnost izračuna determinanti pomoću Laplaceovog razvoja. Laplaceov razvoj je kombinatorni algoritam koji ima složenost \mathcal{O}=n! i numerički je nestabilan. Kombinatorni alati kao Laplaceov razvoj koriste se za simboličku algebru, tj. Computer Algebra Systems (CAS)[6]. Jedan od alata koji daje takvu kombinatornu pomoć je Matrix calculator [7]. Matrix Reshish je numerički alat i ne treba očekivati čisto algebarsko kombinatorni algoritam. Upravo zbog ovoga Cramerovo pravilo je mnogo točnije u aritmetici pomičnog zareza nego isti algoritam temeljen na Laplaceovom razvoju. Za složeniji matrični račun u aritmetici pomičnog zareza može se koristiti Octave Online [8].
Isto tako kalkulator omogućava rješavanje osnovnih računskih operacija, ali ne i traženje rješenja složenijih zadataka s više računskih operacija i primjenom pravila o slijedu računskih operacija, npr. ukoliko su zadane matrice

A=\left[\begin{array}{cc} {\begin{array}{c} {1} \\ {0} \\ {1} \end{array}} & {\begin{array}{c} {2} \\ {-2} \\ {0} \end{array}} \end{array}\right] i B=\left[\begin{array}{c} {\begin{array}{ccc} {2} & {0} & {-1} \end{array}} \\ {\begin{array}{ccc} {1} & {0} & {4} \end{array}} \end{array}\right]

i potrebno je izračunati \left(A\cdot B\right)^{T} +3B-2I u matričnom kalkulatoru posebno se računa umnožak matrica, zatim transponirana matrica umnoška i potom zbroj matrica \left(A\cdot B\right)^{T} +3B, a zatim se dobivenom rezultatu može oduzeti 2I. Množenje matrice skalarom isto tako nije dostupno.





4Zaključak

Reshish Matrix kalkulator je numerički alat koji omogućava izračunavanje osnovnih matričnih operacija i metoda koje se koriste za rješavanje sustava linearnih jednadžbi. Algoritam po kom' radi temelji se na Binet-Caushyevom teoremu i LU rastavu zbog čega je stabilan, a Cramerovo prvilo temeljeno na ovakvom računanju determinante je mnogo točnije u aritmetici pomičnog zareza. Prednosti ovog alata je dostupnost na mobilnim uređajima, te se lako može koristiti u nastavi kao jedan od načina oplemenjivanja nastave. Svaki korak koji je detaljno opisan prilikom rješavanja postavljenog problema uvelike može pomoći studentu prilikom vježbanja i pripremanja ispita.

Bibliografija
[1] Barnett, R. A., Ziegler, M. R., Byleen, K. E. Primijenjena matematika za poslovanje, ekonomiju, znanost o živom svijetu i humanističke znanosti, Mate d.o.o., Zagreb, 2006.
[2] Butković, D., Predavanja iz linearne algebre, Odjel za matematiku, Osijek, 2008.
[3] Chiang, A.C. Osnovne metode matematičke ekonomije, treće izdanje, Mate d.o.o., Zagreb, 1994.
[4] Divjak, B., Hunjak, T., Matematika za informatičare, TIVA tiskara, Varaždin, 2004.
[5] Halusek, V., Špoljarić, M., Matematika za stručni studij ekonomije, Visoka škola za menadžment u turizmu i informatici u Virovitici, Virovitica, 2012.
[6] Math Works, https://www.mathworks.com/discovery/computer-algebra-system.html (6.09.2018.)
[7] Matrix calculator, http://matrixcalc.org/en/}{http://matrixcalc.org/en/ (6.09.2018.)
[8] Octave Online, https://octave-online.net/}{https://octave-online.net/ (6.09.2018.)
[9] Reshish Matrix, http://matrix.reshish.com/}{http://matrix.reshish.com/ (4.03.2018.)
[10] Scitovski, R., Numerička matematika, Odjel za matematiku, Osijek, 2015.
 


 

Matrice s Fibonaccijevim brojevima

Blaženka Bakula,
Magistra edukacije matematike, zaposlena u Srednjoj školi A.B.Šimića, Grude, BiH, [email protected]
Zrinka Franušić
Docentica na PMF-Matematičkom odsjeku u Zagrebu, [email protected]
 

U prostranstvu cjelobrojnih nizova Fibonaccijev niz ne gubi svoj sjaj već više od osam stoljeća, točnije od kad se pojavio u knjizi Liber Abaci talijanskog matematičara Leonarda Bonaccija1 poznatog i kao Leonardo Pisano, a najpoznatijeg kao Fibonacci. Bez pretjerivanja, riječ je o jednom od najpoznatijih nizova koji privlači i fascinira kako profesionalce tako i potpune amatere. Nadalje, neprestano iznenađuje sa svojom prisutnošću u očekivanim, ali i potpuno neočekivanim situacijama. O Fibonaccijevim brojevima postoji vrlo velika količina informacija, mnoštvo publikacija, knjiga, te internetskih sadržaja. U ovom radu pokazat ćemo i dokazati neke zanimljive identitete vezane uz Fibonaccijeve brojeve koristeći jednostavnu algebru matrica i determinanti. Između ostalog, pokazujemo i poznati Cassinijev2 identitet koji se se može povezati s problemom popločavanja. Zbog mlađeg čitateljstva navest ćemo osnovna svojstva Fibonaccijevog niza, te osnovne pojmove iz linearne algebre.

1Fibonaccijevi brojevi

Fibonaccijev niz je niz brojeva

1,1,2,3,5,8,13,21,34,55,\ldots.

Niz bi s lakoćom nastavili članom 89 koji je zbroj prethodna dva. Iskažimo njegovu matematičku definiciju.

Definicija 1. Neka je F_{1}=1 i F_{2}=1. Niz (F_{n}) definiran rekurzivnom relacijom
(1)
F_{n}=F_{n-1}+F_{n-2},
za n\geq 3 naziva se Fibonaccijev niz. Član niza F_{n} zove se n-ti Fibonaccijev broj.

Napomenimo da se ponekad za početne vrijednosti niza uzimaju vrijednosti F_{0}=0 i F_{1}=1.

U već spomenutoj knjizi Liber Abaci taj niz predstavlja rješenje problema o razmnožavanju zečeva. Pretpostavimo da 1. siječnja raspolažemo s jednim parom zečeva. Taj par dobiva po jedan par mladih zečeva svakog prvog dana u mjesecu, počevši od 1. ožujka. Svaki novi par dobiva po jedan par zečeva svakog prvog dana u mjesecu, ali tek nakon navršena dva mjeseca života. Problem je koliko će parova zečeva biti nakon n mjeseci. Odgovor je upravo n-ti Fibonaccijev broj F_{n}.



Slika 1: Razmnožavanje zečeva (crveni zeko označava par novorođenih, a zeleni par star bar jedan mjesec)


Eksplicitno, Fibonaccijeve brojeve možemo izračunati pomoću formule

F_{n}=\frac{1}{\sqrt{5}}(\alpha^{n}-\beta^{n}),

pri čemu su \alpha i \beta korijeni takozvane zlatne jednadžbe

x^{2}-x-1=0,

to jest

\alpha=\frac{1+\sqrt{5}}{2},\ \beta=\frac{1-\sqrt{5}}{2}.

Konstanta \alpha poznatija je pod nazivom zlatni rez.

Uz Fibonaccijev niz često se veže i Lucasov3 niz (L_{n}) koji je definiran istom rekurzijom (1).

Definicija 2. Neka je L_{0}=2 i L_{1}=1. Niz (L_{n}) definiran rekurzivnom relacijom
(2)
L_{n}=L_{n-1}+L_{n-2},
za n\geq 2 naziva se Lucasov niz.

Predodžbe radi, prvih nekoliko članova Lucasova niza su

2,1,3, 4, 7, 11, 18, \ldots .

Eksplicitno ih računamo pomoću formule

L_{n}=\alpha^{n}+\beta^{n}.

Fibonaccijevi i Lucasovi brojevi zadovoljavaju različite algebarske identitete. Budući da su generirani rekurzivnim relacijama (1) i (2), prirodno je takve identitete dokazivati pomoću principa matematičke indukcije. Prisjetimo ga se. Ako je neka tvrdnja točna za broj 1 i ako iz pretpostavke da tvrdnja vrijedi za prirodni broj n slijedi da je ispravna i za sljedeći broj n+1, tada ona vrijedi za svaki prirodni broj n.

Kao primjer navodimo osnovnu relaciju koja povezuje Fibonaccijeve i Lucasove brojevi, to jest

(3)
L_{n}=F_{n-1}+F_{n+1},

za n\geq 1. Jednakost pokazujemo pomoću principa matematičke indukcije. Za n=1 jednakost vrijedi jer je

F_{0}+F_{2}=1=L_{1}.

Pretpostavimo sada da jednakost vrijedi za n=k, odnosno L_{k}=F_{k-1}+F_{k+1}. Za n=k+1 imamo

\begin{align*} F_{k}+F_{k+2}=&F_{k-1}+F_{k-2}+F_{k+1}+F_{k} =(F_{k-1} + F_{k+1} + (F_{k-2} + F_{k}) =L_{k}+L_{k-1} =L_{k+1}, \end{align*}

što je i trebalo pokazati.
U onom što slijedi pokazat ćemo kako možemo dokazati i izvesti još identiteta s Fibonaccijevim i Lucasovim brojevima koristeći elementarna svojstva matrica.



2Matrice i determinante reda 2

Matrica reda 2 je kvadratna shema koja se sastoji od 4 elementa posložena u 2 retka i 2 stupca. Simbolički ju zapisujemo kao

A=\left( \begin{array}{rr} a_{11} &a_{12} \\\ a_{21} &a_{22} \end{array} \right).

Elementi matrice a_{11}, a_{12}, a_{21}, a_{22} su najčešće realni brojevi, pa takvu matricu nazivamo realnom. Elementi matrice su indeksirani tako da nas upućuju na kojoj se poziciji u matrici nalaze. Tako se element a_{21} nalazi na presjeku drugog retka i prvog stupce. Na skupu svih matrica reda 2 jednostavno uvodimo dvije operacije, zbrajanje matrica i množenje matrica skalarom (realnim brojem). Te se operacije izvršavaju prirodno, 'po elementima'. Dakle,

A+B=\left( \begin{array}{rr} a_{11} &a_{12} \\\ a_{21} &a_{22} \end{array} \right)+\left( \begin{array}{rr} b_{11} &b_{12} \\\ b_{21} &b_{22} \end{array} \right)=\left( \begin{array}{rr} a_{11}+b_{11} &a_{12}+b_{12} \\\ a_{21}+b_{21} &a_{22}+b_{22} \end{array} \right),
\alpha\cdot A=\alpha\left( \begin{array}{rr} a_{11} &a_{12} \\\ a_{21} &a_{22} \end{array} \right)=\left( \begin{array}{rr} \alpha a_{11} &\alpha a_{12} \\\ \alpha a_{21} &\alpha a_{22} \end{array} \right).

Na primjer,

\left(\begin{array}{rr} 1 &2 \\\ 3 &4 \end{array} \right)+\left( \begin{array}{rr} -4 &-3 \\\ -2 &-1 \end{array} \right)=\left( \begin{array}{rr} -3 &-1 \\\ 1 &3 \end{array} \right),
3\left( \begin{array}{rr} 1 &2 \\\ -1 &0 \end{array} \right)=\left( \begin{array}{rr} 3 &6 \\\ -3 &0 \end{array} \right).

Množenje matrica ne ćemo definirati po analogiji i to je prilično neočekivano. Umnožak ili produkt dviju matrica definiramo na sljedeći način

A\cdot B=\left( \begin{array}{rr} a_{11} &a_{12} \\\ a_{21} &a_{22} \end{array} \right)\cdot\left( \begin{array}{rr} b_{11} &b_{12} \\\ b_{21} &b_{22} \end{array} \right)= \left(\begin{array}{rr} a_{11}b_{11}+a_{12}b_{21} &a_{11}b_{12}+a_{12}b_{22} \\\ a_{21}b_{11}+a_{22}b_{21} &a_{21}b_{12}+a_{22}b_{22} \end{array}\right).

Na primjer,

\left(\begin{array}{rr} 1 &2 \\\ 3 &4 \end{array} \right)\cdot\left( \begin{array}{rr} -4 &-3 \\\ -2 &-1 \end{array} \right)=\left( \begin{array}{rr} -8 &-5 \\\ -20 &-13 \end{array}\right).

Zbog ovakve 'neobične' definicije i množenje matrica imat će neka 'neobična' svojstva. Na primjer, općenito ne će vrijediti svojstvo komutativnosti.

Uz matricu reda 2 često vežemo i pojam determinante. To je broj koji pridružujemo matrici, a definiramo ga kao

\det A=|A|= a_{11} a_{22}-a_{12}a_{21}.

Zahvaljući 'neobično' definiranom množenju matrica vrijedit će sljedeće važno svojstvo, u matematici poznatije kao Binet-Cauchyjev teorem,

|A\cdot B|=|A|\cdot|B|.

Provjerimo to na gornjem primjeru,

\left|\begin{array}{rr} 1 &2 \\\ 3 &4 \end{array} \right|=-2,\ \left| \begin{array}{rr} -4 &-3 \\\ -2 &-1 \end{array} \right|= -2,\left| \begin{array}{rr} -8 &-5 \\\ -20 &-13 \end{array}\right|=4.


3Identiteti s Fibonaccijevim i Lucasovim brojevima

Matricu Q definirat ćemo kao

Q=\left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right).

Primijetimo da je determinanta matrice Q jednaka |Q| =-1. Nadalje, vrijedi

Q^{2}= \left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right) \left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right) = \left( \begin{array}{rr} 2 &1 \\\ 1 &1 \end{array} \right),
Q^{3}=\left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right) \left( \begin{array}{rr} 2 &1 \\\ 1 &1 \end{array} \right)= \left( \begin{array}{rr} 3 &2 \\\ 2 &1 \end{array} \right),
Q^{4}= \left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right) \left( \begin{array}{rr} 3 &2 \\\ 2 &1 \end{array} \right)=\left( \begin{array}{rr} 5 &3 \\\ 3 &2 \end{array} \right).

Uočimo da se u matricama Q^{2}, Q^{3}, Q^{4} pojavljuju Fibonaccijevi brojevi. Nije teško pretpostaviti kako će izgledati matrica Q^{n}.

Teorem 3. Neka je n\geq1. Tada
(4)
Q^{n}=\left( \begin{array}{rr} F_{n+1} &F_{n} \\\ F_{n} &F_{n-1} \end{array} \right).

Dokaz 4. Neka je n=1.
Q^{1}=\left( \begin{array}{rr} F_{2} &F_{1} \\\ F_{1} &F_{0} \end{array} \right)\left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right)=Q.
Pretpostavimo da (4) vrijedi za n=k\geq1. Želimo pokazati da (4) vrijedi za n=k+1. Zaista,
Q^{k+1}=Q^{k} Q^{1}=\left( \begin{array}{rr} F_{k+1} &F_{k} \\\ F_{k} &F_{k-1} \end{array} \right) \left( \begin{array}{rr} 1 &1 \\\ 1 &0 \end{array} \right)= \left( \begin{array}{rr} F_{k+1}+F_{k} &F_{k+1} \\\ F_{k} + F_{k-1} &F_{k} \end{array} \right) = \left( \begin{array}{rr} F_{k+2} &F_{k+1} \\\ F_{k+1} &F_{k} \end{array} \right).
Prema principu matematičke indukcije slijedi da formula (4) vrijedi za svaki n\in\mathbb{N}.


Pomoću Teorema 3 dokazujemo poznatu Cassinijevu formulu za Fibonaccijeve brojeve.

Korolar 5.[Cassinijeva formula] Neka je n\geq 1. Tada je
(5)
F_{n-1}F_{n+1}-F_{n}^{2}=(-1)^{n}.

Dokaz 6. Budući da je |Q| =-1, prema Binet-Cauchyjevom teoremu slijedi da je |Q^{n}| =(-1)^{n}. Iz Teorema 3 slijedi da je |Q^{n}|=F_{n-1}F_{n+1}-F_{n}^{2}, pa je
F_{n-1}F_{n+1}-F_{n}^{2}=(-1)^{n}.


Kombinatorni dokaz i interpretaciju jednakosti (5) dat ćemo u sljedećem poglavlju. Nadalje, kao posljedicu Teorema 3 imamo i sljedeće četiri jednakosti:

Korolar 7. Vrijedi
(6)
\begin{eqnarray} && F_{m+n+1}=F_{m+1}F_{n+1} +F_{m} F_{n},\\\ && F_{m+n}=F_{m+1} F_{n} + F_{m} F_{n-1},\\\ && F_{m+n}=F_{m} F_{n+1} + F_{m-1}F_{n},\\\ && F_{m+n-1}=F_{m} F_{n}+F_{m-1}F_{n-1} \end{eqnarray}
za sve m,n\geq1.

Dokaz 8. Budući da je Q^{m} Q^{n}=Q^{m+n}, imamo
\left( \begin{array}{rr} F_{m+1} &F_{m} \\\ F_{m} &F_{m-1} \end{array} \right) \left( \begin{array}{rr} F_{n+1} &F_{n} \\\ F_{n} &F_{n-1} \end{array} \right) = \left( \begin{array}{rr} F_{m+n+1} &F_{m+n} \\\ F_{m+n} &F_{m+n-1} \end{array} \right).
Množenjem matrica dobivamo
\left( \begin{array}{rr} F_{m+1}F_{n+1}+F_{m}F_{n} &F_{m+1}F_{n}+F_{m}F_{n-1} \\\ F_{m}F_{n+1}+F_{m-1}F_{n} &F_{m}F_{n}+F_{m-1}F_{n-1} \end{array} \right) = \left( \begin{array}{rr} F_{m+n+1} &F_{m+n} \\\ F_{m+n} &F_{m+n-1} \end{array} \right)
odkuda slijede tražene jednakosti.


Neka je m=n. Tada jednakost (6) daje formulu za računanje Fibonaccijevih brojeva s neparnim indeksom

F_{n}^{2} +F_{n+1}^{2} =F_{2n+1},

a jednakost (6) formulu za računanje Fibonaccijevih brojeva s parnim indeksom

F_{2n}=F_{n+1} F_{n} + F_{n} F_{n-1}=F_{n} (F_{n+1}+F_{n-1}),

odnosno

F_{2n}=F_{n}L_{n}.


Korolar 9. Vrijedi
F_{m+1}L_{n}+F_{m}L_{n-1}=L_{m+n}
za m\geq0, n\geq1. \end {cor}

Dokaz 10. Zbrajanjem jednakosti (6) i jednakosti F_{m+n-1} = F_{m+1}F_{n-1} + F_{m}F_{n-2} koju smo dobili zamjenom n s n-1 u (6), dobivamo
F_{m+1}(F_{n+1} + F_{n-1}) + F_{m}(F_{n} + F_{n-2}) = F_{m+n+1} + F_{m+n-1}.
Primjenom jednakosti (3) slijedi
F_{m+1}L_{n} + F_{m}L_{n-1} = L_{m+m},
što je i trebalo dokazati.


Evo još jedne jednakosti koji povezuje Fibonaccijeve i Lucasove brojeve.

Korolar 11. Vrijedi
(7)
2F_{m+n}=F_{m}L_{n}+F_{n}L_{m}
za m,\,n\geq0. \end {cor}

Dokaz 12. Zbrajanjem jednakosti (6) i (6) dobivamo
2F_{m+n}=F_{m}(F_{n-1}+ F_{n+1}) + F_{n} ( F_{m+1}+F_{m-1})=F_{m}L_{n}+F_{n}L_{m} .

Teorem 13. Vrijedi
Q^{n}\left( \begin{array}{rr} 1 &2 \\\ 2 &-1 \end{array} \right)=\left( \begin{array}{ll} L_{n+1} &L_{n} \\\ L_{n} &L_{n-1} \end{array} \right).

Dokaz 14.
Q^{n}\left( \begin{array}{rr} 1 &2 \\\ 2 &-1 \end{array} \right)= \left( \begin{array}{ll} F_{n+1} &F_{n} \\\ F_{n} &F_{n-1} \end{array} \right)\left( \begin{array}{rr} 1 &2 \\\ 2 &-1 \end{array} \right)=\left(\begin{array}{rr} F_{n+1}+2F_{n} &2F_{n+1}-F_{n} \\\ F_{n}+2F_{n-1} &2F_{n}-F_{n-1} \end{array} \right).
Primjenom jednakosti (3) dobivamo traženu jednakost. Na primjer,
F_{n+1}+2F_{n}=F_{n+1}+F_{n}+F_{n}=F_{n+2}+F_{n}=L_{n+1}.

Korolar 15. Vrijedi
(8)
L_{n-1}L_{n+1}-L_{n}^{2}=5(-1)^{n+1}.

Dokaz 16. Prema Teoremu 13 i Binet-Cauchyjevom teoremu slijedi
\left| \begin{array}{rr} F_{n+1} &F_{n} \\\ F_{n} &F_{n-1} \end{array} \right|\left| \begin{array}{rr} 1 &2 \\\ 2 &-1 \end{array} \right|=\left| \begin{array}{rr} L_{n+1} &L_{n} \\\ L_{n} &L_{n-1} \end{array} \right|.
Dakle
(F_{n+1}F_{n-1}-F_{n}^{2})(-5)=L_{n+1}L_{n-1}-L_{n}^{2},
pa primjenom Cassinijeve formule (5) dobivamo traženi identitet.

4Cassinijeva formula i domino

Na kraju dajemo još jednu zanimljivu interpretaciju Fibonaccijevih brojeva pomoću koje se može pokazati Cassinijeva formula (5). Radi se o popločavanju ploče dimenzije 2\times n pomoću domino pločica dimenzije 1\times 2 koje možemo postaviti vertikalno (crvena pločica) ili horizontalno (bijela pločica). Označimo s T_{n} broj načina na koji se može izvesti.


Slika 2: Popločavanje može započeti na točno ova dva načina (uokvireno plavo)


Budući da popločavanje možemo započeti ili s jednom vertikalno postavljenom pločicom ili s dvije horizontalno postavljene (vidi Sliku 2) slijedi da je
T_{n}=T_{n-1}+T_{n-2}.
Kako je T_{1}=1 i T_{2}=2, zaključujemo da je T_{n}=F_{n-1} jer imamo istu rekurziju kao za Fibonaccijeve brojeve, samo su početni (pa onda i svi ostali) članovi niza pomaknuti za jedno mjesto. Sada ćemo proučiti popločavanje dviju ploča istih dimenzija. Broj načina na koji možemo popločati te dvije ploče je T_{n}^{2}. Zbog jednostavnosti umjesto ploče dimenzije 2\times n koju popločavamo pločicama dimenzije 1\times 2 možemo promatrati ploču dimenzije 1\times n koju popločavamo pločicama dimenzije 1\times 1 i 1\times 2 (Slika 3). Uočimo da dva popločavanja na Slici 3 upravo odgovaraju dvama popločavanjima na Slici 2.


Slika 3: Popločavanje pločicama dimenzije 1\times 1 i 1\times 2


Slika 4: Pomaknute ploče dimenzije 1\times n s istaknutim crtama loma

Sada donju ploču pomaknimo za jedno mjesto udesno i pogledajmo na koliko mjesta možemo 'prelomiti' i gornju i donju ploču istovremeno, a da pritom ne lomimo domino pločice. Na primjeru sa Slike 4 to se može učiniti na točno 3 mjesta. Reći ćemo da u ovom slučaju imamo 3 crte loma. Posljednju crtu loma označili smo plavom bojom. Sada zamijenimo dijelove ploče ('repove') koje se nalaze s desnih strana plave crte (Slika 5). Na taj način se gornja ploča povećala za točno jedno mjesto, a donja smanjila za jedno. Uočimo da se broj crta loma se nije promijenio. Općenito možemo zaključiti da postoji bijekcija između skupa svih mogućih popločavanja dviju ploča iste dimenzije 1\times n i skupa svih mogućih popločavanja dviju ploča dimenzija 1\times (n+1) i 1\times (n-1) uz pretpostavku da su to popločavanja s barem jednom crtom loma.


Slika 5: Ploče dimenzije 1\times (n+1) i 1\times (n-1) nastale nakon zamjene 'repova'


Sada nam preostaje prebrojati načine popločavanja u kojima se ne pojavljuje prijelom. Ukoliko je n paran pojavit će se točno jedno takvo popločavanje dviju ploča iste dimenzije 1\times n, dok svako popločavanje dviju ploča dimenzija 1\times (n+1) i 1\times (n-1) uvijek ima crtu loma jer je broj polja na pločama neparan (pa u popločavanje moramo uključiti pločicu dimenzije 1\times 1). Točno obratno se dešava ako je n neparan (Slika 6, 7). Stoga smo opravdali formulu
T_{n}^{2}-T_{n-1}\cdot T_{n+1}=(-1)^{n},
što uz T_{n}=F_{n-1} upravo predstavlja Cassinijevu formulu (5).


Slika 6: Popločavanje ploča dimenzije 1\times n, n paran, koje nema crte loma


Slika 7: Popločavanje ploča dimenzije 1\times (n+1) i 1\times (n-1), n neparan, koje nema crte loma
Bibliografija
[1] B. Bakula, Fibonaccijeve matrice i determinante, diplomski rad, PMF - Matemački odsjek, Sveučilište u Zagrebu, 2013.
[2] A. Dujella, Fibonaccijevi brojevi, HMD, Zagreb, 2000.
[3] T. Koshy, Fibonacci and Lucas numbers with applications, John Wiley \& Sons, 2001.
[4] Cassini's Identity, dostupno na http://www.cut-the-knot.org/arithmetic/algebra/CassinisIdentity.shtml
[5] Fibonacci Tilings, dostupno na http://www.cut-the-knot.org/arithmetic/combinatorics/FibonacciTilings.sh...

 

Matrice traga nula

Marijana Kožul i Rajna Rajić


 

Rudarsko-geološko-naftni fakultet, Sveučilište u Zagrebu, Pierottijeva 6, Zagreb




Sažetak
U ovom radu dajemo prikaz osnovnih rezultata o kompleksnim kvadratnim matricama čiji trag je jednak nuli. Također karakteriziramo hermitske matrice traga nula i dajemo ocjene za njihove norme.

1Uvod

Neka je \mathbb{C}^{n} unitaran prostor snabdjeven skalarnim produktom

(x,y)=\sum_{i=1}^{n}x_{i}\overline{y}_{i},

gdje su x=(x_{1},\dots,x_{n}),y=(y_{1},\dots, y_{n})\in\mathbb{C}^{n}. Euklidska norma vektora x=(x_{1},\dots, x_{n})\in\mathbb{C}^{n} definira se kao

\Vert x\Vert =\sqrt{(x,x)}=\Big(\sum_{i=1}^{n}|x_{i}|^{2}\Big)^{\frac{1}{2}}.

Označimo s \mathbb{M}_{n}(\mathbb{C}) algebru svih kompleksnih kvadratnih matrica reda n. Poznato je da se algebra \mathbb{M}_{n}(\mathbb{C}), preko standardne ortonormirane baze (e_{1},\dots, e_{n}) prostora \mathbb{C}^{n}, poistovjećuje s algebrom B(\mathbb{C}^{n}) svih linearnih operatora koji djeluju na \mathbb{C}^{n}. Vektore prostora \mathbb{C}^{n} shvaćamo kao jednostupčane matrice.

Trag matrice A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}), u oznaci \textsf{tr}(A), definira se kao zbroj njezinih dijagonalnih elemenata

\textsf{tr}(A)=\sum_{i=1}^{n}a_{ii}.

Pokazuje se da je trag matrice jednak zbroju njezinih svojstvenih vrijednosti.
Preslikavanje A\mapsto \textsf{tr}(A) je linearan funkcional na prostoru \mathbb{M}_{n}(\mathbb{C}), tj. vrijedi

\textsf{tr}(\alpha A+\beta B)=\alpha\textsf{tr}(A)+\beta\textsf{tr}(B)

za sve A,B\in\mathbb{M}_{n}(\mathbb{C}) i sve \alpha,\beta\in\mathbb{C}. Također, za kompleksne kvadratne matrice A i B istoga reda vrijedi

\begin{align*} \textsf{tr}({A}{B})&=\textsf{tr}({B}{A}), \\\ \textsf{tr}(A^{T})&=\textsf{tr}(A), \\\ \textsf{tr}(A^{*})&=\overline{\textsf{tr}(A)} \end{align*}

gdje smo s A^{T} označili transponiranu, a s A^{*} adjungiranu matricu matrice A. Prostor \mathbb{M}_{n}(\mathbb{C}) je unitaran uz skalarni produkt definiran s

(A|B)=\textsf{tr}(B^{*}A) \quad (A,B\in\mathbb{M}_{n}(\mathbb{C})).

Ovako definiran skalarni produkt je ekvivalentan euklidskom skalarnom produktu na \mathbb{C}^{n\times n}.

U daljnjem ćemo hermitski dio kvadratne matrice A, tj. matricu \frac{1}{2}(A+A^{*}), po analogiji s kompleksnim brojevima označavati s \textsf{Re}(A). Prema tome, \textsf{Re}(A)=\frac{1}{2}(A+A^{*}). Oznaku \textsf{diag}(\lambda_{1},\dots,\lambda_{n}) koristit ćemo za dijagonalnu matricu reda n s elementima na glavnoj dijagonali \lambda_{1},\dots,\lambda_{n}. Sa \sigma(A) označavat ćemo spektar kvadratne matrice A.

Pozitivan drugi korijen pozitivno semidefinitne matrice A uvodimo koristeći spektralni račun. Neka je A={U}{D}{U}^{*}, gdje je D=\textsf{diag}(\lambda_{1},\dots,\lambda_{n}), spektralni rastav matrice A. Definiramo dijagonalnu matricu

D^{1/2}=\textsf{diag}(\lambda_{1}^{1/2},\dots,\lambda_{n}^{1/2}).

Tada je pozitivno semidefinitna matrica

A^{1/2}={U}{D}^{1/2}{U}^{*}

jedinstveno pozitivno semidefinitno rješenje jednadžbe X^{2}=A, koje nazivamo pozitivan drugi korijen matrice A. Apsolutnom vrijednošću matrice A, u oznaci |A|, nazivamo pozitivan drugi korijen matrice A^{*}A. Dakle, |A|=(A^{*}A)^{1/2}. Pokazuje se da za svaku kompleksnu kvadratnu matricu A reda n postoji unitarna matrica U reda n takva da je A=U|A|. Ovaj se rastav naziva polarni rastav matrice A (v. Teorem 3.7 iz [24]).

U ovom radu dat ćemo pregled osnovnih rezultata o kvadratnim matricama čiji trag je jednak nuli. Pokazat ćemo da je A matrica traga nula ako i samo ako je A komutator dviju matrica. Također, svaka je matrica traga nula unitarno slična matrici čija se dijagonala sastoji od samih nula. Posebno ćemo proučiti hermitske matrice traga nula; okarakterizirati ih, te dati ocjene za operatorsku normu takvih matrica.

Članak se temelji na diplomskom radu [18], koji se pak temelji na rezultatima koji se mogu naći u [1, 7, 8, 11, 15, 16, 24].

2Karakterizacije matrica traga nula

Budući da je trag linearan funkcional na vektorskom prostoru \mathbb{M}_{n}(\mathbb{C}), to je skup svih kvadratnih matrica reda n čiji je trag jednak nuli potprostor prostora \mathbb{M}_{n}(\mathbb{C}). Naime, ako su A,B\in\mathbb{M}_{n}(\mathbb{C}), te ako je \textsf{tr}(A)=\textsf{tr}(B)=0, tada je

\textsf{tr}(\alpha A+\beta B)=\alpha\textsf{tr}(A)+\beta\textsf{tr}(B)=0

za sve \alpha,\beta\in\mathbb{C}. Izračunat ćemo dimenziju tog potprostora.

Propozicija 1. Vektorski potprostor V\subseteq \mathbb{M}_{n}(\mathbb{C}) svih kompleksnih kvadratnih matrica reda n čiji je trag jednak nuli ima dimenziju \textsf{dim}\,V=n^{2}-1.

Dokaz.. Označimo s E_{ij},i,j=1,\dots,n, matrice reda n čiji je (i,j)-ti element jednak jedan, dok su svi ostali elementi nule. Neka je M_{i}=E_{ii}-E_{nn},i=1,\dots,n-1. Tada su matrice E_{ij},i,j=1,\dots,n, i\neq j, i matrice M_{i},i=1,\dots,n-1, elementi prostora V. Lako se provjeri da je ovih (n^{2}-n)+(n-1)=n^{2}-1 matrica linearno nezavisno. Nadalje, svaka se matrica A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}) čiji je trag jednak nuli može prikazati kao
A=\sum_{1\le i\neq j\le n}a_{ij}E_{ij}+\sum_{i=1}^{n-1}a_{ii}M_{i},
jer je \textsf{tr}(A)=0 ekvivalentno s a_{nn}=-\sum_{i=1}^{n-1}a_{ii}. Zaključujemo da je \textsf{dim}\,V=n^{2}-1 što se i tvrdilo.
\ \blacksquare

Primjer 2. Nilpotentna matrica, tj. matrica A\in\mathbb{M}_{n}(\mathbb{C}) takva da je A^{k}=0 za neki k\in\mathbb{N}, je primjer matrice traga nula, budući da su sve njezine svojstvene vrijednosti jednake nuli.

Primjer 3. Jedina pozitivno semidefinitna matrica traga nula je nul-matrica. Zaista, ako je trag pozitivno semidefinitne matrice jednak nuli, tada su sve njezine svojstvene vrijednosti jednake nuli. Prema tome, takva je matrica unitarno slična nul-matrici, dakle i sama je nul-matrica. Štoviše, ako je A={B}{C} umnožak dviju pozitivno semidefinitnih matrica B,C\in\mathbb{M}_{n}(\mathbb{C}), pri čemu je \textsf{tr}(A)=0, tada je A=0. Naime, kako je B=T^{*}T i C=S^{*}S za neke matrice T,S\in\mathbb{M}_{n}(\mathbb{C}) (v. Teorem 7.3 iz [24]), to vrijedi
\begin{align*} \textsf{tr}(A)&=\textsf{tr}({B}{C})\\\ &=\textsf{tr}(T^{*}{T}{S}^{*}S)\\\ &=\textsf{tr}({S}{T}^{*}{T}{S}^{*})\\\ &=\textsf{tr}\big(({T}{S}^{*})^{*}({T}{S}^{*})\big). \end{align*}
Ako je \textsf{tr}(A)=0, slijedi ({T}{S}^{*})^{*}({T}{S}^{*})=0 jer je matrica ({T}{S}^{*})^{*}({T}{S}^{*}) pozitivno semidefinitna. Stoga je {T}{S}^{*}=0 odakle pak dobivamo A={B}{C}=T^{*}{T}{S}^{*}S=0.

Napomenimo da je umnožak dviju hermitskih (odnosno pozitivno semidefinitnih) matrica hermitska (odnosno pozitivno semidefinitna) matrica ako i samo ako te matrice komutiraju (v. Korolar 10 iz [19]). Inače, proučavanje umnoška hermitske i pozitivno semidefinitne matrice je netrivijalno pitanje ([14, 21, 23]).

Definicija 4. Komutator kompleksnih kvadratnih matrica A i B reda n, u oznaci [A,B], je matrica koju definiramo formulom [A,B]:={A}{B}-{B}{A}.


Kako je \textsf{tr}({T}{S})=\textsf{tr}({S}{T}), komutatori su primjer matrica čiji je trag jednak nuli. Možemo se zapitati opisuje li to svojstvo u potpunosti komutatore, odnosno je li svaka matrica traga nula komutator dviju matrica. Uočimo najprije da je odgovor potvrdan za dijagonalnu matricu A= \textsf{diag}(\lambda_{1},\dots,\lambda_{n}) traga nula, budući da je jedan mogući izbor matrica T i S takvih da je A=[T,S] dan s

\begin{align*} T&=\begin{bmatrix} 0 &1 &0 &\ldots &0 &0 \\\ 0 &0 &1 &\ldots &0 &0\\\ 0 &0 &0 &\ldots &0 &0 \\\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots\\\ 0 &0 &0 &\ldots &0 &1\\\ 0 &0 &0 &\ldots &0 &0\\\ \end{bmatrix} \\\ S&=\begin{bmatrix} 0 &0 &0 &\ldots &0 &0\\\ \mu_{1} &0 &0 &\ldots &0 &0\\\ 0 &\mu_{2} &0 &\ldots &0 &0\\\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots\\\ 0 &0 &0 &\ldots &0 &0\\\ 0 &0 &0 &\ldots &\mu_{n-1} &0\\\ \end{bmatrix}, \end{align*}

gdje su \displaystyle\mu_{i}=\sum_{j=1}^{i}\lambda_{j},i=1,\dots,n-1.

Promotrimo sada matricu A=(a_{ij})\in\mathbb{M}_{n}(\mathbb{C}) traga nula, takvu da je a_{ii}=0,i=1,\dots,n. Izaberimo zatim matricu T=\textsf{diag} (t_{1},\dots, t_{n}), gdje su t_{1},\dots, t_{n} proizvoljni, ali međusobno različiti kompleksni brojevi. Neka je S=(s_{ij})\in\mathbb{M}_{n}(\mathbb{C}), gdje je

s_{ij}:=\frac{a_{ij}}{t_{i}-t_{j}}, \quad 1\le i\neq j\le n,

a s_{ii},i=1, \dots,n, su proizvoljni kompleksni brojevi. Lako se provjeri da je (i,j)-ti element matrice {T}{S}-{S}{T} jednak (t_{i}-t_{j})s_{ij}=a_{ij}, pa je prema tome A={T}{S}-{S}{T}. Time smo pokazali da je matrica čiji su svi dijagonalni elementi jednaki nuli komutator dviju matrica.

Primijetimo da je svojstvo "biti komutator" invarijanta sličnosti. Naime, ako je A=[T,S] za neke matrice T,S \in\mathbb{M}_{n}(\mathbb{C}), tada je

\begin{align*} R^{-1}{A}{R} &= R^{-1}({T}{S}-{S}{T})R\\\ &= (R^{-1}{T}{R})(R^{-1}{S}{R})-(R^{-1}{S}{R})(R^{-1}{T}{R})\\\ &= [R^{-1}{T}{R},R^{-1}{S}{R}] \end{align*}

za svaku regularnu matricu R\in\mathbb{M}_{n}(\mathbb{C}). Odavde slijedi da je i svaka matrica A koja je slična matrici čija se dijagonala sastoji od samih nula također komutator dviju matrica.

Kao primjer matrica traga nula naveli smo nilpotentne matrice. Prema teoremu o Schurovoj dekompoziciji (teorem 3.3 iz [24]) svaka je nilptotentna matrica unitarno slična matrici čija se dijagonala sastoji od samih nula, pa su stoga nilpotentne matrice komutatori dviju matrica. Pokazat ćemo sada da ovaj rezultat vrijedi i općenito, odnosno da je svaka matrica traga nula unitarno slična matrici čiji su svi dijagonalni elementi jednaki nuli. Dokaz ove tvrdnje je netrivijalan, a temelji se na svojstvu konveksnosti numeričke slike matrice.

Numerička slika, ili kako se još naziva polje vrijednosti, matrice A\in\mathbb{M}_{n}(\mathbb{C}) definira se kao skup

W(A)=\left\lbrace (Ax,x): x\in \mathbb{C}^{n}, \Vert x\Vert =1\right\rbrace .

Skup W(A) je kompaktan, jer je slika neprekidne funkcije x\mapsto (Ax,x) definirane na jediničnoj sferi \lbrace x\in\mathbb{C}^{n}:\, \Vert x\Vert =1\rbrace , koja je kompaktan skup. Također, za svaki \lambda \in \sigma (A) postoji jedinični vektor x \in \mathbb{C}^{n} za koji je Ax = \lambda x, odakle slijedi \lambda = (\lambda x,x) = (Ax,x) \in W(A). Prema tome, numerička slika matrice sadrži njezin spektar. Kao što smo već napomenuli, jedno od osnovnih svojstava numeričke slike matrice, koje je dovelo do mnogih interesantnih posljedica i korisnih primjena, je njezina konveksnost ([13, 22]). Više rezultata o numeričkoj slici matrice zainteresirani čitatelj može naći u [15].

Konveksnom kombinacijom elemenata x_{1},\dots,x_{n} nekog vektorskog prostora nazivamo svaki vektor oblika

t_{1}x_{1}+\dots +t_{n}x_{n},

pri čemu je t_{i}\geq 0 za i=1,\dots,n i t_{1}+\dots +t_{n}=1. Konveksan skup sadrži svaku konveksnu kombinaciju svojih elemenata (propozicija 11, str. 37 iz [19]). Kako je W(A) konveksan, te \sigma(A)\subseteq W(A), zaključujemo da skup W(A) sadrži sve konveksne kombinacije svojstvenih vrijednosti matrice A. Upravo na tom svojstvu zasniva se dokaz sljedeće tvrdnje o karakterizaciji matrica traga nula.

Teorem 5. Za A\in\mathbb{M}_{n}(\mathbb{C}) sljedeće tvrdnje su međusobno ekvivalentne:
(a) \textsf{tr}(A)=0;
(b) A je komutator dviju matrica;
(c) postoji unitarna matrica U\in\mathbb{M}_{n}(\mathbb{C}) takva da su svi dijagonalni elementi matrice U^{*}{A}{U} jednaki nuli.

Dokaz.. Tvrdnje (b)\Rightarrow(a) i (c)\Rightarrow(a) su očite.

(a)\Rightarrow(c) Tvrdnju da postoji unitarna matrica U\in\mathbb{M}_{n}(\mathbb{C}), takva da su svi dijagonalni elementi matrice U^{*}{A}{U} jednaki nuli, dokazujemo indukcijom po redu matrice n. Jasno je da tvrdnja vrijedi za n=1.

Prepostavimo sada da tvrdnja vrijedi za sve matrice reda n-1. Neka je \sigma(A)= \left\lbrace \lambda_{1}, \dots, \lambda_{n}\right\rbrace . Prema pretpostavci je
\frac{1}{n}\lambda_{1}+ \dots +\frac{1}{n}\lambda_{n}=\frac{1}{n}\,\textsf{tr}(A)=0,
tj. 0 je konveksna kombinacija svojstvenih vrijednosti matrice A, pa stoga 0\in W(A). Tada postoji x\in \mathbb{C}^{n}, \left\Vert x\right\Vert =1, takav da je (Ax,x)=0. Neka je W\in \mathbb{M}_{n}(\mathbb{C}) unitarna matrica čiji je prvi stupac vektor x; dakle We_{1}=x. Tada vrijedi
(W^{*}{A}{W}e_{1},e_{1})=({A}{W}e_{1},We_{1})=(Ax,x)=0,
pa je
W^{*}{A}{W} = \begin{bmatrix} 0 &u^{*}\\\ v &B\\\ \end{bmatrix},
gdje su u,v\in \mathbb{C}^{n-1},B \in\mathbb{M}_{n-1}(\mathbb{C}). Kako je
0=\textsf{tr}(A)=\textsf{tr}(W^{*}{A}{W})=0 + \textsf{tr}(B)= \textsf{tr}(B),
prema pretpostavci indukcije postoji unitarna matrica V_{1}\in \mathbb{M}_{n-1}(\mathbb{C}) takva da su svi dijagonalni elementi od V_{1}^{*}BV_{1} jednaki nuli. Definiramo U={W}{V}, gdje je
V= \begin{bmatrix} 1 &0\\\ 0 &V_{1}\\ \end{bmatrix}\in \mathbb{M}_{n}(\mathbb{C})
unitarna matrica. Tada je
\begin{align*} U^{*}{A}{U}&= ({W}{V})^{*}A({W}{V})= V^{*}(W^{*}{A}{W})V\\\ &=\begin{bmatrix} 1 &0\\\ 0&V_{1}^{*} \end{bmatrix} \begin{bmatrix} 0 &u^{*}\\\ v &B \end{bmatrix} \begin{bmatrix} 1 &0\\\ 0 &V_{1} \end{bmatrix}\\\ &=\begin{bmatrix} 0 &u^{*}V_{1}\\\ V_{1}^{*}v &V_{1}^{*}BV_{1} \end{bmatrix} \end{align*}
matrica čiji su svi dijagonalni elementi jednaki nuli.
(a)\Rightarrow(b) Pokazali smo da (a) povlači (c), a iz prijašnjih razmatranja jasno je da tada vrijedi i tvrdnja (b).
\ \blacksquare

Napomena 6. Pokazali smo da za matricu A čiji su svi dijagonalni elementi jednaki nuli postoje matrice T i S, pri čemu je T dijagonalna, pa stoga i normalna matrica, takve da je A=[T,S]. Štoviše, za svojstvene vrijednosti matrice T možemo izabrati bilo koje međusobno različite kompleksne brojeve. Prema prethodnom teoremu svaka je matrica A traga nula unitarno slična matrici čija se dijagonala sastoji od samih nula. Odavde zaključujemo da za svaku matricu A traga nula postoji rastav A=[T,S], gdje za T možemo izabrati normalnu matricu s proizvoljnim međusobno različitim svojstvenim vrijednostima.


Kao očitu posljedicu propozicije 1 i teorema 5 navodimo sljedeći rezultat.

Korolar 7. Skup svih komutatora dviju matrica reda n je vektorski potprostor od \mathbb{M}_{n}(\mathbb{C}) dimenzije n^{2}-1.

3Karakterizacije hermitskih matrica traga nula

Važnu klasu unutar komutatora čine samokomutatori, tj. hermitske matrice oblika [T^{*},T], gdje je T\in\mathbb{M}_{n}(\mathbb{C}).

Ako je A=[T^{*},T] samokomutator i U\in\mathbb{M}_{n}(\mathbb{C}) unitarna matrica, onda je

\begin{align} U^{*}{A}{U}&=U^{*}(T^{*}T-{T}{T}^{*})U\\\ &=(U^{*}T^{*}U)(U^{*}{T}{U})-(U^{*}{T}{U})(U^{*}T^{*}U)\\\ &=(U^{*}{T}{U})^{*}(U^{*}{T}{U})-(U^{*}{T}{U})(U^{*}{T}{U})^{*}\\\ &= [(U^{*}{T}{U})^{*},U^{*}{T}{U}], \end{align}

pa je U^{*}{A}{U} također samokomutator. Dakle, “biti samokomutator” je invarijanta unitarne sličnosti.

Ako je A samokomutator, onda je \textsf{tr}(A)=0. Pokazat ćemo da je svaka hermitska matrica, čiji je trag jednak nuli, samokomutator.

Teorem 8. Za hermitsku matricu A\in\mathbb{M}_{n}(\mathbb{C}) sljedeće tvrdnje su međusobno ekvivalentne:
(a) \textsf{tr}(A)=0;
(b) A je samokomutator.

Dokaz.. Tvrdnja (b)\Rightarrow(a) je očita.

(a)\Rightarrow(b) Kako je A hermitska matrica, to postoji unitarna matrica U\in\mathbb{M}_{n}(\mathbb{C}) tako da je D=U^{*}{A}{U}=\textsf{diag}(\lambda_{1},\dots,\lambda_{n}), gdje su \lambda_{i}\in \sigma(A), te \lambda_{1} \geq \lambda_{2} \geq \cdots \geq \lambda_{n}. Stavimo \mu_{i}=\sum_{j=1}^{i}\lambda_{j},i=1,\dots,n-1. Budući da je \textsf{tr}(A)=0, vrijedi \mu_{i} \geq0 za i=1,\dots,n-1. Neka je
T=\begin{bmatrix} 0 &0 &0 &\ldots &0 &0\\\ \sqrt{\mu_{1}}&0 &0 &\ldots &0 &0\\\ 0 &\sqrt{\mu_{2}}&0 &\ldots &0 &0\\\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots\\\ 0 &0 &0 &\ldots &0 &0\\\ 0 &0 &0 &\ldots &\sqrt{\mu_{n-1}} &0 \end{bmatrix} \in\mathbb{M}_{n}(\mathbb{C}).
Tada je
\begin{align*} T^{*}T-{T}{T}^{*}&=\textsf{diag}(\mu_{1},\mu_{2}-\mu_{1},\mu_{3}-\mu_{2},\dots,\mu_{n-1}-\mu_{n-2},- \mu_{n-1})\\\ &=\textsf{diag}(\lambda_{1},\lambda_{2},\lambda_{3},\dots,\lambda_{n-1},\lambda_{n})\\\ &=D, \end{align*}
tj. D je samokomutator. Stoga je i A=U{D}{U}^{*} također samokomutator.
\ \blacksquare


U nastavku ćemo dati još neke interesantne karakterizacije hermitskih matrica traga nula.

Teorem 9. Za hermitsku matricu A\in\mathbb{M}_{n}(\mathbb{C}) sljedeće tvrdnje su međusobno ekvivalentne:
(a) \textsf{tr}(A)=0;
(b) A=P-{U}{P}{U}^{*}, gdje je P\in\mathbb{M}_{n}(\mathbb{C}) pozitivno semidefinitna matrica i U\in\mathbb{M}_{n}(\mathbb{C}) unitarna matrica;
(c) A=\textsf{Re}(N), gdje je N\in\mathbb{M}_{n}(\mathbb{C}) nilpotentna matrica.

Dokaz.. Tvrdnja (b)\Rightarrow(a) je očita.

(a)\Rightarrow(b) Prema teoremu 8 postoji T\in\mathbb{M}_{n}(\mathbb{C}) tako da je A=T^{*}T-{T}{T}^{*}. Neka je T=U|T| polarni rastav matrice T. Tada je {T}{T}^{*}=U|T|^{2}{U}^{*}, pa je A=|T|^{2}-{U}|T|^{2}U^{*}, gdje je P=|T|^{2} pozitivno semidefinitna matrica.

(c)\Rightarrow(a) Kako je \textsf{tr}(N)=0, vrijedi
\textsf{tr}(A)=\textsf{tr}(\textsf{Re}(N))=\frac{1}{2}\big(\textsf{tr}(N)+\textsf{tr}(N^{*})\big)= \frac{1}{2}\big(\textsf{tr}(N)+\overline{\textsf{tr}(N)}\big)=0.

(a)\Rightarrow(c) Kako je \textsf{tr}(A)=0 to je, prema teoremu  5, A=U^{*}{B}{U} gdje je U\in\mathbb{M}_{n}(\mathbb{C}) unitarna matrica, a B\in\mathbb{M}_{n}(\mathbb{C}) (hermitska) matrica s nulama na glavnoj dijagonali. Matrica B može se zapisati kao zbroj B=\frac{1}{2}(M+M^{*}), pri čemu je M gornja trokutasta matrica s nulama na glavnoj dijagonali, pa je prema tome M nilpotenta matrica. Tada je N=U^{*}{M}{U} nilpotentna matrica, te vrijedi A=U^{*}{B}{U}=\frac{1}{2}(N+N^{*})=\textsf{Re}(N).
\ \blacksquare

4Ocjene za norme samokomutatora



Na \mathbb{M}_{n}(\mathbb{C}) uvodi se matrična (operatorska) norma inducirana euklidskom normom na \mathbb{C}^{n};

\left\Vert A\right\Vert = \displaystyle\max_{\left\Vert x\right\Vert =1} \left\Vert Ax\right\Vert \quad (A\in\mathbb{M}_{n}(\mathbb{C})).

Ovako definirana matrična norma je submultiplikativna, tj.

\Vert {A}{B}\Vert \le \Vert A\Vert \,\Vert B\Vert \quad (A,B\in\mathbb{M}_{n}(\mathbb{C})),

te unitarno invarijantna, tj.

\Vert {U}{A}{V}\Vert =\Vert A\Vert

za sve unitarne matrice U,V\in\mathbb{M}_{n}(\mathbb{C}). Također vrijedi

\Vert A^{*}\Vert =\Vert A\Vert , \quad \Vert A^{*}A\Vert =\Vert A\Vert ^{2}.

Ako je matrica A normalna, onda je

\Vert A\Vert =\max\lbrace |\lambda|:\,\lambda\in\sigma(A)\rbrace .

U ovoj točki dat ćemo gornju i donju ocjenu za matrične norme samokomutatora. Uočimo, za samokomutator A=[T^{*},T] vrijedi ocjena

\left\Vert A\right\Vert =\Vert T^{*}T-{T}{T}^{*}\Vert \leq \left\Vert T^{*}T\right\Vert + \left\Vert {T}{T}^{*}\right\Vert =2\left\Vert T\right\Vert ^{2}.

Međutim, ovaj pristup ne daje nam dobru gornju ocjenu. Fong [8] je dokazao da se konstanta 2 u gornjoj ocjeni može zamijeniti konstantom 1.

Teorem 10. Ako je A=[T^{*},T], onda je \Vert A\Vert \leq \Vert T\Vert ^{2}.

Dokaz.. Kako je matrica A hermitska, to prema teorem 8.8 iz [24] postoji jedinični vektor x takav da (Ax,x)=\left\Vert A\right\Vert , ili postoji jedinični vektor y takav da (Ay,y)=-\left\Vert A\right\Vert . U prvom slučaju imamo
\left\Vert T\right\Vert ^{2}\geq\left\Vert Tx\right\Vert ^{2}=(Tx,Tx)=(T^{*}Tx,x) =({T}{T}^{*}x,x)+(Ax,x)\geq \left\Vert A\right\Vert ,
dok je u drugom slučaju
\begin{array}{rcl} \left\Vert T\right\Vert ^{2}&=&\left\Vert T^{*}\right\Vert ^{2}\geq \left\Vert T^{*}y\right\Vert ^{2}=(T^{*}y,T^{*}y)=({T}{T}^{*}y,y)\\ &=&(T^{*}Ty,y)-(Ay,y)\geq \left\Vert A\right\Vert . \end{array}
Time je teorem dokazan.
\ \blacksquare


Za donju ocjenu norme samokomutatora koristit ćemo nejednakost

(1)
\Vert A+B\Vert \leq \max\lbrace \Vert A\Vert ,\Vert B\Vert \rbrace +\Vert A^{1/2}B^{1/2}\Vert

koja vrijedi za svake dvije pozitivno semidefinitne matrice A,B\in\mathbb{M}_{n}(\mathbb{C}), a čiji se dokaz može pronaći u [17].

Teorem 11. Ako je A=[T^{*},T], onda je \left\Vert A\right\Vert \geq \left\Vert T\right\Vert ^{2}-\left\Vert T^{2}\right\Vert \geq 0.

Dokaz.. Neka je T=U|T| polarni rastav matrice T. Budući da su matrice |T| i U|T|U^{*} pozitivno semidefinitne, prema (1) vrijedi
\begin{align*} \left\Vert T^{*}T+{T}{T}^{*}\right\Vert &=\left\Vert \,|T|^{2}+ U|T|^{2}U^{*}\right\Vert \\\ &= \left\Vert \,|T|^{2}+ (U|T|U^{*})^{2}\right\Vert \\\ &\leq \max\left\lbrace \left\Vert \,|T|^{2}\right\Vert , \left\Vert (U|T|U^{*})^{2}\right\Vert \right\rbrace + \left\Vert \,|T|U|T|U^{*}\right\Vert \\\ &= \left\Vert \,|T|^{2}\right\Vert + \left\Vert U|T|U|T|U^{*}U\right\Vert \\\ &= \left\Vert T^{*}T\right\Vert +\left\Vert U|T|U|T|\right\Vert \\\ &= \left\Vert T\right\Vert ^{2}+\left\Vert T^{2}\right\Vert . \end{align*}
Odavde slijedi
\begin{align*} \left\Vert A\right\Vert &=\left\Vert T^{*}T-{T}{T}^{*}\right\Vert \\\ &=\left\Vert T^{*}T + {T}{T}^{*}- 2{T}{T}^{*}\right\Vert \\\ &\geq 2\left\Vert {T}{T}^{*}\right\Vert -\left\Vert T^{*}T + {T}{T}^{*}\right\Vert \\\ &\geq 2\left\Vert T\right\Vert ^{2}-\big(\left\Vert T\right\Vert ^{2}+\left\Vert T^{2}\right\Vert \big)\\\ &= \left\Vert T\right\Vert ^{2}- \left\Vert T^{2}\right\Vert , \end{align*}
što se i tvrdilo.
\ \blacksquare

Napomena 12. (a) Primijetimo da za normalnu matricu T imamo A=[T^{*},T]=T^{*}T-{T}{T}^{*}=0, pa teorem 11 kaže da vrijedi \Vert T\Vert ^{2}=\Vert T^{2}\Vert , što je dobro poznata činjenica (v. vidi str. 178 iz [11]).

(b) Ocjene dane teoremima 1011 su oštre. Zaista, za nilpotentnu matricu T čiji je indeks nilpotentnosti dva, postižu se jednakosti
\Vert T\Vert ^{2}-\Vert T^{2}\Vert =\Vert T^{*}T-{T}{T}^{*}\Vert =\Vert T\Vert ^{2}.

5Generalizacije

Pojam traga ne može se općenito definirati za operatore koji djeluju na beskonačno-dimenzionalnim prostorima. Ipak, prirodno se zapitati mogu li se rezultati o karakterizaciji komutatora i samokomutatora generalizirati i za takve operatore. Puno je zanimljivih radova napisano na tu temu (v. [2, 3, 4, 5, 6, 9, 10, 12, 20]). Jedna od značajnih karakterizacija komutatora može se naći u [4, 12], gdje je pokazano da je ograničen linearan operator A koji djeluje na beskonačno-dimenzionalnom Hilbertovom prostoru H komutator dvaju operatora ako i samo ako A nije kompaktna perturbacija (različitog od nule) skalarnog operatora, tj. ako A nije oblika K+\lambda I, gdje je \lambda\in\mathbb{C}\setminus\lbrace 0\rbrace ,K kompaktan operator na H, a I jedinični operator na H. (Ograničen linearan operator K na Hilbertovom prostoru H je kompaktan ako i samo ako za svaki ograničen niz (x_{n}) u H, niz (Kx_{n}) u H ima konvergentan podniz.) Također su važne karakterizacije komutatora na beskonačno-dimenzionalnom Hilbertovom prostoru dobivene u terminima njegove esencijalne numeričke slike, odnosno nul-dijagonalnih operatora ([2, 5, 6, 20]).

Bibliografija
[1] A. A. Albert, B. Muckenhoupt, On matrices of trace zero, Michigan Math. J. 4 (1957), 1–3.
[2] J. H. Anderson, Derivations, commutators, and the essential numerical range, Thesis, Indiana University, 1971.
[3] J. H. Anderson, J. G. Stampfli, Commutators and compressions, Israel J. Math. 10 (1971), 433–441.
[4] A. Brown, C. Pearcy, Structure of commutators of operators, Ann. of Math. 82 (1965), 112–127.
[5] P. Fan, On the diagonal of an operator, Trans. Amer. Math. Soc. 283 (1) (1984), 239–251.
[6] P. Fan, C.-K. Fong, Which operators are the self-commutators of compact operators?, Proc. Amer. Math. Soc. 80 (1) (1980), 58–60.
[7] P. A. Fillmore, C. K. Fong, A. R. Sourour, Real parts of quasi-nilpotent operators, Proc. Edinb. Math. Soc. 22 (1979), 263–269.
[8] C. K. Fong, Norm estimates related to self-commutators, Linear Algebra Appl. 74 (1986), 151–156.
[9] P. R. Halmos, Commutators of operators, Amer. J. Math. 74 (1952), 237–240.
[10] P. R. Halmos, Commutators of operators II, Amer. J. Math. 76 (1954), 191–198.
[11] P. R. Halmos, Finite-Dimensional Vector Spaces, Springer-Verlag, New York, 1974.
[12] P. R. Halmos, A glimpse into Hilbert space, Lectures on Modern Mathematics, Vol. I, Wiley, New York, 1963.
[13] F. Hausdorff, Das Wertvorrat einer Bilinearform, Math. Zeit. 3 (1919), 314–316.
[14] Y. Hong, R. A. Horn, The Jordan canonical form of a product of a Hermitian and a positive semidefinite matrix, Linear Algebra Appl. 147 (1991), 373–386.
[15] R. A. Horn, C. R. Johnson, Topics in Matrix Analysis, Cambridge University Press, Cambridge, 1991.
[16] F. Kittaneh, Commutator inequalities associated with the polar decomposition, Proc. Amer. Math. Soc. 130 (5) (2001), 1279–1283.
[17] F. Kittaneh, Norm inequalities for certain operator sums, J. Funct. Anal. 143 (1997), 337–348.
[18] M. Kožul, Hermitske matrice, diplomski rad, PMF-Matematički odsjek, Sveučilište u Zagrebu, 2013.
[19] S. Kurepa, Funkcionalna analiza. Elementi teorije operatora, Školska knjiga, Zagreb, 1990.
[20] H. Radjavi, Structure of A^{*}A-{A}{A}^{*}, J. Math. Mech. 16 (1) (1966), 19–26.
[21] W. Rehder, On the product of self-adjoint operators, Internat. J. Math. & Math. Sci. 5 (4) (1982), 813–816.
[22] O. Toeplitz, Das algebraische Analogon zu einem Satze von Fejér, Math. Zeit. 2 (1918), 187–197.
[23] P. Y. Wu, Products of positive semidefinite matrices, Linear Algebra Appl. 111 (1988), 53–61.
[24] F. Zhang, Mathrix Theory. Basic Results and Techniques, 2nd edition, Springer-Verlag, New York, 2011.
 

 

Pseudospektar matrica

 

Ivica Nakić
PMF-Matematički odsjek
Sveučilište u Zagrebu
[email protected]
Mihael Petrić
[email protected]

 
Sažetak
Pojam svojstvenih vrijednosti i spektra matrice odavno se istražuje i koristi u matematici. Svojstvene vrijednosti matrica u mnogim slučajevima daju izvrstan uvid u svojstva samih matrica, no katkada ne daju dovoljno informacija za rješavanje problema na koje se može naići. Takvi se slučajevi pojavljuju u raznim granama matematike kao npr. teorije operatora i teorije Markovljevih lanaca i ostalih znanosti, od populacijske ekologije, preko laserske tehnologije, kvantne mehanike i hidrodinamike.

Katkada se preciznije informacije o matrici mogu dobiti korištenjem pseudospektra te je cilj ovog članka dati čitatelju osnovne informacije o ovom zanimljivom poopćenju pojma spektra.

U ovom će članku biti navedeni osnovni pojmovi vezani uz pseudospektar, ekvivalentne definicije pseudospektra, odnos prema običnom spektru matrica, kao i neka osnovna svojstva.



1Definicije pseudospektra

Promatrano u okvirima primijenjene matematike pitanje „Je li \textbf{A} singularna matrica?” često nema puno smisla. Naime, proizvoljno mala perturbacija matrice može promijeniti odgovor na to pitanje iz pozitivnog u negativan. Budući da se pitanje „Je li \lambda svojstvena vrijednost matrice \textbf{A}?” može ekvivalentno postaviti u obliku „Je li \lambda-\textbf{A} singularna matrica?”, i ovdje nailazimo na isti problem.

Stoga je potrebno preformulirati ovo pitanje tako da uzmemo u obzir osjetljivost na perturbacije. Do pogodne formulacije dolazimo na osnovi sljedeće činjenice: što je matrica \textbf{A} bliža singularnoj matrici, to je matrica \textbf{A}^{-1} veća, u smislu da je norma te matrice veći broj.

Dakle, možemo postaviti pitanje „Je li \Vert \textbf{A}^{-1}\Vert velika?”.

Ako je odgovor da, onda je matrica jako blizu nekoj singularnoj matrici, te je za praktične svrhe možemo smatrati singularnom. Obrnuto, ako je odgovor ne, matrica će i uz male smetnje ostati regularnom.

Ako ovo rezoniranje primijenimo na problem svojstvenih vrijednosti, dolazimo do zaključka da bi od interesa mogli biti oni brojevi z za koje \Vert (z-\textbf{A})^{-1}\Vert ima veliku vrijednost.

Ovim slijedom razmišljanja dolazimo do prve definicije pseudospektra.

Definicija 1. (1. definicija pseudospektra) Neka je \textbf{A}\in\mathbb{C}^{N \times N} i \varepsilon\gt 0 proizvoljan. \varepsilon-pseudospektar \sigma_{\varepsilon}(\textbf{A}) matrice \textbf{A} u normi \Vert \cdot \Vert definiran je s
(1)
\sigma_{\varepsilon} = \lbrace z \in \mathbb{C} : \Vert (z-\textbf{A})^{-1}\Vert \gt \varepsilon^{-1} \rbrace .


Važno je uočiti da ova definicija ovisi o izboru norme \Vert \cdot \Vert, te se stoga katkada govoti o 2–pseudospektru, 1–pseudospektru i \infty–pseudospektru, ako je pripadna norma 2–norma, 1–norma, odnosno \infty–norma.

Mi ćemo se najčešće koristiti spektralnom 2-normom u oznaci \Vert \cdot\Vert _{2}.

Matricu (z-\textbf{A})^{-1} zovemo rezolventom matrice \textbf{A}.

U (1), kao i u ostatku rada, podrazumijevamo da vrijedi:
(2)
\Vert (z-\textbf{A})^{-1}\Vert =\infty \quad \text{za} \quad z\in\sigma(\textbf{A}),
gdje \sigma(\textbf{A}) predstavlja spektar matrice \textbf{A}.

Odavde slijedi da je \varepsilon-pseudospektar podskup kompleksne ravnine koji uvijek sadržava spektar pripadne matrice, i to za svaki \varepsilon\gt 0. Ako definiramo funkciju f(z):= \Vert (z-\textbf{A})^{-1} \Vert i iskoristimo činjenicu da je \Vert \cdot \Vert neprekidna funkcija, lako se zaključuje da je \varepsilon-pseudospektar otvoren skup kao praslika otvorenog skupa po neprekidnoj funkciji:
\sigma_{\varepsilon}(\textbf{A})=f^{-1} ( \langle \varepsilon^{-1} , \infty ] ).

Drugim riječima, \varepsilon-pseudospektar matrice otvoren je podskup kompleksne ravnine omeđen s \varepsilon^{-1} nivo krivuljom norme rezolvente matrice.

Intuitivno možemo pretpostaviti da je \Vert (z-\textbf{A})^{-1}\Vert velika upravo onda kada je točka z veoma blizu svojstvenoj vrijednosti matrice \textbf{A}. No, kao što ćemo poslije i demonstrirati, točnost naše intuicije ovisi o izboru matrične norme i normalnosti same matrice. Kod normalnih matrica, kada je \Vert \cdot\Vert =\Vert \cdot\Vert _{2}, \Vert (z-\textbf{A})^{-1}\Vert velika točno onda kada je točka z blizu svojstvenoj vrijednosti matrice \textbf{A} (vidi Sliku 2). Važnost pseudospektra dolazi do izražaja kod matrica koje nemaju svojstvo normalnosti, a za koje norma \Vert (z-\textbf{A})^{-1}\Vert može biti velika čak i kada je točka z daleko od spektra matrice (vidi Sliku 2).

Neka je \textbf{A} matrica s potpunim skupom svojstvenih vektora \lbrace \textbf{v}_{j} \rbrace, \textbf{V} neka je N \times N matrica čiji je j-ti stupac vektor \textbf{v}_{j} i \Lambda dijagonalna N \times \mathbb{N} matrica s j-tom svojstvenom vrijednošću \lambda_{j} na j-tom mjestu dijagonale. Znamo da tada matricu \textbf{A} možemo zapisati kao
\textbf{A} = \textbf{V} \Lambda \textbf{V}^{-1}.
\varepsilon-pseudospektar će biti od važnosti kod matrica za koje je
(3)
\Vert \textbf{V} \Vert \Vert \textbf{V}^{-1} \Vert \gg 1,
uz odabranu normu \Vert \cdot \Vert.
Slika 1: \varepsilon-pseudospektar matrice u 2-normi. Različito obojene linije predstavljaju granice pseudospektra za različite vrijednosti \varepsilon. Lijeva slika prikazuje pseudospektar normalne matrice, a desna pseudospektar matrice koja nema svojstvo normalnosti.

Slika 2: 3D prikaz pseudospektra matrice. Na z-osi nalazi se norma rezolvente matrice kao funkcija od z \in \mathbb{C}. Vidimo da je ona velika za brojeve blizu svojstvenim vrijednostima matrice.
Primijenimo li na matricu proizvoljno malu perturbaciju i tada gledamo spektar novodobivene matrice, dolazimo do alternativne definicije pseudospektra.

Definicija 2. (2. definicija pseudospektra) \sigma_{\varepsilon}(\textbf{A}) u normi \Vert \cdot \Vert je skup svih z\in\mathbb{C} takvih da vrijedi
(4)
z\in\sigma(\textbf{A}+\textbf{E})
za neku matricu \textbf{E}\in\mathbb{C}^{N \times N} pri čemu je \Vert \textbf{E} \Vert \lt \varepsilon.

Drugim riječima, \varepsilonpseudospektar je skup brojeva koji su svojstvene vrijednosti neke perturbirane matrice\textbf{A}+\textbf{E} gdje je \Vert \textbf{E} \Vert \lt \varepsilon.}

Iz ove definicije očito slijedi da za pseudospektre vezane uz raličite \varepsilon vrijedi
(5)
\sigma_{\varepsilon_{1}}\subseteq\sigma_{\varepsilon_{2}}, \quad 0\lt \varepsilon_{1}\leq\varepsilon_{2},
te također da je presjek svih mogućih pseudospektara matrice upravo spektar matrice \textbf{A},
(6)
\bigcap_{\varepsilon\gt 0}\sigma_{\varepsilon}(\textbf{A})=\sigma(\textbf{A})

Definicija 3. (3. definicija pseudospektra) \sigma_{\varepsilon}(\textbf{A}) u normi \Vert \cdot \Vert je skup svih z\in\mathbb{C} t.d.
(7)
\Vert (z-\textbf{A})\textbf{v}\Vert \lt \varepsilon
za neki \textbf{v}\in\mathbb{C}^{N} pri čemu je \Vert \textbf{v}\Vert =1.

Broj z u (7) zovemo \varepsilon-pseudo svojstvena vrijednost matrice \textbf{A}, a \textbf{v} zovemo odgovarajući \varepsilon-pseudo svojstveni vektor. Drugim riječima, \varepsilon-pseudospektar je skup svih \varepsilon-pseudo svojstvenih vrijednosti.

Slika 3 prikazuje 50 \times 50 Basor-Morrisonovu matricu i ilustrira ekvivalenciju prve i treće definicije pseudospektra za matricu koja nije normalna. Na lijevoj slici vidimo granice \varepsilon-pseudospektra za različite \varepsilon, a na desnoj svojstvene vrijednosti 100 slučajno perturbiranih matrica. Očito je da su svojstvene vrijednosti matrice iznimno osjetljive na perturbacije, a ovaj primjer također lijepo prikazuje moguću geometrijsku strukturu matrica u kompleksnoj ravnini koja isprva nije vidljiva iz samog spektra matrice.
Slika 3: Pseudospektar 50\times50 Basor-Morrisonove matrice. Lijeva slika prikazuje svojstvene vrijednosti matrice (točke) i granice 2-norme \varepsilon-pseudospektra za \varepsilon=10^{-1},10^{-1.5},10^{-2},10^{-2.5},10^{-3}. Desna slika prikazuje pozicije svojstvenih vrijednosti 100 slučajno perturbiranih matrica \textbf{A+E}, gdje svaka matrica \textbf{E} ima nezavisne normalno distribuirane kompleksne vrijednosti i vrijedi \Vert \textbf{E}\Vert =10^{-1}. Kada bi u obzir bile uzete sve moguće perturbacije uz \Vert \textbf{E}\Vert \lt \varepsilon^{-1}, točke bi ispunile cijelo područje omeđeno najvećom granicom 2-norme s lijeve slike.


Slijedi teorem koji dokazuje da su ove tri definicije pseudospektra zaista ekvivalentne.

Teorem 4. (Ekvivalencija definicija pseudospektra) Tri gore navedene definicije pseudospektra su ekvivalentne za proizvoljnu matricu \textbf{A} \in \mathbb{C}^{N \times N}.

Dokaz. Ako je z\in\sigma(\textbf{A}) ekvivalencija je očita, pa ćemo pretpostaviti da z\not \in \sigma(\textbf{A}), što povlači da (z-\textbf{A})^{-1} zaista postoji.

Da bismo dokazali (4)\Rightarrow(7), pretpostavimo da vrijedi (\textbf{A}+\textbf{E})\textbf{v}=z\textbf{v} za neki \textbf{E}\in\mathbb{C}^{N \times N} s \Vert \textbf{E}\Vert \lt \varepsilon i \textbf{v}\neq0, \textbf{v}\in\mathbb{C}^{N} (možemo pretpostaviti da je vektor \textbf{v} normaliziran, \Vert \textbf{v}\Vert =1). Tada vrijedi
\Vert (z-\textbf{A})\textbf{v}\Vert =\Vert \textbf{E}\textbf{v}\Vert \lt \varepsilon,
što je i trebalo dokazati.
Da bismo dokazali (7)\Rightarrow(1), pretpostavimo da vrijedi (z-\textbf{A})\textbf{v}=s\textbf{u} za neke \textbf{v},\textbf{u}\in\mathbb{C}^{N} takve da \Vert \textbf{v}\Vert =\Vert \textbf{u}\Vert =1 i 0\lt s\lt \varepsilon. Tada je (z-\textbf{A})^{-1}\textbf{u}=s^{-1}\textbf{v} te s jedne strane vrijedi
\Vert (z - \textbf{A})^{-1} \textbf{u} \Vert \leq \Vert (z - \textbf{A})^{-1}\Vert \, \Vert \textbf{u} \Vert = \Vert (z - \textbf{A})^{-1}\Vert ,
a s druge strane imamo
(8)
\Vert (z - \textbf{A})^{-1} \textbf{u} \Vert =\Vert s^{-1} \textbf{v} \Vert = s^{-1}.
Stoga
\Vert (z - \textbf{A})^{-1}\Vert \geq s^{-1} \gt \varepsilon^{-1}.

Da bismo dokazali (1)\Rightarrow(4), pretpostavimo da je \Vert (z-\textbf{A})^{-1}\Vert \gt \varepsilon^{-1}. Tada postoje \textbf{u,v} \in \mathbb{C}^{N}, \Vert \textbf{u}\Vert =\Vert \textbf{v}\Vert =1 i 0\lt s\lt \varepsilon takvi da vrijedi
(z - \textbf{A})^{-1}\textbf{u}= s^{-1}\textbf{v},
iz čega slijedi
s\textbf{u}=(z-\textbf{A})\textbf{v} =z \textbf{v} - \textbf{Av}.
Želimo pokazati da je z \in \sigma (\textbf{A}+ \textbf{E}) za neku matricu \Vert \textbf{E}\Vert \le \varepsilon. Za to je dovoljno pokazati da postoji matrica \textbf{E} \in \mathbb{C}^{N \times N} takva da vrijedi \Vert \textbf{E}\Vert \le s i \textbf{E}\textbf{v} = s\textbf{u}. Naime, ako takva matrica postoji, tada je \textbf{v} svojstveni vektor matrice \textbf{A}+\textbf{E} s pripadnom svojstvenom vrijednošću z:
(\textbf{A}+ \textbf{E}) \textbf{v} = z \textbf{v}, \quad \Vert \textbf{E}\Vert \le \varepsilon.
Pokazat ćemo da za \textbf{E} možemo uzeti matricu ranga 1 oblika \textbf{E}=s\textbf{u}\textbf{w}^{\ast} za neki \textbf{w}\in\mathbb{C}^{N} t.d. \textbf{w}^{\ast}\textbf{v}=1.

Ako je \Vert \cdot\Vert =\Vert \cdot\Vert _{2} tvrdnja je očita uzimanjem \textbf{w}=\textbf{v}.

U slučaju neke druge norme \Vert \cdot\Vert, možemo se poslužiti korolarom Hahn–Banachova teorema (vidi npr. [5, str. 60.]) koji garantira postojanje linearnog funkcionala \textbf{L} na \mathbb{C}^{N} za koji vrijedi \Vert \textbf{L}(\textbf{v})\Vert =1 i \Vert \textbf{L}\Vert =1. Budući da su svi linearni funkcionali na \mathbb{C}^{N} oblika \textbf{F}(\textbf{x})=\textbf{y}^{\ast}\textbf{x} za neki \textbf{y}, znači da postoji vektor \textbf{w} takav da vrijedi \textbf{L}(\textbf{x})=\textbf{w}^{\ast}\textbf{x}. Sada iz
\Vert \textbf{E}\textbf{x}\Vert =s\Vert \textbf{u}\textbf{w}^{\ast}\textbf{x}\Vert =s\Vert \textbf{u}\Vert |\textbf{L}(\textbf{x})|\le s\Vert \textbf{x}\Vert \text{ za svaki } \textbf{x}
i
\textbf{E}\textbf{v} =s \textbf{u}\textbf{w}^{\ast}\textbf{v}=s\textbf{u}\textbf{L}(\textbf{v}) =s \textbf{u}
slijedi da \textbf{w} ima tražena svojstva.
\ \blacksquare


Prisjetimo se da su singularne vrijednosti matrice \textbf{A} svojstvene vrijednosti matrice \sqrt{\textbf{A}^{\ast}\textbf{A}}. Lako se vidi da u slučaju 2–norme vrijedi
(9)
\Vert (z-\textbf{A})^{-1}\Vert _{2}=[s_{\min}(z-\textbf{A})]^{-1} \quad \text{i} \quad \Vert (z-\textbf{A})\Vert _{2}=[s_{\max}(z-\textbf{A})],
gdje s_{\min}(z-\textbf{A}) predstavlja najmanju, a s_{\max}(z-\textbf{A}) najveću singularnu vrijednost matrice z-\textbf{A}. Ovime dolazimo do četvrte i posljednje definicije pseudospektra u ovom radu.

Definicija 5.(4. definicija pseudospektra) Za \Vert \cdot\Vert =\Vert \cdot\Vert _{2}, \sigma_{\varepsilon}(\textbf{A}) je skup svih z\in\mathbb{C} takvih da vrijedi
(10)
s_{\min}(z-\textbf{A})\lt \varepsilon.

Iz (9) je očito da je (10) ekvivalentno s (1), a samim time i s ostalim definicijama pseudospektra prema teoremu 4. U dokazu teorema 4 imali smo matricu \textbf{E}=s\textbf{u}\textbf{v}^{\ast} ranga 1. Sada s možemo smatrati najmanjom singularnom vrijednošću, a \textbf{u} i \textbf{v} pripadnim lijevim, odnosno desnim singularnim vektorom matrice z-\textbf{A}.

2Pseudospektar normalnih matrica

Za početak primijetimo da ako je \textbf{U} unitarna matrica (\textbf{U}^{\ast}=\textbf{U}^{-1}), tada vrijedi
(11)
(z-\textbf{UAU}^{\ast})^{-1}=[\textbf{U}(z-\textbf{A})\textbf{U}^{\ast}]^{-1}=\textbf{U}(z-\textbf{A})^{-1}\textbf{U}^{\ast}
te zbog toga vrijedi i
\Vert (z-\textbf{UAU}^{\ast})^{-1}\Vert _{2} = \Vert (z-\textbf{A})^{-1}\Vert _{2}, \quad \forall z \in \mathbb{C}.
To povlači da je norma rezolvente invarijantna na unitarno slične transformacije, te da isto pravilo vrijedi i za pseudospektar:
(12)
\sigma_{\varepsilon}(\textbf{A})=\sigma_{\varepsilon}(\textbf{UAU}^{\ast}), \quad \forall\varepsilon\geq 0.

Definicija 6. Matrica \textbf{A} \in \mathbb{C}^{N \times N} je normalna ako ima potpun skup ortogonalnih svojstvenih vektora tj. ako je unitarno dijagonalizabilna:
(13)
\textbf{A} = \textbf{U} \Lambda \textbf{U}^{\ast},
gdje je \textbf{U} unitarna matrica, a \Lambda dijagonalna matrica sa svojstvenim vrijednostima na dijagonali.

Napomena 7. Ekvivalentna definicija kaže da je matrica \textbf{A} \in \mathbb{C}^{N \times N} normalna ako vrijedi \textbf{AA}^{\ast}=\textbf{A}^{\ast}\textbf{A}.


Dakle, normalna matrica je matrica koja ima posebno svojstvo da postoji unitarna transformacija koja je transformira u dijagonalnu matricu. Za normalnu matricu, \varepsilon-pseudospektar je zapravo unija otvorenih \varepsilon-kugli oko točaka spektra matrice (vidi sliku 1). Tada norma rezolvente zadovoljava:
(14)
\Vert (z-\textbf{A})^{-1}\Vert _{2}=\frac{1}{\text{dist}(z,\sigma(\textbf{A}))},
gdje \text{dist}(z,\sigma(\textbf{A})) predstavlja uobičajenu udaljenost točke z od skupa \sigma(\textbf{A}) u kompleksnoj ravnini.

Prije nego što iskažemo idući teorem, objasnit ćemo notaciju kojom ćemo se koristiti. Otvorenu \varepsilon-kuglu označavat ćemo s
(15)
\Delta_{\varepsilon}= \lbrace z \in \mathbb{C} : |z|\lt \varepsilon \rbrace .
Suma dvaju skupova imat će uobičajeno značenje te će vrijediti:
\sigma(\textbf{A})+\Delta_{\varepsilon} = \lbrace z : z_{1} + z_{2}, z_{1} \in \sigma(\textbf{A}), z_{2} \in \Delta_{\varepsilon} \rbrace = \lbrace z: \text{dist}(z,\sigma(\textbf{A}))\lt \varepsilon \rbrace .


Teorem 8.(Pseudospektar normalnih matrica) Za bilo koju matricu \textbf{A} \in \mathbb{C}^{N \times N} vrijedi
(16)
\sigma_{\varepsilon}(\textbf{A})\supseteq \sigma(\textbf{A})+\Delta_{\varepsilon}, \quad \forall\varepsilon\gt 0,
a ako je \textbf{A} normalna i \Vert \cdot\Vert =\Vert \cdot\Vert _{2}, tada je
(17)
\sigma_{\varepsilon}(\textbf{A}) = \sigma(\textbf{A})+\Delta_{\varepsilon}, \quad \forall\varepsilon\gt 0.
Obratno, ako je \Vert \cdot\Vert =\Vert \cdot\Vert _{2}, tada (17) povlači da je \textbf{A} normalna matrica.

Dokaz. Ako je z svojstvena vrijednost matrice \textbf{A}, tada je i z+\delta svojstvena vrijednost od \textbf{A}+\delta\textbf{I} za \forall\delta\in\mathbb{C}. Budući da je \Vert \delta\textbf{I}\Vert =|\delta|, (16) vrijedi. Za dokazivanje (17) primijetimo da ako je \textbf{A} normalna, možemo bez smanjenja općenitosti pretpostaviti da je i dijagonalna. Pretpostavka neće imati nikakvog utjecaja na norme ako je \Vert \cdot\Vert =\Vert \cdot\Vert _{2}. Dijagonalni elementi matrice \textbf{A} tada su jednaki svojstvenim vrijednostima \lambda_{j}. Tada je i rezolventa dijagonalna matrica te zbog toga vrijedi (14). Definicija 1 pseudospektra tada povlači (17).

Za dokaz obrata definirajmo najprije skup \tau_{\varepsilon} (\textbf{A})= \lbrace z \in \mathbb{C} : \Vert (\textbf{A} - z)^{-1} \Vert _{2} ^{-1} \lt \varepsilon \rbrace. Tada znamo da vrijedi
(18)
\tau_{\varepsilon} (\textbf{A})= \sigma (\textbf{A}) + \Delta_{\varepsilon} = \lbrace z \in \mathbb{C} : \text{dist} (z, \sigma(\textbf{A})) \lt \varepsilon \rbrace , \quad \forall \varepsilon \gt 0.
Također vrijedi
\bigcap_{n \in \mathbb{N}} \tau_{\varepsilon + \frac{1}{n}} = \bigcap_{n \in \mathbb{N}} \sigma(\textbf{A})+ \Delta_{\varepsilon + \frac{1}{n}}.
Lako se vidi da vrijedi
\bigcap_{n \in \mathbb{N}} \tau_{\varepsilon + \frac{1}{n}} = \lbrace z \in \mathbb{C} : \Vert (\textbf{A}-z)^{-1} \Vert _{2} ^{-1} \leq \varepsilon \rbrace
te
\bigcap_{n \in \mathbb{N}} \sigma(\textbf{A})+ \Delta_{\varepsilon + \frac{1}{n}} = \lbrace z \in \mathbb{C} : \text{dist} (z, \sigma(\textbf{A}))\leq \varepsilon \rbrace .
Stoga vrijedi i
\tau_{\varepsilon} ^{c} \, \bigcap \, \bigg( \bigcap_{n \in \mathbb{N}} \tau_{\varepsilon + \frac{1}{n}} \bigg) = (\sigma(\textbf{A}) + \Delta_{\varepsilon})^{c} \, \bigcap \, \bigg( \bigcap_{n \in \mathbb{N}} \sigma(\textbf{A}) + \Delta_{\varepsilon + \frac{1}{n}} \bigg),
što se može zapisati i kao
(19)
\lbrace z \in \mathbb{C} : \Vert (\textbf{A} - z)^{-1} \Vert _{2} ^{-1} = \varepsilon \rbrace = \lbrace z \in \mathbb{C} : \text{dist} (z, \sigma(\textbf{A})) = \varepsilon \rbrace \quad \forall \varepsilon \gt 0.
Neka je \text{A}=\textbf{ULU}^{\ast} Schurova dekompozicija matrice \textbf{A}, gdje je \textbf{L} donjetrokutasta matrica ([4]). Tada su dijagonalni elementi matrice \textbf{L} svojstvene vrijednosti od \textbf{A}, te vrijedi (\textbf{A} - z)^{-1} = (\textbf{ULU}^{\ast} - z)^{-1} = (\textbf{U} (\textbf{L} - z) \textbf{U}^{\ast})^{-1} = \textbf{U} (\textbf{L}-z)^{-1} \textbf{U}^{\ast} te stoga vrijedi i
(20)
\Vert (\textbf{A}-z)^{-1} \Vert _{2} = \Vert (\textbf{L}-z)^{-1} \Vert _{2}.
Ako pokažemo da je \textbf{L} = [ \varphi_{i j } ] dijagonalna matrica, onda smo gotovi jer je tada očito \textbf{A} normalna matrica.

Odaberemo proizvoljan i_{0} \in \lbrace 1, \ldots , N \rbrace te neke z \in \mathbb{C} i \varepsilon \gt 0 takve da \min_{i} | \varphi_{ii} - z | = | \varphi_{i_{0} i_{0}} - z | = \varepsilon. To znači da vrijedi \text{dist} (z, \sigma(\textbf{A})) = \varepsilon, te stoga po pretpostavci vrijedi \Vert (\textbf{A} - z)^{-1} \Vert _{2} ^{-1} = \varepsilon, tj.
(21)
\Vert (\textbf{L} - z)^{-1} \Vert _{2} = \frac{1}{\varepsilon}.
Izračunajmo sada \Vert (\textbf{L}-z)^{-1} \Vert _{2}. Znamo da vrijedi \Vert (\textbf{L} - z)^{-1} \Vert _{2} = \lambda_{\max} [ (\textbf{L}-z)^{-1} (\textbf{L}-z)^{-\ast} ], a kako je
\textbf{L}-z = \left[ \begin{array}{cccc} \varphi_{11} - z & 0 & \ldots & 0 \\ \varphi_{12} & \varphi_{22}-z & \ddots & 0 \\ \vdots & \vdots & \ddots & 0\\ \varphi_{1n} & \varphi_{2n} & \cdots & \varphi_{nn}-z \end{array} \right],
lako je vidjeti da je inverz matrice \textbf{L} - z ponovno donjetrokutasta matrica oblika
(22)
(\textbf{L}-z)^{-1} = \left[ \begin{array}{cccc} (\varphi_{11} - z)^{-1} & 0 & \ldots & 0 \\ * & (\varphi_{22}-z)^{-1} & \ddots & 0 \\ \vdots & \vdots & \ddots & 0\\ * & * & \cdots & (\varphi_{nn}-z)^{-1} \end{array} \right].

Nadalje, (\textbf{L}-z)^{-1} (\textbf{L}-z)^{-\ast} je hermitska matrica, što povlači \sigma(\textbf{A}) \geq \text{diag} ( (\textbf{L}-z)^{-1} (\textbf{L}-z)^{-\ast} ) ([4]). Stoga
\begin{align*} \Vert ( \textbf{L}-z)^{-1} \Vert _{2} ^{2} & \geq \max_{i} \bigg( ( \textbf{L}-z)^{-1} (\textbf{L}-z)^{-\ast} \bigg)_{ii} \\ & = \max_{i} \bigg(\sum_{j=1} ^{i-1} \left| \big((\textbf{L}-z)^{-1} \big)_{ij} \right|^{2} + \left| \varphi_{ii}-z \right|^{-2} \bigg) \\ & \geq | \varphi_{i_{0} i_{0}} |^{-2} + \sum_{j=1} ^{i_{0} - 1} \left| \big((\textbf{L}-z)^{-1}\big)_{i_{0} j} \right|^{2} \\ & = \frac{1}{\varepsilon^{2}} +\sum_{j=1} ^{i_{0} -1} \left| \big( (\textbf{L}-z)^{-1}\big)_{i_{0} j} \right|^{2}. \end{align*}
Budući da je \Vert (\textbf{L}-z)^{-1} \Vert _{2} ^{2} = \frac{1}{\varepsilon^{2}}, slijedi da je ((\textbf{L}-z)^{-1})_{i_{0} j}=0 za j=1, \ldots , i_{0}-1. Budući da je i_{0} bio proizvoljno odabran, slijedi da je (\textbf{L}-z)^{-1} dijagonalna matrica, što povlači da je \textbf{L} dijagonalna matrica te smo dokazali tvrdnju.

\ \blacksquare



3Svojstva pseudospektra

Pretpostavimo da je matrica \textbf{A} dijagonalizabilna, ali ne nužno i normalna. Neka \textbf{V} \in \mathbb{C}^{N \times N} predstavlja matricu svojstvenih vrijednosti matrice \textbf{A}, pri čemu vrijedi:
\textbf{A}=\textbf{V}\Lambda \textbf{V}^{-1},
gdje je \Lambda dijagonalna N \times N matrica sa svojstvenim vrijednostima \lambda_{j} na dijagonali. Ako je \Vert \cdot \Vert =\Vert \cdot \Vert _{2}, onda je kondicijski broj ove baze svojstvenih vektora dan s
(23)
\kappa (\textbf{V}) \equiv \Vert \textbf{V}\Vert _{2} \Vert \textbf{V}^{-1} \Vert _{2} = \frac{s_{\max}(\textbf{V})}{s_{\min}(\textbf{V})},
pri čemu su s_{\max}(\textbf{V}) i s_{\min}(\textbf{V}) najveća i najmanja singularna vrijednost matrice \textbf{V}. Budući da matrica \textbf{V} nije jedinstvena, \kappa (\textbf{V}) nije jedinstveno definiran za danu matricu \textbf{A}. No, ako su sve svojstvene vrijednosti matrice \textbf{A} različite, \kappa (\textbf{V}) postaje jedinstven ako normaliziramo svojstvene vektore (\Vert \textbf{v}_{j}\Vert =1).

Općenito, za \kappa (\textbf{V}) vrijedi 1 \leq \kappa (\textbf{V}) \lt \infty, a \kappa (\textbf{V})=1 ako i samo ako je matrica \textbf{A} normalna. Kondicija matrice \textbf{V} daje nam gornju granicu za kondicije pojedinačnih svojstvenih vrijednosti matrice \textbf{A}. Ovime dolazimo do Bauer-Fikeova teorema.

Teorem 9.(Bauer-Fikeov teorem) Neka je \textbf{A} \in \mathbb{C}^{N \times N} dijagonalizabilna matrica, \textbf{A}=\textbf{V}\Lambda \textbf{V}^{-1}. Tada, uz \Vert \cdot \Vert =\Vert \cdot \Vert _{2},\forall \varepsilon \gt 0 vrijedi
(24)
\sigma(\textbf{A}) + \Delta_{\varepsilon} \subseteq \sigma_{\varepsilon} (\textbf{A}) \subseteq \sigma(\textbf{A}) + \Delta_{\varepsilon\kappa(\textbf{V})}.

Dokaz. Prva inkluzija je dokazana u (16). Za dokazivanje druge inkluzije u tvrdnji teorema računamo:
(z-\textbf{A})^{-1}= (z- \textbf{V}\Lambda \textbf{V}^{-1})^{-1}=[\textbf{V}(z-\Lambda)\textbf{V}^{-1}]^{-1}= \textbf{V}(z-\Lambda)^{-1}\textbf{V}^{-1},

što povlači
\Vert (z-\textbf{A})^{-1}\Vert _{2} \leq \kappa (\textbf{V}) \Vert (z-\Lambda)^{-1}\Vert _{2} = \frac{\kappa(\textbf{V})}{\text{dist}(z,\sigma (\textbf{A}))}.
Sada dokaz slijedi iz definicije 1.
\ \blacksquare


Sljedeći teorem navodi neka od osnovnih svojstava pseudospektra.

Teorem 10. (Svojstva pseudospektra) Neka je \textbf{A} \in \mathbb{C}^{N \times N} i \varepsilon \gt 0 proizvoljan.
(1) \sigma_{\varepsilon}(\textbf{A}) je neprazan, otvoren i ograničen skup, s najviše N komponenti povezanosti, od kojih svaka komponenta sadržava jednu ili više svojstvenih vrijednosti.
(2) Ako je \Vert \cdot \Vert =\Vert \cdot \Vert _{2}, tada \sigma_{\varepsilon}(\textbf{A}^{\ast}) = \overline{\sigma_{\varepsilon}(\textbf{A})}.
(3) Ako je \Vert \cdot \Vert =\Vert \cdot \Vert _{2}, tada \sigma_{\varepsilon} (\textbf{A}_{1} \oplus \textbf{A}_{2}) = \sigma_{\varepsilon}(\textbf{A}_{1}) \cup \sigma_{\varepsilon}(\textbf{A}_{2}).
(4) Za proizvoljan c \in \mathbb{C} vrijedi \sigma_{\varepsilon}(\textbf{A}+c)=c+\sigma_{\varepsilon}(\textbf{A}).
(5) Za proizvoljan c \in \mathbb{C}, c\neq0 vrijedi \sigma_{|c|\varepsilon}(c\textbf{A})=c\sigma_{\varepsilon} (\textbf{A}).

U dijelu (iii), \textbf{A}_{1} \oplus \textbf{A}_{2} predstavlja direktnu sumu dviju kvadratnih matrica. Pri tome matrice ne moraju biti istih dimenzija, a njihova direktna suma je blok dijagonalna matrica
\textbf{A}_{1} \oplus \textbf{A}_{2} = \begin{bmatrix} \textbf{A}_{1} & \textbf{0} \\ \textbf{0} & \textbf{A}_{2} \end{bmatrix}.

Prije nego što započnemo s dokazom teorema, navest ćemo važan rezultat o subharmoničnosti rezolvente kojima ćemo se koristiti u samom dokazu.

Definicija 11.([1)] Neka je U otvoren podskup od \mathbb{C} i f:U \rightarrow \mathbb{R} neprekidna funkcija. Kažemo da je f subharmonička funkcija na U ako za svaku zatvorenu kuglu \overline{K}(a,r) \subset U sa središtem u a i radijusa r vrijedi
f(a) \leq \frac{1}{2 \pi} \int_{0} ^{2 \pi} f(a+re^{i \theta})d\theta.

Teorem 12.([1], princip maksimuma) Ako je S ograničen podskup od \mathbb{C} i f : \overline{S} \rightarrow \mathbb{R} neprekidna funkcija koja je subharmonička na S, tada je
(25)
\sup f(S) = \sup f(\partial S).

Teorem 13.([3]) Ako je f holomorfna funkcija na S, tada je \Vert f(\cdot) \Vert subharmonička funkcija na S. Slijedi da \Vert f(\cdot) \Vert može imati maksimum na skupu S samo ako je konstantne vrijednosti na cijelom skupu S.

Korolar 14.([1]) Norma rezolvente \Vert (z-\textbf{A})^{-1} \Vert je subharmonička funkcija za z \not \in \sigma (\textbf{A}), što povlači da zadovoljava princip maksimuma. Također vrijedi
(26)
\Vert (z-\textbf{A})^{-1} \Vert \geq \frac{1}{\text{dist}(z,\sigma(\textbf{A}))}.

Dokaz teorema 10. Dokazi tvrdnji (ii), (iii) i (iv) su jednostavni pa ih nećemo navoditi.

(i)

Nepraznost, otvorenost i ograničenost skupa \sigma_{\varepsilon} (\textbf{A}) već smo dokazali. Preostaje nam pokazati da se \sigma_{\varepsilon} (\textbf{A}) sastoji od najviše N komponenti povezanosti, od kojih svaka sadržava jednu ili više svojstvenih vrijednosti. Koristit ćemo se gore navedenim rezultatom.

Pretpostavimo da unutar neke komponente povezanosti nema svojstvenih vrijednosti. Tada je rezolventa holomorfna na tom skupu te je norma rezolvente subharmonička funkcija. Po principu maksimuma, supremum te funkcije dostiže se na rubu te komponente povezanosti. No u našem je slučaju rub podskup skupa \lbrace z : \Vert (\textbf{A}-z)^{-1} \Vert = \frac{1}{\varepsilon} \rbrace te stoga dolazimo do kontradikcije s činjenicom da je komponenta povezanosti podskup skupa \lbrace z : \Vert (\textbf{A}-z)^{-1} \Vert \gt \frac{1}{\varepsilon} \rbrace.

Ovime smo tvrdnju dokazali za ograničene komponente povezanosti. Neograničenih komponenti povezanosti uopće ni nema, budući da \Vert (\textbf{A}-z)^{-1}\Vert \rightarrow 0 kad |z| \rightarrow \infty, te stoga zaključujemo da nema komponenti povezanosti koje ne sadržavaju barem jednu svojstvenu vrijednost matrice \textbf{A}. Budući da \textbf{A} ima najviše N različitih svojstvenih vrijednosti, komponenti povezanosti također može biti najviše N.

(v)

Pretpostavimo da je z \in \sigma_{|c|\varepsilon}(c\textbf{A}). Tvrdnja je očigledna ako je c=0 ili \varepsilon = 0. Stoga, uz c \neq 0 i \varepsilon \neq 0, definicija 1 pseudospektra povlači da je
(| c | \varepsilon)^{-1}\lt \Vert (z - c\textbf{A})^{-1} \Vert = | c |^{-1} \Vert (\frac{z}{c} - \textbf{A})^{-1} \Vert .
Sada je jasno da je \frac{z}{c} \in \sigma_{\varepsilon} (\textbf{A}), odnosno z \in c \sigma_{\varepsilon} (\textbf{A}), što je i trebalo pokazati.
\ \blacksquare

4Primjeri

Promatrat ćemo tridijagonalnu Toeplitzovu matricu
(27)
\textbf{A} = \begin{bmatrix} 0 & 1 && \\ \frac{1}{4} & 0 & 1 && \\ & \ddots & \ddots & \ddots & \\ && \frac{1}{4} & 0 & 1\\ &&& \frac{1}{4} & 0\end{bmatrix} \in \mathbb{C}^{N \times N}.
Iako je ova matrica nesimetrična, možemo je svesti na simetričan oblik sljedećom transformacijom
(28)
\textbf{DAD}^{-1}=\textbf{S},
gdje je \textbf{D}= \text{diag}(2,4,...,2^{N}) i
(29)
\textbf{S} = \begin{bmatrix} 0 & \frac{1}{2} && \\ \frac{1}{2} & 0 & \frac{1}{2} && \\ & \ddots & \ddots & \ddots & \\ && \frac{1}{2} & 0 & \frac{1}{2}\\ &&& \frac{1}{2} & 0 \end{bmatrix} \in \mathbb{C}^{N \times N}.
Matrice \textbf{A} i \textbf{S} imaju iste svojstvene vrijednosti te se može izračunati da se spektar matrice \textbf{A} sastoji od N različitih svojstvenih vrijednosti iz intervala \langle -1,1\rangle
(30)
\lambda_{k} ( \textbf{A} )= \lambda_{k} ( \textbf{S} ) = \cos \frac{k \pi}{N+1}, \quad 1\leq k \leq N.
S druge strane, pseudospektar matrice \textbf{A} znatno odudara od realne osi za različite vrijednosti \varepsilon. Slika 4 prikazuje granice \sigma_{\varepsilon}(\textbf{A}) za \varepsilon=10^{-2},10^{-3},...,10^{-8} uz \Vert \cdot \Vert = \Vert \cdot \Vert _{2} i otkriva široka ovalna područja pseudospektra u kompleksnoj ravnini. \varepsilon-pseudospektar zapravo je približno jednak području koje omeđuje elipsa koja je slika kružnice |z|=\varepsilon^{1/N} pri preslikavanju
(31)
f(z)=z^{-1}+\frac{1}{4}z.
Slika 5 prikazuje svojstvene vrijednosti 100 slučajno perturbiranih matrica \textbf{A+E}, pri čemu vrijedi \Vert \textbf{E} \Vert =10^{-3} uz \Vert \cdot \Vert = \Vert \cdot \Vert _{2}. Veza s elipsama ponovno je jasno vidljiva.
Slika 4: Granice \varepsilon-pseudospektra \sigma_{\varepsilon} (\textbf{A}) u 2-normi za \varepsilon=10^{-2},10^{-3},...,10^{-8} matrice (27) dimenzije N=64. Svojstvene vrijednosti matrice prikazane su crnim točkama.
Slika 5: Pozicije svojstvenih vrijednosti 100 matrica \textbf{A+E}, gdje je \textbf{A} tridijagonalna Toeplitzova matrica (27) dimenzije N=64, a svaka \textbf{E} je slučajna matrica uz \Vert \textbf{E} \Vert = 10^{-3}. Svojstvene vrijednosti matrice \textbf{A} su realne, ali perturbacije inducirane matricom \textbf{E} ih pomiču u kompleksnu ravninu, blizu elipse definirane s (31) uz |z|=0.001^{1/64}. Ponovno je \Vert \cdot \Vert = \Vert \cdot \Vert _{2}.


5Povijesni pregled i literatura

Slučajevi u kojima svojstvene vrijednosti i spektar matrice ne daju zadovoljavajuće odgovore na postavljena pitanja usko su vezani uz matrice koje nemaju svojstvo normalnosti. Potrebu za istraživanjem pseudospektra prepoznao je von Neumann još u 1930–ima, no zbog teškoća s velikim brojem složenih računskih operacija i nedovoljnog stupnja razvijenosti računala koja bi ih mogla izvesti, pojam pseudospektra nije zaživio sve do druge polovine 20. stoljeća. Tako na potrebu za istraživanjem pseudospektra ponovno upućuju Varah 1967. i 1979. ([12] i [11]), Landau 1975. ([6]) i Godunov 1982. ([2]). Prvi rad potpuno posvećen pseudospektru pod nazivom „Pseudospectra of matrices” napisao je Trefethen 1992. godine ([9]). U tom je radu iznio osnovnu teoriju pseudospektra popraćenu s 13 primjera. Trefethen nastavlja istraživanje pseudospektra te nekoliko godina poslije izdaje i rad „Pseudospectra of Linear Operators” ([8]) kojim produbljuje teoriju iza ideje pseudospektra i proširuje područje njegove primjene. Tim radovima pseudospektar postaje poznat široj javnosti te se javlja znatno veći interes među znanstvenicima za razradom ovog relativno novog pojma u matematici.

Ovaj članak temelji se na diplomskom radu drugog autora, napisanom pod vodstvom prvog autora [7], koji se pak temelji na knjizi [10].

Bibliografija
[1] Burkcel, R. B.: An introduction to classical complex analysis, Academic Press, New York, 1979
[2] Godunov, S. K.: Guaranteed accuracy in numerical linear algebra, Kluwer Academic Publishers, 1993
[3] Hille, E, i Phillips, R. S.: Functional analysis and semi-groups, AMS, Providence, 1957
[4] Horn, R. A. i Johnson C. R.: Matrix analysis, Cambridge University Press, 1985
[5] Kurepa, S.: Funkcionalna analiza, Školska knjiga, Zagreb, 1990.
[6] Landau, H. J.: On Szegõ's eigenvalue distribution theorem and non-Hermitian kernels, J. d'Analyse Math., no. 28, str. 335.–357., 1975
[7] Petrić, M.: Pseudospektar, Diplmoski rad, PMF–MO, Sveučilište u Zagrebu, 2010.
[8] Trefethen, L. N.: Pseudospectra of Linear Operators, SIAM review, vol. 39, no. 3, str. 383.–406., 1997
[9] Trefethen, L. N.: Pseudospectra of matrices, u Griffiths, D. F. i Watson, G. A. (ur.):Numerical Analysis 1991, str. 234.–266., 1992
[10] Trefethen, L. N. i Embree, M.: Spectra and pseudospectra: the behavior of nonnormal matrices and operators, Princeton University Press, Princeton, 2005
[11] Varah, J. M.: On the Separation of Two Matrices, SIAM Journal on Numerical Analysis, vol. 16, no. 2, str. 216.–222., 1979
[12] Varah, J. M.: The computation of bounds for the invariant subspaces of a general matrix operator, Technical report CS 66, Computer Science Department, Stanford University, 1967