Ako riešiť maticové rovnice: 8 krokov

V lineárnej algebre sú maticové rovnice veľmi podobné bežným algebraickým rovniciam v tom, že s rovnicou manipulujeme pomocou operácií na izoláciu našej premennej. Vlastnosti matíc však niektoré z týchto operácií obmedzujú, preto sa musíme uistiť, že každá operácia je opodstatnená.

Najdôležitejšou vlastnosťou matice pri riešení maticových rovníc je invertovateľnosť matice. Preto začneme tým, že si zopakujeme príslušné tvrdenia.

Predpoklady

  • Definícia. Matica

    A{\displaystyle A}

    sa hovorí, že je invertovateľná, ak existuje matica

    A1{\displaystyle A^{-1}}

    tak, že

    AA1=I{\displaystyle AA^{-1}=I}

    a

    A1A=I,{\displaystyle A^{-1}A=I,}

    kde

    I{\displaystyle I}

    je matica identity. Všimnite si, že aby mala matica inverziu, musí existovať ľavá aj pravá inverzia.

    • Inak sa hovorí, že matica je neinvertibilná alebo singulárna.
  • Veta I. Daná štvorcová matica

    A,{\displaystyle A,}

    Nižšie uvedené tvrdenia sú ekvivalentné s tvrdením, že matica je invertovateľná.

    • Stĺpce sú lineárne nezávislé.
    • riadky sú lineárne nezávislé.
    • Neexistujú žiadne voľné premenné.
    • Existuje len triviálne riešenie homogénnej rovnice (nulový priestor je triviálny).
    • Stĺpce pokrývajú kodoménu (alebo cieľový priestor) matice.
    • Rovnica
      Ax=b{\displaystyle A\mathbf {x} =\mathbf {b} }

      má jedno riešenie a toto riešenie existuje vždy, keď

      b{\displaystyle \mathbf {b} }

      je v kodoméne matice.

    • Matica mapuje na a jedna k jednej.
  • Tvrdenie II. Ak

    A{\displaystyle A}

    je inverzný, potom jeho ľavá inverzná hodnota sa rovná jeho pravej inverznej hodnote.

    • Dôkaz. Nech

      BA=I{\displaystyle BA=I}

      a

      AC=I.{\displaystyle AC=I.}

      Potom

      (BA)C=C,{\displaystyle (BA)C=C,}

      a použitím asociatívnosti matice,

      B(AC)=B=C.{\displaystyle B(AC)=B=C.}
  • Veta III. Nech

    A{\displaystyle A}

    a

    B{\displaystyle B}

    byť

    m×n{\displaystyle m\times n}

    matice. Ak

    A{\displaystyle A}

    a

    B{\displaystyle B}

    sú invertovateľné (

    m{\displaystyle m}

    sa musí rovnať

    n{\displaystyle n}

    ), potom

    AB{\displaystyle AB}

    je invertovateľná a

    (AB)1=B1A1.{\displaystyle (AB)^{-1}=B^{-1}A^{-1}.}
    • Dôkaz.

      AB{\displaystyle AB}

      je invertovateľná, ak existuje matica

      C{\displaystyle C}

      také, že

      ABC=I{\displaystyle ABC=I}

      a

      CAB=I.{\displaystyle CAB=I.}

      Nech

      C=B1A1,{\displaystyle C=B^{-1}A^{-1},}

      máme

      ABB1A1=AIA1=I,{\displaystyle ABB^{-1}A^{-1}=AIA^{-1}=I,}

      a

      B1A1AB=B1IB=I.{\displaystyle B^{-1}A^{-1}AB=B^{-1}IB=I.}
    • Obrátený postup je pravdivý, ak
      A{\displaystyle A}

      a

      B{\displaystyle B}

      sú štvorcové; ak

      AB{\displaystyle AB}

      je invertovateľná, potom

      A{\displaystyle A}

      a

      B{\displaystyle B}

      sú obidve inverzné.

      • Dôkaz. Existuje matica

        C{\displaystyle C}

        tak, že

        C(AB)=I.{\displaystyle C(AB)=I.}

        Použitie asociatívnosti matice,

        (CA)B=I,{\displaystyle (CA)B=I,}

        takže

        B{\displaystyle B}

        má ľavú inverziu

        B1=CA.{\displaystyle B^{-1}=CA.}

        Použitím vety II,

        B{\displaystyle B}

        má tiež pravú inverziu rovnú svojej ľavej inverzii, a preto je inverzný.

      • Existuje tiež matica
        D{\displaystyle D}

        také, že

        (AB)D=I.{\displaystyle (AB)D=I.}

        Použitie asociatívnosti matice,

        A(BD)=I,{\displaystyle A(BD)=I,}

        takže

        A{\displaystyle A}

        má pravú inverziu

        A1=BD.{\displaystyle A^{-1}=BD.}

        Použitím vety II,

        A{\displaystyle A}

        má tiež ľavú inverziu rovnú svojej pravej inverzii, a preto je inverzný.

    • Obrátený vzorec je nie pravdivý, ak
      A{\displaystyle A}

      a

      B{\displaystyle B}

      sú obdĺžnikové.

      • Dôkaz. Predpokladajme, že

        B{\displaystyle B}

        je singulárny. Potom

        B{\displaystyle B}

        má netriviálny nulový priestor. Predpokladajme, že

        n{\displaystyle \mathbf {n} }

        spĺňa

        Bn=0.{\displaystyle B\mathbf {n} =0.}

        Potom

        ABn=0.{\displaystyle AB\mathbf {n} =0.}

        Keďže

        AB{\displaystyle AB}

        má netriviálny nulový priestor,

        AB{\displaystyle AB}

        je singulárny.

      • Predpokladajme, že
        A{\displaystyle A}

        je singulárna. Potom

        A{\displaystyle A}

        sa nemapuje na. Potom existujú vektory

        b{\displaystyle \mathbf {b} }

        kde

        Ax=b{\displaystyle A\mathbf {x} =\mathbf {b} }

        nemá riešenie. Ak necháme

        x=By,{\displaystyle \mathbf {x} =B\mathbf {y} ,}

        potom

        ABy=b{\displaystyle AB\mathbf {y} =\mathbf {b} }

        nemá riešenie, a preto sa naň nedá mapovať rovnako dobre. Preto,

        AB{\displaystyle AB}

        je singulárna.

Časť 1 z 2:Príklad 1

Vyriešte nasledujúcu maticovú rovnicu. Predpokladáme, že všetky matice sú štvorcové matice.

  • (AAX)1=X1B{\displaystyle (A-AX)^{-1}=X^{-1}B}

Analyzujte rovnicu pre invertovateľnosť. Keďže

AAX{\displaystyle A-AX}

je invertovateľný, takže je

A(IX).{\displaystyle A(I-X).}

Potom obidve

A{\displaystyle A}

a

IX{\displaystyle I-X}

sú inverzné. Ďalej,

X1B{\displaystyle X^{-1}B}

je invertovateľné, pretože keď vezmeme inverzné hodnoty oboch strán,

AAX=(X1B)1{\displaystyle A-AX=(X^{-1}B)^{-1}}

je dobre definovaný, pretože

AAX{\displaystyle A-AX}

je invertibilný. Potom inverzná hodnota

X1B{\displaystyle X^{-1}B}

je invertovateľný, a tak je

X1B.{\displaystyle X^{-1}B.}

Nakoniec môžeme odvodiť, že

B{\displaystyle B}

je invertovateľný.

Izolácia

X{\displaystyle X}

. Zostáva už len vykonať štandardné algebraické manipulácie, pričom si treba uvedomiť, že násobenie matíc nie je komutatívne. Z tohto dôvodu je dôležité poradie, v akom vykonávame operácie. Napríklad v riadku 5 je spôsob, akým faktorujeme

X{\displaystyle X}

má význam v tom, že musí byť na pravej strane.

  • X(AAX)1=BX=B(AAX)X=BABAXBAX+X=BA(I+BA)X=BAX=(I+BA)1BA{\displaystyle {\begin{aligned}X(A-AX)^{-1}&=B\\X&=B(A-AX)\\X&=BA-BAX\\BAX+X&=BA\(I+BA)X&=BA\\X&=(I+BA)^{-1}BA\end{aligned}}}
  • Všimnite si, že v poslednom riadku sme museli predpokladať, že
    I+BA{\displaystyle I+BA}

    je invertovateľný. Pri rovniciach, ako sú tieto, je to nevyhnutné. Pre niektoré výrazy môžeme odvodiť invertibilitu, ale iné musíme predpokladať, aby bolo riešenie definované.

Časť 2 z 2:Príklad 2

Vyriešte nasledujúci problém.

  • Predpokladajme, že
    M=(ABCD),{\displaystyle M={\begin{pmatrix}A&B\\C&D\end{pmatica}},}

    kde

    A,B,C,{\displaystyle A,\,B,\,C,}

    a

    D{\displaystyle D}

    sú štvorcové matice a

    A{\displaystyle A}

    a

    D{\displaystyle D}

    sú invertovateľné. Nájdite

    M1.{\displaystyle M^{-1}.}

Predpokladajme, že

M1{\displaystyle M^{-1}}

možno zapísať takto. Potom musíme nájsť

E,F,G,{\displaystyle E,\,F,\,G,}

a

H{\displaystyle H}

v zmysle

A,B,C,{\displaystyle A,\,B,\,C,}

a

D.{\displayystyle D.}
  • M1=(EFGH){\displaystyle M^{-1}={\begin{pmatrix}E&F\\\G&H\koniec{pätica}}
  • Potom,
    (ABCD)(EFGH)=(I00I).{\displaystyle {\begin{pmatrix}A&B\\C&D\koniec{matice}}{\začiatok{matice}E&F\\G&H\koniec{matice}}={\začiatok{matice}I&0\\0&I\end{pmatrix}}.}

Vynásobením matice získate štyri rovnice.

  • {AE+BG=IAF+BH=0CE+DG=0CF+DH=I{\displaystyle {\begin{cases}AE+BG&=I\\AF+BH&=0\\CE+DG&=0\\CF+DH&=I\end{cases}}

Vyriešte sústavu rovníc.

  • AF=BHF=A1BH{\displaystyle {\begin{aligned}AF&=-BH\\F&=-A^{-1}BH\end{aligned}}}
  • CA1BH+DH=I(DCA1B)H=IH=(DCA1B)1F=A1B(DCA1B)1{\displaystyle {\begin{aligned}-CA^{-1}BH+DH&=I\\(D-CA^{-1}B)H&=I\\H&=(D-CA^{-1}B)^{-1}\\F&=-A^{-1}B(D-CA^{-1}B)^{-1}\end{aligned}}}
  • CE=DGG=D1CE{\displaystyle {\begin{aligned}CE&=-DG\\G&=-D^{-1}CE\end{aligned}}}
  • AEBD1CE=I(ABD1C)E=IE=(ABD1C)1G=D1C(ABD1C)1{\displaystyle {\begin{aligned}AE-BD^{-1}CE&=I\\(A-BD^{-1}C)E&=I\\E&=(A-BD^{-1}C)^{-1}\\G&=-D^{-1}C(A-BD^{-1}C)^{-1}\end{aligned}}}
  • Dospejeme k riešeniu. Vyššie uvedené matice sú prvkami

    M1.{\displaystyle M^{-1}.}
    • ((ABD1C)1A1B(DCA1B)1D1C(ABD1C)1(DCA1B)1){\displaystyle {\begin{pmatrix}(A-BD^{-1}C)^{-1}&-A^{-1}B(D-CA^{-1}B)^{-1}\\-D^{-1}C(A-BD^{-1}C)^{-1}&(D-CA^{-1}B)^{-1}\end{pmatrix}}}