行列の微分 1

  x t の関数  x(t) のとき, 導関数 x' で表すと


 \begin{align} (x^2)^\prime = 2x x',\quad (x^{-1})' = -x^{-2} x',\quad (\ln x)'=x^{-1} x',\quad (e^x)'=x' e^x\end{align}


である. では  x が行列  A で,各成分が  t の関数であるとき


 \begin{align} (A^2)^\prime = 2A A',\quad (A^{-1})' = -A^{-2} A',\quad (\ln A)'=A^{-1} A',\quad (e^A)'=A' e^A\end{align}


としてしまいそうだが, 結論からいうとすべて誤りである.誤りの原因は,行列が交換するとは限らないことにある.


 \begin{align} A A' \neq A' A \end{align}


これに注意して微分を行う.


 \begin{align} (A^2)' &= A'A + AA' \\\\ (A^3)'&=A'A^2+AA'A+A^2A' \\\\
(A^4)' &= A'A^3 + AA'A^2+A^2A'A+A^3A \end{align}


これから,正の  n に対して


\begin{align} (A^n)' = \sum_{k=1}^{n} A^{k-1} A' A^{n-k} \end{align}


である( A^0=I単位行列).


次に  (A^{-1})' の計算. AA^{-1}=I の両辺を微分する.単位行列微分はゼロなので


\begin{align} A' A^{-1}+A(A^{-1})'  = 0,\quad A(A^{-1})'=-A' A^{-1} \end{align}


両辺に左から  A^{-1} をかけて


 \begin{align} (A^{-1})' = - A^{-1} A' A^{-1} \end{align}


となる.同じようにして, A^n (A^{-n})=I の両辺を微分すると


\begin{align} (A^n)' A^{-n}+A^n(A^{-n})'  = 0,\quad A^n(A^{-n})'=-(A^n)' A^{-n} \end{align}


なので


 \begin{align} (A^{-n})' &= -A^{-n} (A^n)' A^{-n} \\\\ &= -A^{-n} \sum_{k=1}^{n} A^{k-1} A' A^{n-k} A^{-n} \\\\
&= -A^{-n} \sum_{k=1}^{n} A^{k-1} A' A^{-k} \end{align}


となる.


次に行列の対数について.


 \begin{align} \ln A &= \ln (I+(A-I)) = \sum_{k=1}^\infty \frac{(-1)^{k-1}}{k}(A-I)^k  \end{align}


なので,無限級数微分が交換できるならば


 \begin{align} (\ln A)' &= \sum_{k=1}^\infty \sum_{m=1}^k \frac{(-1)^{k-1}}{k} (A-I)^{m-1} (A-I)' (A-I)^{k-m} \\\\
&= \sum_{k=1}^\infty \sum_{m=1}^k \frac{(-1)^{k-1}}{k} (A-I)^{m-1} A' (A-I)^{k-m}  \end{align}


となる.


対数の微分の式のトレースをとると,トレースの巡回性によって


 \begin{align} \mathrm{tr}\;(\ln A)' &= \mathrm{tr}\left[ \sum_{k=1}^\infty (-1)^{k-1} (A-I)^{k-1} A' \right]
= \mathrm{tr} \left[ A' \sum_{k=1}^\infty (I-A)^{k-1} \right] \end{align}


となる.ここで  \sum_{k=1}^\infty (I-A)^{k-1} (I-(I-A))^{-1}=A^{-1}テイラー展開であることを使うと


 \mathrm{tr}(\ln A)'=\mathrm{tr}(A^{-1} A')


となる. \ln \det A = \mathrm{tr} (\ln A) であったから,両辺を微分すると


 \begin{align} \frac{(\det A)'}{\det A}=  \mathrm{tr}(\ln A)' =  \mathrm{tr}(A^{-1} A')  \end{align}


すなわち


 \begin{align} (\det A)'= (\det A) \mathrm{tr}(A^{-1} A')  \end{align}


を得る.