行列式の性質(6)
行列式の性質に関する諸定理を導きます。ここからは、$0$ を含む特定の形の行列の行列式に関する諸定理を示していきます。
これらの定理はそれぞれ独立して示すことができますが、はじめに零行列のブロックをもつ行列の行列式に関する定理をこの項で示し、その系として $2$ つの命題を次項以降に示します。
零行列をブロックに持つ行列の行列式
定理 3.16(零行列をブロックに持つ行列の行列式)
$A$ を $m$ 次の正方行列、$B$ を $n$ 次の正方行列とすると、次が成り立つ。
(3.5.14)式の左辺の行列は、行列の区分けにより $m$ 次の正方行列 $A$、$(m, n)$ 型の行列 $C$、$(n, m)$ 型の零行列 $O$、$n$ 次の正方行列 $B$ の $4$ つのブロックに分けて表されています。したがって、(3.5.14)式の左辺は $(m + n)$ 次正方行列の行列式であり、右辺は $m$ 次正方行列の行列式と $n$ 次正方行列の行列式の積です。すなわち、この定理は、ある行列が零行列をブロックとして持つ場合、その行列式が、零行列に隣り合う $2$ つの行列の行列式の積の形に分解できることを示しています。
この定理の証明の仕方は何通りか考えられますが、ここでは主なものとして、行列式の定義から直接示す方法(証明 1)と、前々項の定理 3.14(写像としての行列式)を用いる方法(証明 2)の $2$ 通りを示します。
証明 1(行列式の定義による方法)
$X = \begin{vmatrix} \; A & C \; \\ \; O & B \; \end{vmatrix} = (\, x_{ij} \,)$ と置くと、行列式の定義より次が成り立つ。
仮定より、$m+1 \leqslant i \leqslant m+n$ であるとき、$1 \leqslant \sigma(i) \leqslant m$ ならば $x_{i \, \sigma(i)} = 0$ であるから、和は $m+1 \leqslant \sigma(i) \leqslant m+n$ の場合のみ考えればよい。また、$\sigma$ は全単射であるから、$1 \leqslant i \leqslant m$ であるならば $1 \leqslant \sigma(i) \leqslant m$ となる。すなわち、$\tau$ を $\lbrace 1, \cdots, m \rbrace$ 上の置換、$\rho$ を $\lbrace m+1, \cdots, m+n \rbrace$ 上の置換とすれば、$\sigma = \tau \rho$ が成り立つ。したがって、
証明の骨子 1
行列式の定義と置換が全単射であることを用いて証明します。
- 左辺を行列式の定義に従って表します。
$X = \begin{vmatrix} \; A & C \; \\ \; O & B \; \end{vmatrix} = (\, x_{ij} \,)$ と置きます。$X$ は $(m + n)$ 次の正方行列ですから、行列式は次のようになります。
$$ \begin{align*} \vert \, A \, \vert = \sum_{\sigma \in S_{m+n}} \text{sgn} (\sigma) \; x_{1 \, \sigma(1)} \, \cdots \, x_{m \, \sigma(m)} \, x_{(m+1) \, \sigma(m+1)} \, \cdots \, x_{(m+n) \, \sigma(m+n)} \\ \end{align*} $$ここで、行列式が $(m + n)$ 次の置換全体にわたる和になることに着目して、これを分割することを考えます。
- 定理の仮定により $(m + n)$ 次の置換を分割します。
まず、$i$ を $X$ の行番号として、$m+1 \leqslant i \leqslant m+n$ の場合について考えます。
- $X$ の左下のブロックは零行列 $O$ なので、$X$ の $(i, j)$ 成分 $x_{ij}$ について、$m+1 \leqslant i \leqslant m+n$ かつ $1 \leqslant j \leqslant m$ であるならば $x_{ij} = 0$ となります。これは、定理の仮定($X$ の置き方)によります。
- したがって、$m+1 \leqslant i \leqslant m+n$ かつ $1 \leqslant \sigma(i) \leqslant m$ であるならば、$x_{i \, \sigma(i)} = 0$ となり、このとき $\text{sgn} (\sigma) \; x_{1 \, \sigma(1)} \, \cdots \, x_{i \, \sigma(i)} \, \cdots \, x_{(m+n) \, \sigma(m+n)} = 0$ となることがわかります。つまり、このような場合は、和に含めなくて良いということです。
- よって、$m+1 \leqslant i \leqslant m+n$ かつ $m+1 \leqslant \sigma(i) \leqslant m+n$ となる場合のみ和を考えればよい、ということがわかります。
次に、$1 \leqslant i \leqslant m$ の場合について考えます。
- 上の考察から、$m+1 \leqslant i \leqslant m+n$ であるときは、$m+1 \leqslant \sigma(i) \leqslant m+n$ となる場合しか和に含めないこととしました。これは、$i$ が $m+1 \sim m+n$ の範囲にあれば $\sigma(i)$ も $m+1 \sim m+n$ の範囲にあるということと捉えられます。集合として $\lbrace \sigma(m+1), \cdots, \sigma(m+n) \rbrace = \lbrace m+1, \cdots, m+n \rbrace$ であると考えても同じです。
- $\sigma$ は全単射である(置換の定義)ので、$i$ が $m+1 \sim m+n$ の範囲にあれば $\sigma(i)$ も $m+1 \sim m+n$ の範囲にあるということは、$i$ が $1 \sim m$ の範囲にあれば $\sigma(i)$ は $1 \sim m$ の範囲になければならないということです。
- すなわち、$1 \leqslant i \leqslant m$ であるときは、$1 \leqslant \sigma(i) \leqslant m$ となる場合のみ和を考えればよいということです。
以上の考察から、$\sigma \in S_{m+n}$ に関する和は、$\tau \in S_{m}$ に関する和と $\rho \in S_{n}$ に関する和に分割できることがわかります。つまり、$\sigma = \tau \rho$ となります。
$$ \begin{split} \vert \, A \, \vert &\overset{(\text{i})}{=} \sum_{\sigma \in S_{m+n}} \text{sgn} (\sigma) \; x_{1 \, \sigma(1)} \, \cdots \, x_{m \, \sigma(m)} \, x_{(m+1) \, \sigma(m+1)} \, \cdots \, x_{(m+n) \, \sigma(m+n)} \\ &\overset{(\text{ii})}{=} \sum_{\tau \in S_{m}} \sum_{\rho \in S_{n}} \text{sgn} (\tau \rho) \; x_{1 \, \tau(1)} \, \cdots \, x_{m \, \tau(m)} \, x_{(m+1) \, \rho(m+1)} \, \cdots \, x_{(m+n) \, \rho(m+n)} \\ &\overset{(\text{iii})}{=} \sum_{\tau \in S_{m}} \text{sgn} (\tau) \; x_{1 \, \tau(1)} \, \cdots \, x_{m \, \tau(m)} \; \sum_{\rho \in S_{n}} \text{sgn} (\rho) \; x_{m+1 \, \rho(m+1)} \, \cdots \, x_{m+n \, \rho(m+n)} \\ &\overset{(\text{iv})}{=} \sum_{\tau \in S_{m}} \text{sgn} (\tau) \; a_{1 \, \tau(1)} \, \cdots \, a_{m \, \tau(m)} \; \sum_{\rho \in S_{n}} \text{sgn} (\rho) \; b_{1 \, \rho(1)} \, \cdots \, b_{n \, \rho(n)} \\ &\overset{(\text{v})}{=} \vert \, A \, \vert \cdot \vert \, B \, \vert \\ \end{split} $$- ($\text{i}$)は行列式の定義の通りです。
- ($\text{ii}$)と($\text{iii}$)では、$\text{sgn} (\tau \rho) = \text{sgn} (\tau) \; \text{sgn} (\rho)$ であることを用いて、$\sigma \in S_{m+n}$ に関する和を、$\tau \in S_{m}$ に関する和と $\rho \in S_{n}$ に関する和に分割しています。
- ($\text{iv}$)は、$X$ の成分を $A, B$ の成分に表し直しています。ここで、$x_{1 \, \tau(1)} \, \cdots \, x_{m \, \tau(m)} = a_{1 \, \tau(1)} \, \cdots \, a_{m \, \tau(m)}$ であり、$x_{m+1 \, \rho(m+1)} \, \cdots \, x_{m+n \, \rho(m+n)} = b_{1 \, \rho(1)} \, \cdots \, b_{n \, \rho(n)}$ です。
以上から、$\vert \, X \, \vert = \vert \, A \, \vert \cdot \vert \, B \, \vert$ となり、題意が示されました。
証明の要所は、$(m + n)$ 次の置換である $\sigma$ を $m$ 次の置換 $\tau$ と $n$ 次の置換 $\rho$ に分割して、$\sigma = \tau \rho$ とする所にあります。このことは、一見やや複雑でが、$X$ が零行列 $O$ をブロックに持つことと $\sigma$ が全単射であることから着想できます。
証明 2(定理 3.14 を用いる方法)
$B = (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n})$ とする。$F$ を以下のような写像とする。
$F$ は定理 3.14における条件($\text{i}$)、($\text{ii}$)、($\text{iii}$)を満たすので、以下が成り立つ。ここで、$E_n$ は $n$ 次の単位行列を指す。
ここで $C$ の第 $1$ 列から第 $j$ 列まででできる行列を $C_j$ として、系 3.17を繰り返し用いると、
したがって、
証明の骨子 2
定理 3.14(写像としての行列式)と系 3.17($0$ を含む行列の行列式)を用いて示します。この場合、先立って系 3.17を示しておく必要があります。
まず、定理 3.14の要件を満たす写像 $F$ を置きます。
写像 $F$ を以下のように置きます。
$$ \begin{align*} \begin{split} F (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n}) &= \begin{vmatrix} \; A & C \; \\ \; O & B \; \end{vmatrix} \end{split} \end{align*} $$- 定理 3.14の対象となる写像は、$n$ 個の $n$ 次元ベクトルの組に対してある数を対応させる写像($F : K^n \times \cdots \times K^n \to K$)のような写像ですので、これは要件を満たしています。
- ここで、行列 $B = (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n})$ を変数として扱い、行列 $A$ を定数のように扱っています。
$F$ の置き方により、以下の関係が得られます。
$$ \begin{align*} F (\bm{e}_{1}, \bm{e}_{2}, \cdots, \bm{e}_{n}) = \begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix} \end{align*} $$- ここで、$E_n$ は $n$ 次の単位行列を指しています。後ほど、系 3.17を用いて、これが $\vert \, A \, \vert$ に等しいことを導きます。
$F$ に定理 3.14を適用します。
- $F$ は定理 3.14の条件($\text{i}$)、($\text{ii}$)、($\text{iii}$)を満たします。$F$ の置き方から、$F$ の像は $(m + n)$ 次の正方行列の行列式であり、当然、多重線型かつ交代的であるといえます。
- したがって、次が成り立つといえます。ここで、$\vert \, B \, \vert$ の形が得られました。$$ \begin{split} F (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n}) &= F (\bm{e}_{1}, \bm{e}_{2}, \cdots, \bm{e}_{n}) \cdot \vert \, B \, \vert \\ &= \begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix} \cdot \vert \, B \, \vert \\ \end{split} $$
系 3.17を繰り返し適用して $\vert \, A \, \vert$ の形を抽出します。
$\begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix}$ に対して、系 3.17を繰り返し適用することで次数を下げます。
まず、$(m + n)$ 行目に着目すると、$1$ 列目から $(m + n -1)$ 列目まではすべて $0$ であり、$(m + n)$ 列目の成分が $1$ であることがわかります。このとき、系 3.17により次が成り立ちます。
$$ \begin{align*} \begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix} \overset{(1)}{=} \begin{vmatrix} \; A & C_n \; \\ \; O & E_n \; \end{vmatrix} \overset{(2)}{=} \begin{vmatrix} \; A & C_{n-1} \; \\ \; O & E_{n-1} \; \end{vmatrix} \end{align*} $$ここで、$C$ の第 $1$ 列から第 $j$ 列まででできる行列を $C_j$ と表します。$C$ はもともと $m \times n$ の行列ですので、等号($1$)は表記を変えただけです。等号($2$)は、系 3.17により、$C_{n}$ と $E_{n}$ の第 $n$ 列が削られて、次数が $1$ つ下がったことを表しています。
以上の操作を、$(m + n - 1)$ 行目、$(m + n - 2)$ 行目 $\cdots$、と続けていくと、$m + n$ から $m$ まで次数を下げることができます。このとき、$E_n$ に伴って $C$ は削り取られ、最終的に $\vert \, A \, \vert $ だけが残ります。
$$ \begin{align*} \begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix} = \begin{vmatrix} \; A & C_n \; \\ \; O & E_n \; \end{vmatrix} = \begin{vmatrix} \; A & C_{n-1} \; \\ \; O & E_{n-1} \; \end{vmatrix} = \cdots = \vert \, A \, \vert \end{align*} $$
以上から、$F (B) = \vert \, A \, \vert \cdot \vert \, B \, \vert$ が得られます。
$$ \begin{split} F (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n}) &= F (\bm{e}_{1}, \bm{e}_{2}, \cdots, \bm{e}_{n}) \cdot \vert \, B \, \vert \\ &= \begin{vmatrix} \; A & C \; \\ \; O & E_n \; \end{vmatrix} \cdot \vert \, B \, \vert \\ &= \vert \, A \, \vert \cdot \vert \, B \, \vert \\ \end{split} $$ここで、$F$ の置き方より、$F (\bm{b}_{1}, \bm{b}_{2}, \cdots, \bm{b}_{n}) = \begin{vmatrix} \; A & C \; \\ \; O & B \; \end{vmatrix}$ ですので、これは(3.5.14)式に他ならず、題意が示されたことになります。
定理 3.14(写像としての行列式)を用いることで、定義から直接示す証明 1よりも若干コンパクトになります。ただし、先立って系 3.17($0$ を含む行列の行列式)を示しておく必要があることと、証明 1がそこまで複雑ではないことから、証明 2を採用するメリットはそこまで大きくありません。系 3.17($0$ を含む行列の行列式)は、次項において定理 3.16の系として導入しますが、もちろん行列式の定義から直接示すこともできます。
まとめ
- $A$ を $m$ 次の正方行列、$B$ を $n$ 次の正方行列とすると、次が成り立つ。$$ \begin{equation*} \begin{vmatrix} \; A & C \; \\ \; O & B \; \end{vmatrix} = \vert \, A \, \vert \cdot \vert \, B \, \vert \end{equation*} $$
参考文献
[1] 齋藤正彦. 線型代数入門. 東京大学出版会. 1966.[2] 永田雅宣 他. 理系のための線型代数の基礎. 紀伊國屋書店. 1986.
[3] 川久保勝夫. 線形代数学 [新装版]. 日本評論社. 2010.
[4] 松坂和夫. 線型代数入門 [新装版]. 岩波書店. 2018.
[5] S. Lang. Linear Algebra Third Edition. Springer. 1987.
[6] 雪江明彦. 代数学 $1$ 群論入門. 日本評論社. 2010.
[7] 雪江明彦. 代数学 $2$ 環と体とガロア理論. 日本評論社. 2010.
[8] 桂利行. 代数学 $\text{I}$ 群と環. 東京大学出版会. 2004.
[9] 松坂和夫. 代数系入門. 岩波書店. 1976.
[10] 高木貞治. 代数学講義 [改訂新版]. 共立出版. 1965.
[11] S. Lang. Algebra Revised Third Edition. Springer. 2005.
[12] M. Artin. Algebra Second Edition. Pearson Education Limited. 2014.
[13] 青本和彦 他. 数学入門辞典. 岩波書店. 2005.