3.6. Benzerlik

Kayıt Tarihi:

Özet:

Bir lineer dönüşümle ilgilenirken genellikle onu mümkün olan en basit matrisle temsil etmemizi sağlayacak bazları araştırırız. Bunun için isteyeceğimiz en basit matrisler köşegen elemanları dışındaki tüm elemanları sıfır olan matrislerdir (köşegen matrisler). Her dönüşüm bir köşegen matrisle temsil edilemese de matrislerin önemli bir sınıfı için bu mümkündür. Bu derste bu konuyu tartışacağız.

Anahtar Kelimeler: köşegen matris · matris izi · trace

Bir lineer dönüşümle ilgilenirken genellikle onu mümkün olan en basit matrisle temsil etmemizi sağlayacak bazları araştırırız. Bunun için isteyeceğimiz en basit matrisler köşegen elemanları dışındaki tüm elemanları sıfır olan matrislerdir, bu tip matrislere köşegen matris denir. Her dönüşüm bir köşegen matrisle temsil edilemese de matrislerin önemli bir sınıfı için bu mümkündür.

Teorem 3.6.1
Bir $\sigma$ lineer döünşümünün bir köşegen matrisle temsil edilebilmesi için gerek ve yeter koşul, $\sigma$'nın özvektörlerinden oluşan bir bazın var olmasıdır.

İspat: Özvektörlerden oluşan lineer bağımsız bir küme $X:=\{\xi_1,\ldots,\xi_n \}$ ve buna karşılık özdeğerler $\lambda_1,\ldots,\lambda_n$ olsun. Bu durumda her $i=1,\ldots,n$ için $\sigma\left(\xi_i\right)=\lambda_i\xi_i$ olacağaından bu dönüşümü $X$ bazına göre temsil eden matris $$\left[ \begin{array}{cccc} \lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&\lambda \end{array} \right]$$ olur. Tersine, aynı düşünceyle, lineer dönüşüm bir köşegen matrisle temsil edilebiliyorsa özvektörler ilgili bazı oluşturur.$$\tag*{$\blacksquare$}$$

Sonuç 3.6.2
Bir $\sigma$ dönüşümü köşegen bir matris ile temsil edilebiliyorsa, dönüşümün özdeğerleri bu köşegen matrisin esas köşegen elemanlarıdır.

Uyarı 3.6.3
Genellikle bir lineer dönüşüm yerine bunu belirtilmeyen bir baza göre temsil eden $A$ matrisine sahip oluruz, bu durumda Teorem 3.6.1 sonucu şöyle ifade edilir, bir $A$ matrisinin bir köşegen matrise benzer olması için gerek ve yeter koşul $n$ tane lineer bağımsız özvektöre sahip olmasıdır. Benzerlik tanımında içerilen ve $P^{-1}AP$ matrisini köşegen matris yapacak olan $P$ matrisi hesaplanabilir. Verilen $A$ matrisi $\sigma$ dönüşümünü $A:=\{\alpha_1,\ldots,\alpha_n \}$ bazına göre temsil ediyor olsun ve özvektörler bu baza göre $\xi_i=\sum_{j=1}^{n}p_{ij}\alpha_j$ olarak temsil edilsin. Bu durumda özvektörlerden oluşan $X:=\{\xi_1,\ldots,\xi_n \}$ bazına göre $\sigma$ dönüşümünü temsil eden matris $A':=P^{-1}AP$ olacaktır (bk. Uyarı 2.4.9) ve Teorem 3.6.1 gereği bu bir köşegen matristir.

Örnek 3.6.4
Örnek 3.5.7 ile verilen $$A:=\left[\begin{array}{rrr}-1&2&2\\2&2&2\\-3&-6&-6\end{array}\right]$$ matrisini ele alalım, bu matrisin üç tane lineer bağımsız özvektörü $\xi_1=(2,-1,0)$, $\xi_2=(1,0,-1)$ ve $\xi=(0,1,-1)$ biçimindedir. Bu durumda geçiş matrisi olan $P$ matrisinin sütunları bu özvektörlerden oluşur, $$P=\left[\begin{array}{rrr}2&1&0\\-1&0&1\\0&-1&-1\end{array}\right],\qquad P^{-1}=\left[\begin{array}{rrr}1&1&1\\-1&-2&-2\\1&2&1\end{array}\right].$$ Okuyucu bu ters matrisi ve $A':=P^{-1}AP$ matrisinin köşegen matris olduğunu doğrulamalıdır.

Uyarı 3.6.5
Örnek 3.5.8 ile verilen $A$ matrisinin üç tane lineer bağımsız özvektörü yoktur. Dolayısıyla bu matris bir köşegen matrise benzer değildir.

Teorem 3.6.6
Bir $n\times n$ boyutlu matrisin $n$ tane farklı özdeğeri varsa, bu matris bir köşegen matrise benzerdir.

İspat: Bu sonuç, Teorem 3.5.16 ve Teorem 3.6.1 sonuçlarının doğrudan bir uygulamasıdır.$$\tag*{$\blacksquare$}$$

Uyarı 3.6.7
Teorem 3.6.6 oldukça kullanışlı olmasına rağmen bazı durumlarda faydalı olmaz. Bir matrisin $n$ tane farklı özdeğerinin bulunmadığı durumlar olabilir, ya bazı özdeğerlerinin cebirsel katlılıkları vardır ya da karakteristik denklemin ilgili cisimde yeterli çözümü yoktur.

Teorem 3.6.8
Bir $A$ matrisinin bir köşegen matrise benzer olması için gerek ve yeter koşul, onun minimal polnimunun tüm çarpanlarının lineer olması ve bu çarpanların katsayılarının $F$ içinde olmasıdır.

İspat: Kabul edelim ki $A$ matrisi bir $D$ köşegen matrisine benzer olsun, bu durumda Teorem 3.5.10 gereği bunlar aynı karakteristik polinoma sahiptir. Sonuç 3.6.2 gereği bu köşegen matrisin köşegen elemanları karakteristik denklemin çözümleridir, dolayısıyla karakteristik polinomu lineer çarpanlara ayrılmalıdır. Teorem 3.4.10 gereği bunlar aynı zamanda $A$ matrisinin minimum polinomunun da birer lineer çarpanıdır. Ayrıca $D$ matrisinin yapısı gereği karakteristik denkleminin katlı çarpanları yoktur.

Diğer yandan $A$ matrisinin minimum polinomunun $m(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k)$ olsun. Her bir $i$ için, $\sigma$ dömnüşümü $A$ tarafından temsil edilen dönüşüm olmak üzere, $\sigma-\lambda_i$ dönüşümünün çekirdeğini $M_i$ ile gösterelim. $M_i$ içindeki sıfırdan farklı vektörler $\sigma$ dönüşümünün $\lambda_i$ özdeğerine karşılık gelen özvektörleridir. Teorem 3.5.16 gereği $M_i$ kümesindeki bir vektör $\sum_{j\neq i}M_j$ biçiminde bir toplamla ifade edilemez, dolayısıyla $M_1+\cdots+M_k$ toplamı bir direkt toplamdır. $\sigma-\lambda_i$ dönüşümünün sıfırlılığı $\nu_i$ olsun, yani $\nu_i=\dim M_i$ olsun. $M_1\bigoplus\cdots\bigoplus M_k\subset V$ olduğundan $\nu_1+\cdots+\nu_k\leq n$ olur. Teorem 2.1.22 gereği $\dim (\sigma-\lambda_i)V=n-\nu_i=\rho_i$ olur, aynı teoremi uygulayarak $\dim (\sigma-\lambda_j)\left\{(\sigma-\lambda_i)V \right\}\geq\rho_i-\nu_j=n-(\nu_i+\nu_j)$ elde edilir. Bu fikrin tekrarlanarak uygulanmasıyla $\dim m(\sigma)V\geq n-(\nu_1+\cdots+\nu_k)$ elde edilir, yani $n=\nu_1+\cdots+\nu_k$ olur ve bu da $M_1\bigoplus\cdots\bigoplus M_k=V$ anlamına gelir. $V$'deki her vektör, özvektörlerin lineer kombinasyonu olduğundan özvektörlerin bir bazı mevcuttur. Dolayısıyla Teorem 3.6.1 gereği $A$ matrisi bir köşegen matrise benzerdir.$$\tag*{$\blacksquare$}$$

Tanım 3.6.9
Herhangi bir $A:=\left[a_{ij}\right]$ kare matrisi için $\Tr(A):=\sum_{i=1}^{n}a_{ii}$ toplamı $A$ matrisinin izi olarak adlandırılır.

Uyarı 3.6.10
Dikkat edilmelidir ki $$\Tr(AB)=\sum_{i=1}^{n}\left(\sum_{j=1}^{n}a_{ij}b_{ji}\right)=\sum_{j=1}^{n}\left(\sum_{i=1}^{n}b_{ji}a_{ij}\right)=\Tr(BA)$$ olduğundan $$\Tr\left(P^{-1}AP\right)=\Tr\left(APP^{-1}\right)=\Tr(A)$$ eşitliği sağlanır, yani benzer matrislerin izleri aynıdır. Bundan dolayı bir lineer dönüşümün temsil eden tüm matrisler aynı ize sahiptir, $\Tr(\sigma)$ ile $\sigma$ dönüşümünü temsil eden herhangi bir matrisin izini kastederiz.

Uyarı 3.6.11
Aşağıdaki $$ \left[\begin{array}{cccc} a_{11}-t&a_{11}&\cdots&a_{1n}\\a_{21}&a_{22}-t&\cdots&a_{2n}\\\vdots&&&\\a_{n1}&a_{n2}&\cdots&a_{nn}-t \end{array}\right] $$ karakteristik matrisin determinant açılımını göz önüne alalım. Bu determinant açılımındaki toplamın her bir terimi, her biri farklı bir satır ve farklı bir sütundan alınan $n$ tane elemanın çarpımından oluşur. Dolayısıyla bu determinant değeri olan karakteristik polinomun $t^{n-1}$ teriminin oluşması için yukarıdaki matrisin esas köşegen üzerindeki elemanlarından $n-1$ tanesinin bulunduğu terimler çarpılmalıdır, bu durumda $n-$inci çarpan da esas köşegen üzerinden alınmalıdır çünkü diğer satır ve sütunlardan farklı bir satır ve sütundan eleman alınmalıdır. Yani $t^{n-1}$ terimi esas köşegen elemanları çarpımı şeklindeki terimlerin toplamından gelir, bu terimlerin hem $t$ hem de skaler bileşenleri var olduğuna dikkat edin. $t^{n-1}$ terimi oluşması için bunlardan $n-1$ tanesinde $t$, diğerinde ise skaler bulunması gerekir. Bu şekildeki tüm terimler determinant açılımında gözlemlenirse karakteristik polinomun $t^{n-1}$ terimi katsayısının $$(-1)^{n-1}\sum_{i=1}^{n}a_{ii}=(-1)^{n-1}\Tr(A)$$ olduğu görülür.

Uyarı 3.6.12
Karakteristik denklem $f(t)=\det(A-tI)$ olduğundan $f(0)=\det(A-0\cdot I)=\det A$ eşitliği sağlanır, yani karakteristik denklemin sabit terimi $\det A$ değerine eşittir. Karakteristik polinomun çarpanlara ayrılmış hali $$f(t)=(-1)^n(t-\lambda_1)^{r_1}(t-\lambda_2)^{r_2}\cdots(t-\lambda_k)^{r_k}$$ ise $$\det A=f(0)=\prod_{i=1}^k\lambda_i^{r_i}$$ olduğu görülür, yani $\det A$ değeri özdeğerlerin çarpımına (katlılıklarıyla birlikte) eşittir. Ayrıca Vieta formülleri gereği karakteristik denklemin kökleri toplamı, yani özdeğerler toplamı $\Tr(A)$ değerine eşittir.

Teorem 3.6.13
$V$ vektör uzayının $\sigma$ dönüşümünün özvektörlerinden oluşan bir bazı var olsun. Eğer $W\subset V$ alt uzayı $\sigma$ dönüşümü altında invaryant ise, $W$ uzayının da $\sigma$ dönüşümünün özvektörlerinden oluşan bir bazı vardır.

İspat: Herhangi bir $\alpha\in W$ vektörünü alalım. $V$ uzayının $\sigma$ dönüşümünün özvektörlerinden oluşan bir bazı var olduğundan $\alpha$ vektörü bu özvektörlerin lineer kombinasyonu olarak yazılabilir. Şimdi bu kombinasyonda katsayısı sıfır olan terimleri ihmal edelim, sonra aynı özdeğere karşılık gelen özvektörleri bir araya getirelim, daha sonra da kalan $a_i\xi_i$ gibi terimleri katsayısı 1 olan $\xi_i$ terimi olarak yeniden adlandıralım. Bu şekilde $\alpha$ vektörünü $\alpha=\sum_{i=1}^{r}\xi_i$ beiçiminde ifade edebiliriz ve buradaki $\xi_i$ vektörleri $\sigma$ dönüşümünün farklı özdeğerlerine karşılık gelen özvektörlerdir. Şimdi $\lambda_i$ skaleri $\xi_i$ özvektörüne karşılık gelen özvektör olsun, her bir $\xi_i$ için $\xi_i\in W$ olduğunu göstereceğiz. $W$ kümesi $\sigma$ altında invaryant olduğundan $(\sigma-\lambda_2)(\sigma-\lambda_3)\cdots(\sigma-\lambda_r)(\alpha)\in W$ olur, böylece her $\lambda$ skaleri için $\sigma-\lambda$ altında invaryant olur. Fakat bu durumda $$(\sigma-\lambda_2)(\sigma-\lambda_3)\cdots(\sigma-\lambda_r)(\alpha)=(\lambda_1-\lambda_2)(\lambda_1-\lambda_3)\cdots(\lambda_1-\lambda_r)\xi_1\in W$$ olur ve bu da $\xi_1\in W$ demektir. Benzer düşünceyle her $i$ için $\xi_i\in W$ olduğu gösterilebilir. Bu durum her $\alpha\in W$ için geçerli olduğundan $\sigma$ dönüşümü çzvektörlerinin $W$ uzayını gerdiği anlaşılmış olur.$$\tag*{$\blacksquare$}$$

Teorem 3.6.14
$V$ kümesi $\mathbb{C}$ üzerinde bir vektör uzayı ve $\sigma$ da $V$'den $V$'ye bir lineer dönüşüm olsun. $V$'nin $\sigma$ dönüşümü özvektörlerinden oluşan bir baza sahip olması için gerek ve yeter koşul, $\sigma$ altında invaryant olan her $S\subset V$ alt uzayına karşılık $V=S\bigoplus T$ olacak şekilde $\sigma$ altında invaryant bir $T\subset V$ alt uzayının var olmasıdır.

Alıştırmalar

  1. $c\neq0$ olmak üzere $$\left[\begin{array}{cc}1&c\\0&1\end{array}\right]$$ matrisinin köşegen bir matrise benzer olmadığını gösterin.
  2. $A$ tersinirse $AB$ ile $BA$ matrisleri benzerdir, kanıtlayın.

Dersin Ana Sayfası:
Lineer Cebire Giriş