Juhász Tibor
Diszkrét matematika
Eszterházy Károly Főiskola Matematikai és Informatikai Intézet
Juhász Tibor
Diszkrét matematika
Eger, 2013
Bíráló: ???
Készült a TÁMOP-4.1.2.A/1-11/2011-0038 támogatásával.
Tartalomjegyzék 1. A természetes számoktól a valós számokig
7
1.1. A természetes számok . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.1.1. Teljes indukció . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.2. Egész számok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.1. Oszthatóság . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.2. Prímszámok . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.3. A racionális számok . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4. A valós számok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.5. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2. Komplex számok
25
2.1. Műveletek a sík pontjain . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2. Műveletek algebrai alakban adott komplex számokkal
. . . . . . . . 28
2.3. Komplex számok trigonometrikus alakja . . . . . . . . . . . . . . . . 29 2.4. Műveletek trigonometrikus alakban adott komplex számokkal . . . . 31 2.5. Gyökvonás komplex számból . . . . . . . . . . . . . . . . . . . . . . 33 2.6. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3. Polinomok
39
3.1. Műveletek polinomokkal . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.2. Polinomok helyettesítési értéke . . . . . . . . . . . . . . . . . . . . . 43 3.3. Polinomok gyökei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.4. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4. Algebrai egyenletek
49
4.1. Algebrai egyenletek megoldóképlete . . . . . . . . . . . . . . . . . . . 51 4.1.1. Másodfokú algebrai egyenletek . . . . . . . . . . . . . . . . . 51 4.1.2. Harmadfokú algebrai egyenletek . . . . . . . . . . . . . . . . 52 4.1.3. Magasabb fokú egyenletek . . . . . . . . . . . . . . . . . . . . 55 4.2. Valós együtthatós egyenletek . . . . . . . . . . . . . . . . . . . . . . 56 4.2.1. Egy közelítő módszer . . . . . . . . . . . . . . . . . . . . . . . 60 4.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5. Algebrai struktúrák
64
5.1. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3
6. Kombinatorikai alapok
74
6.1. Variáció, permutáció, kombináció . . . . . . . . . . . . . . . . . . . . 74 6.2. Binomiális és polinomiális tétel . . . . . . . . . . . . . . . . . . . . . 78 6.3. A binomiális együtthatók tulajdonságai . . . . . . . . . . . . . . . . 79 6.4. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 7. Determinánsok
85
7.1. Permutáció, mint bijektív leképezés . . . . . . . . . . . . . . . . . . . 85 7.2. Mátrixok értelmezése . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 7.3. A determináns értelmezése . . . . . . . . . . . . . . . . . . . . . . . . 89 7.4. A determináns tulajdonságai . . . . . . . . . . . . . . . . . . . . . . 92 7.5. Kifejtési tételek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.6. A determináns értékének kiszámítása eliminációval . . . . . . . . . . 103 7.7. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8. Műveletek mátrixokkal
108
8.1. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 9. Vektorterek
116
9.1. Vektorok lineáris függősége . . . . . . . . . . . . . . . . . . . . . . . 122 9.2. Vektorrendszer rangja . . . . . . . . . . . . . . . . . . . . . . . . . . 127 9.2.1. Mátrix rangjának kiszámítása eliminációval . . . . . . . . . . 128 9.3. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 10.Lineáris egyenletrendszerek
133
10.1. Cramer-szabály . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 10.2. Gauss-elimináció lineáris egyenletrendszerekre . . . . . . . . . . . . . 136 10.2.1. Szimultán elimináció . . . . . . . . . . . . . . . . . . . . . . . 139 10.2.2. Gauss-Jordan-elimináció . . . . . . . . . . . . . . . . . . . . . 142 10.3. Homogén lineáris egyenletrendszerek . . . . . . . . . . . . . . . . . . 144 10.4. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 11.Lineáris leképezések
149
11.1. Izomorfizmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 11.2. Lineáris transzformációk . . . . . . . . . . . . . . . . . . . . . . . . . 156 11.3. Bázis és koordináta transzformáció . . . . . . . . . . . . . . . . . . . 160 11.4. Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
4
Irodalomjegyzék
164
5
Előszó Ez a jegyzet az Eszterházy Károly Főiskola Programtervező Informatikus hallgatói számára tartott Diszkrét matematika I. előadások könnyebb követhetőségét szolgálja. Az anyag felépítésekor figyelembe vettük, hogy a kurzus hallgatói már rendelkeznek felsőbb matematikai ismeretekkel, hiszen a megelőző félévben a Kalkulus I. keretein belül az alapvető halmazelméleti és függvénytani ismeretek elhangzanak, de a jegyzet nagy része stabil középiskolai ismeretek birtokában is követhető. A matematika lényegében fogalomalkotásból és a fogalmak közötti logikai kapcsolatok felderítéséből áll. Itt amikor új fogalom értelmezése történik, magát a fogalmat dőlt betűvel írjuk. Ezek a definíciók a lehetőségekhez képest precízek. Az állítások megfogalmazására több esetben a környező szöveg részeként, de van amikor tételként kiemelve kerül sor. A matematikai állítások általában bizonyításra szorulnak, itt azonban – a célcsoport igényére és felkészültségére, valamint a rendelkezésre álló időkeretre való tekintettel – a bizonyításokat nem minden esetben közöljük. A fejezetek végén lévő feladatok a tárgyalt anyag elmélyítésének mérését segítik: azt javasoljuk, hogy az olvasó addig ne tekintsen feldolgozottnak egy fejezetet, amíg az ott kitűzött feladatokkal gondjai vannak. A jegyzet célja nem a matematika lehetséges informatikai alkalmazásainak bemutatása, csupán az ahhoz szükséges matematikai alapok a tárgyhoz tartozó részének biztosítása.
6
1. A természetes számoktól a valós számokig Életünk első matematikai élményei a számok megismeréséhez köthetők, már kisgyermekként is tudtunk velük valamilyen módon bánni. Ennek ellenére a számok fogalmának precíz matematikai megalapozása túlmutat az elemi matematika szintjén. A „kettő” jelentéséről mindenkinek stabil elképzelése van, de sokan bajban lennének, ha pontos meghatározást kellene rá adni. A számfogalom egzakt felépítését ezen jegyzet keretein belül sem tudjuk ígérni, csupán annak „hangulatát” kíséreljük meg e fejezetben érzékeltetni. Célunk a középiskolában megismert nevezetes számhalmazok számunkra fontos tulajdonságainak összefoglalása.
1.1. A természetes számok Gyermekkorban a számok megismerése egyfajta elvonatkoztatás eredményeképpen történik: a körülöttünk lévő tárgyak számosságának állandóságát érzékelve a „kettő” fogalma 2 darab babapiskóta, két építőkocka, vagy éppen két kezünk közös tulajdonságaként körvonalazódik. Ezt a felismerést ragadja meg a természetes szá-
1.1. ábra. Mi a közös a három halmazban? mok halmazelméletből származó definíciója, mely szerint természetes számoknak a véges halmazok számosságait tekintjük. Kalkulusból ismert, hogy az üres halmaz véges, ennek számosságát jelöljük 0-val. Az 1 annak a halmaznak a számosságát jelöli, melynek az üres halmaz az egyetlen eleme, a 2 pedig a {∅, {∅}} halmaz számosságaként értelmezhető, és így tovább. A természetes számok halmaza tehát az N = {0, 1, 2, 3, 4, . . . } halmaz. Tudjuk, hogy a természetes számok körében korlátlanul elvégezhető az
1.2. ábra. Természetes számok a számegyenesen
7
összeadás és a szorzás. Ez alatt azt értjük, hogy bármely két természetes szám
1.3. ábra. Két természetes szám összege és szorzata is természetes szám, de nem mondható el ugyanez a természetes számok különbségeiről és hányadosairól összeadható, illetve összeszorozható, és az eredmény is minden esetben egy jól meghatározott természetes szám lesz. A számolást nagymértékben könnyíti az a tény, hogy ezek a műveletek mindegyike az alábbi „ jó” tulajdonságokkal rendelkezik. 1. A természetes számok halmazán értelmezett összeadás és szorzás is kommutatív, vagyis az eredmény független a tagok, illetve tényezők sorrendjétől. Formálisan: a + b = b + a és ab = ba teljesül minden a és b természetes számra. 2. Mindkét művelet asszociatív, azaz (a + b) + c = a + (b + c) és (ab)c = a(bc) teljesül bármely a, b, c ∈ N esetén. Ez a tulajdonság úgy értelmezhető, hogy ha három számot kell összeadnunk, mindegy, hogy először az első kettőt adjuk össze, majd az összeghez hozzáadjuk a harmadikat, vagy éppen a két második szám összegét adjuk hozzá az elsőhöz. Mivel a zárójelezés tetszőleges, a zárójeleket általában elhagyjuk. Mint azt később látni fogjuk, a két tulajdonság együtt garantálja, hogy véges sok szám összege és szorzata független a tagok, illetve tényezők sorrendjétől és a zárójelezéstől. A következő tulajdonság a két művelet kapcsolatáról árulkodik. 3. A szorzás az összeadásra nézve disztributív, azaz bármely a, b, c természetes
8
számok esetén igaz az (a + b)c = ac + bc egyenlőség. Felhívjuk még a figyelmet a 0-nak az összeadáshoz, és az 1-nek a szorzáshoz fűződő viszonyára: a nullát bármelyik számhoz hozzáadva az a szám nem változik, továbbá bármelyik szám változatlan marad, ha azt eggyel szorozzuk. Az összeadás segítségével a természetes számok között rendezés is értelmezhető: azt mondjuk, hogy a 6 b (kiolvasva: a kisebb, vagy egyenlő, mint b), ha van olyan c természetes szám, hogy a + c = b. Továbbá, a < b (a kisebb, mint b), ha a 6 b de a 6= b. Gyakran ki fogjuk használni azt a tényt, hogy a természetes számok minden nemüres részhalmazának van legkisebb eleme. 1.1.1. Teljes indukció Az is világos, hogy ha n egy természetes szám, akkor n + 1 is az. Sőt, ha H a természetes számok halmazának egy olyan részhalmaza, amely tartalmazza a 0-t, és amennyiben tartalmazza n-et, úgy tartalmazza n + 1-et is, akkor H szükségképpen az összes természetes számot tartalmazza. Ezen az állításon alapszik egy fontos bizonyítási módszer, a teljes indukció, amely természetes számokkal kapcsolatos állítások igazolására alkalmas, és a következő két lépésből áll: 1. Először azt bizonyítjuk az állítás igaz a nullára (vagy a legkisebb olyan természetes számra, melyre az állítás értelmes). 2. Utána belátjuk, hogy amennyiben az állítás érvényes valamely n természetes számra, akkor érvényes n + 1-re is. Ezt nevezzük indukciós lépésnek. A két lépés együtt biztosítja, hogy az állítás minden természetes számra igaz: az első lépés szerint igaz nullára, de ekkor a második lépés szerint egyre is, majd újra a második lépést alkalmazva kettőre is, stb. Szemléletesen szólva, biztosan fel tud menni a lépcsőn az, akiről tudjuk, hogy fel tud állni a lépcső legelső fokára, és annak bármelyik fokáról fel tud lépni a következőre. Példaként megmutatjuk, hogy 12 + 22 + 32 + · · · + n2 = teljesül minden n > 1 természetes számra.
9
n(n + 1)(2n + 1) 6
Először az n = 1 esetet kell ellenőriznünk, melyhez csupán behelyettesítésre van szükség: 12 =
1·2·3 6
valóban igaz. Most feltesszük, hogy igaz az állítás valamely k > 1 természetes számra, azaz 12 + 2 2 + 3 2 + · · · + k 2 =
k(k + 1)(2k + 1) , 6
(1.1)
és ebből kellene bizonyítani, hogy k + 1 esetén is igaz, vagyis 12 + 22 + 32 + · · · + k 2 + (k + 1)2 =
(k + 1)((k + 1) + 1)(2(k + 1) + 1) . 6
(1.2)
Alkalmazva az (1.1) feltevést, k(k + 1)(2k + 1) + (k + 1)2 = 6 k(k + 1)(2k + 1) + 6(k + 1)2 = = 6 (k + 1)(k(2k + 1) + 6(k + 1) = = 6 (k + 1)(2k 2 + 7k + 6) = . 6
12 + 22 + 32 + · · · + k 2 + (k + 1)2 =
Könnyű ellenőrizni, hogy (1.2) jobb oldala is pont ugyanezzel egyenlő. A fent elmondottak szerint az állítás ezzel bizonyítva van. Még egyszer nyomatékosítjuk, hogy az (1.1) egyenlőség csupán feltevés, ha azt közvetlenül bizonyítani tudnánk, nem lett volna szükség a teljes indukcióra. Sőt, akár még azt is feltehettük volna, hogy az állítás nemcsak k-ra, hanem a nála kisebb természetes számokra is igaz. Itt most erre nem volt szükség, de van olyan, amikor az n = k + 1 esetre csak így tudunk következtetni (lásd 1.2. tétel). Most pedig bebizonyítjuk, hogy minden ló ugyanolyan színű. Ezt a lovak száma szerinti teljes indukcióval tesszük. Ha a világon csak egyetlen ló lenne, akkor az állítás nyilván igaz lenne. Most tegyük fel, hogy k darab ló esetén igaz az állítás, és tekintsünk egy k + 1 lóból álló ménest. Számozzuk meg ebben a lovakat: 1, 2, . . . , k + 1. Az 1, 2, . . . , k és 2, 3, . . . , k + 1 sorszámú lovak egy-egy k lóból álló ménest alkotnak, így a feltevésünk szerint mindkét ménes lovai azonos színűek. Mivel a 2. ló tagja mindkét ménesnek, ezért mind a k + 1 ló színe azonos. Az állítás, melyet éppen most igazoltunk, nyilvánvalóan hamis. Ez az úgynevezett lóparadoxon nem a teljes indukciót hivatott támadni, csupán egy annak alkalmazá10
sa közben elkövethető hibára igyekszik felhívni a figyelmet. A hiba igen egyszerű: az indukciós lépésében alkalmazott gondolatmenet csak akkor helyes, ha k legalább 2, ugyanis csak ekkor lehet közös ló a két k tagú ménesben. Tehát az indukciós lépésünk megköveteli, hogy az n = 1 eseten túl az n = 2 esetet is külön kezeljük. Két tetszőleges lóról pedig senki nem mondhatja, hogy biztosan azonos színűek.
1.2. Egész számok Aki már a jegyzetben előrelapozott, láthatta, hogy előbb-utóbb egyenleteket szeretnénk megoldani. A természetes számok körében azonban már az x + 1 = 0 egyenlet megoldása is gondot okoz, hiszen nincs olyan természetes szám, melyhez egyet hozzáadva nullát kaphatnánk, vagy ha úgy tetszik, a nullából nem tudunk kivonni egyet. A természetes számok halmazának bővítésére van tehát szükség. Ezt úgy tesszük meg, hogy a −n szimbólumot, ahol n nullánál nagyobb természetes szám, is számnak tekintjük, és ezt az n negatívjának nevezzük. Az így kapott Z = {. . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . . } halmazt az egész számok halmazának, elemeit pedig egész számoknak hívjuk. A
1.4. ábra. Egész számok a számegyenesen bővítés akkor lesz eredményes, ha a természetes számoknál megismert műveleteket is kiterjesztjük erre a bővebb halmazra. A kiterjesztés arra utal, hogy az „új” művelet a „régi” számokon a megszokott eredményt kellene, hogy produkálja. Azt, hogy ez sikerült, általános iskolában mindenki láthatta: a 2 és a 3 egész számok összege ugyanúgy 5 lesz, mintha természetes számokként adtuk volna össze őket. Sőt, az összeadás és a szorzás „ jó” tulajdonságai, a kommutativitás és az asszociativitás is megmaradnak. A bővítés nyeresége abban áll, hogy minden x egész számhoz található olyan szintén egész szám (ezt hívjuk x ellentettjének ), hogy a kettő összege éppen 0. Így elmondhatjuk, hogy az egész számok körében a kivonás is elvégezhető, a kivonás ugyanis nem más, mint az ellentett hozzáadása. A rendezés is kiterjeszthető az egész számok halmazára: azt mondjuk, hogy a 6 6 b, ha b − a természetes szám. Ha 0 < a, akkor a-t pozitív, ha pedig a < 0, akkor a-t negatív egész számnak nevezzük. Korábbi tanulmányainkból ismert, hogy az osztás az egész számok körében ál-
11
talában nem végezhető el. Ez alatt azt értjük, hogy vannak olyan egészek (pl. a 12 és az 5) melyek hányadosa nem egész szám. Viszont az osztásnak az a változata, melyben maradék képződését is megengedjük, az egész számokkal is elvégezhető. 1.1. Tétel (Maradékos osztás tétele). Bármely a és b (b 6= 0) egészek esetén egyértelműen léteznek olyan q és r egészek, amelyekre a = bq + r teljesül úgy, hogy 0 6 r < |b|. A bizonyítás előtt megjegyezzük, hogy a tételben szereplő a-t osztandónak, a b-t osztónak, a q-t hányadosnak, az r-et pedig maradéknak nevezzük. A maradékra vonatkozó 0 6 r < |b| feltétel az egyértelműség miatt szükséges, nélküle azt is joggal mondhatnánk, hogy „ha a 20-at osztjuk maradékosan 7-tel, akkor az így keletkező hányados 1, a maradék pedig 13”. Bizonyítás. Tekintsük az . . . , a − (−2)b, a − (−1)b, a, a − b, a − 2b, . . . , azaz az a − kb (k ∈ Z) alakú egészeket. Ezek között biztosan van nemnegatív, nemnegatív egészek között pedig van legkisebb: legyen ez r. Ekkor r = a − kb valamely k egész esetén; legyen q = k. Innen az a = bq + r egyenlőség egyszerű átrendezéssel adódik. Megmutatjuk, hogy 0 6 r < |b|. Valóban, ha nem így volna, akkor r > r − |b| = a − qb − |b| > 0 teljesülne, mely ha b negatív, akkor az r > a − (q − 1)b > 0, ellenkező esetben pedig az r > a − (q + 1)b > 0 egyenlőtlenséghez vezetne. Ez viszont ellentmond annak, hogy a fenti egészek között a − qb volt a legkisebb nemnegatív. Most tegyük fel, hogy q1 , q2 , r1 , r2 olyan egészek, melyekre a = bq1 + r1 ,
1 6 r1 < |b|,
a = bq2 + r2 ,
1 6 r2 < |b|
és
teljesülnek. Az első egyenlőségből a másodikat kivonva, átrendezés és b kiemelése után a b(q1 − q2 ) = r2 − r1
12
egyenlőséghez jutunk. Vegyük mindkét oldal abszolút értékét (a bal oldalon lévő szorzatét tényezőnként): |b||q1 − q2 | = |r2 − r1 |. Az r1 és r2 -re vonatkozó feltevés miatt az egyenlőség jobb oldala kisebb, mint |b|. A bal oldalra ugyanez csak akkor teljesülhet, ha q1 = q2 . Ekkor viszont a bal oldal 0, így a jobb oldalnak is annak kell lenni, tehát r1 = r2 , ami azt jelenti, hogy q és r egyértelműen meghatározott. Az 1.5. ábrán néhány példát láthatunk maradékos osztásra. osztandó 20 20 -20 -20 0 7
osztó 7 -7 7 -7 7 0
hányados 2 -2 -3 3 0 -
maradék 6 6 1 1 0 -
1.5. ábra. Néhány példa maradékos osztásra Megjegyezzük, hogy az r maradékra a 0 6 r < |b| helyett más feltétel is adható úgy, hogy a maradékos osztás egyértelműsége nem sérül. Például, az 5-tel való osztás lehetséges maradékainak tekinthetnénk a {−2, − 1, 0, 1, 2} halmaz elemeit is. Maradékos osztások sorozatát alkalmazzuk akkor is, amikor egy egész számot valamilyen más alapú számrendszerbe konvertálunk át. 1.2.1. Oszthatóság Először az oszthatóság fogalmát tisztázzuk. Legyenek a és b egész számok. Azt mondjuk, hogy a b osztója az a-nak (vagy másképpen: a osztható b-vel, vagy: a többszöröse b-nek), ha van olyan c szintén egész szám, hogy a = bc. Jelölésben: a | b. Az alábbi állítások a definíció egyszerű következményei. 1. A nullának minden egész szám osztója. 2. A nulla csak önmagának osztója. 3. A −1 és 1 számok minden egész számnak osztói. Ezeket egységeknek nevezzük. 4. Ha a | b és b | a, akkor a = b vagy a = −b. 13
Az oszthatóság és az egész számokon értelmezett összeadás és szorzás között a következő kapcsolat áll fenn. 5. Ha a | b és a | c, akkor a | (b + c). 6. Ha a | b és c | d, akkor ac | bd. Példaként bebizonyítjuk az 5. állítást. Ha a | b és a | c, akkor az oszthatóság definíciója szerint vannak olyan k és l egész számok, hogy b = ak és c = al. Ekkor b + c = ak + al = a(k + l), ahonnan, lévén k + l egész, a | (b + c) következik. A többi állítás is hasonlóan igazolható. Most a legnagyobb közös osztó fogalmával folytatjuk. A d egész számot az a és a b egészek közös osztójának nevezzük, ha d az a-nak és a b-nek is osztója. Könnyű belátni, hogy ha a 6= 0 és d | a, akkor |d| 6 |a|, melyből az következik, hogy minden nullától különböző egésznek csak véges sok osztója lehet. Tehát ha a és b olyan egészek, melyek közül legalább az egyik nem nulla, akkor véges sok közös osztójuk van, így ezek között van egy legnagyobb. Ennek ellenére a legnagyobb közös osztó fogalmát másképp definiáljuk: az a és b legnagyobb közös osztója alatt a és b azon közös osztóját értjük, mely minden közös osztónak többszöröse. Például a 28 és a 12 közös osztói a ±1, ±2, ±4 számok, közülük a −4 és 4 azok, melyek mindegyik többszörösei, tehát ezek a legnagyobb közös osztók. Először belátjuk, hogy ha az a és b egészeknek létezik legnagyobb közös osztója, akkor az előjeltől eltekintve egyértelmű. Ugyanis ha d1 és d2 is legnagyobb közös osztó, akkor egyrészt d1 | d2 , másrészt pedig d2 | d1 ; azaz d1 = d2 vagy d1 = −d2 . Másrészt, ha d az a és b egészek legnagyobb közös osztója, akkor −d is az. Ezek közül a nemnegatívat lnko(a, b) fogja jelölni. Tehát lnko(28,12) = 4. Most megmutatjuk, hogy bármely két egésznek létezik legnagyobb közös osztója, és egyúttal azt is, hogy az hogyan határozható meg. Legyenek a és b egész számok, és legyen b 6= 0. Ha b | a, akkor nyilvánvaló, hogy lnko(a, b) = b. Ellenkező esetben a maradékos osztás tétele szerint a felírható a = bq1 + r1
(1.3)
alakban, ahol 0 < r1 < |b|. Folytassuk a maradékos osztást úgy, hogy a következő lépésben mindig az előző lépés osztóját osztjuk az ott keletkezett maradékkal: b = r1 q2 + r2 ,
(1.4)
r1 = r2 q3 + r3 ,
(1.5)
14
.. . ahol |b| > r1 > r2 > r3 > · · · > 0. Mivel a keletkező maradékok csökkennek, előbb-utóbb el kell, hogy érjék a nullát: rn−2 = rn−1 qn + rn ,
(1.6)
rn−1 = rn qn+1 + 0.
(1.7)
Ezt az eljárást nevezzük az a és b egészeken végrehajtott euklideszi algoritmusnak, az rn egész számot pedig az euklideszi algoritmus utolsó zérustól különböző maradékának. Azt állítjuk, hogy rn legnagyobb közös osztója a-nak és b-nek. Valóban, az (1.3)-(1.7) egyenlőségeken visszafelé haladva látható, hogy rn | rn−1 , rn | rn−2 , . . . , rn | r1 , rn | b, rn | a, tehát rn közös osztója a-nak és b-nek. De ha d is közös osztó, akkor ugyanazon egyenlőségek fentről lefelé való bejárásával kapjuk, hogy d | rn , vagyis rn valóban legnagyobb közös osztó. Példaként végrehajtjuk az euklideszi algoritmust az a = 34 és b = 12 számokkal: 34 = 12 · 2 + 10 12 = 10 · 1 + 2 10 = 2 · 5 + 0, ahol az utolsó zérustól különböző maradék 2, és ez pontosan lnko(34, 12). A legnagyobb közös osztó fogalmának hű társa a legkisebb közös többszörös fogalma. Az a és b egészek legkisebb közös többszörösén azt az m egész számot értjük, amely egyrészt közös többszöröse a-nak és b-nek, azaz a | m és b | m, másrészt a és b minden közös többszörösének osztója, azaz ha a | m0 és b | m0 , akkor m | m0 . Ez utóbbi tulajdonság a „legkisebb” jelző egyfajta megkerülése. Belátható, hogy bármely két egész számnak létezik legkisebb közös többszöröse, mely előjeltől eltekintve egyértelmű. Az a és b legkisebb közös többszörösei közül a pozitívat lkkt(a, b) fogja jelölni. A legnagyobb közös osztó és a legkisebb közös többszörös közötti összefüggés az lkkt(a, b) · lnko(a, b) = ab
15
képlettel írható le. Innen például lkkt(34, 12) =
34 · 12 34 · 12 = = 204. lnko(34, 12) 2
1.2.2. Prímszámok Korábbi tanulmányainkból ismert, hogy prímszámoknak azokat az egész számokat nevezzük, melyeknek pontosan két pozitív osztójuk van. Ez a két osztó nyilván az 1 és a szóbanforgó szám abszolút értéke lehet. Definíció szerint a −1, 0, 1 számok egyike sem prím, hiszen a 0-nak végtelen sok, míg a másik kettőnek pedig csak egyetlen pozitív osztója van. A következő állítások azt mutatják, hogy a prímszámokat többféleképpen is lehet jellemezni. 1. Egy 0-tól és ±1-től különböző egész szám pontosan akkor prím, ha csak úgy bontható fel két egész szám szorzatára, hogy az egyik tényező −1 vagy 1. 2. Egy 0-tól és ±1-től különböző egész szám pontosan akkor prím, ha p | ab-ből p | a vagy p | b következik. A 2. állítás úgy is megfogalmazható, hogy egy prímszám csak úgy lehet osztója egy szorzatnak, ha a szorzat valamelyik tényezőjének osztója. Példával illusztrálva, a 6 nem prím, ugyanis 6 | 2 · 15 teljesül, de a 6 sem a 2-nek, sem a 15-nek nem osztója. A következő tétel arra utal, hogy a prímszámok bizonyos értelemben az egész számok építőköveinek tekinthetők. 1.2. Tétel (A számelmélet alaptétele). Minden 0-tól és ±1-től különböző egész szám sorrendtől és előjelektől eltekintve egyértelműen felírható véges sok prímszám szorzataként. (Jelen esetben az egytényezős szorzat is megengedett, és az magát az egész számot jelenti.) A tételben mondottak értelmében a 10-nek a (−2) · (−5), 2 · 5, 5 · 2 és (−5) · (−2) felbontásai közt nem teszünk különbséget. Bizonyítás. A tételt először természetes számokra bizonyítjuk: megmutatjuk, hogy minden egynél nagyobb természetes szám sorrendtől eltekintve egyértelműen felírható véges sok pozitív prímszám szorzataként. A felbonthatóságot teljes indukcióval igazoljuk. Az első eset, ami szóba jöhet az n = 2. Mivel a 2 prím, így az egytényezős szorzatra tett engedménynek megfelelően a tétel igaz ebben az esetben. Most tegyük fel, hogy az állítás 2-től kezdődően valamely k-val bezárólag minden természetes számra teljesül. Megmutatjuk, hogy a tétel k + 1-re is igaz. Ez nyilván 16
így van, ha k + 1 prím. Ha nem, léteznek olyan k1 és k2 természetes számok, hogy k + 1 = k1 k2 , 2 6 k1 6 k és 2 6 k2 6 k. Az indukciós feltevés szerint k1 és k2 prímszámok szorzatára bontható, de ekkor nyilván k + 1 is. Az egyértelműség bizonyítása pedig indirekt módon történik: feltesszük, hogy valamely n > 1 természetes szám kétféleképpen is prímszámok szorzatára bontható: n = p1 p2 · · · pk = q1 q2 · · · qt ,
(1.8)
és tegyük fel, hogy k 6 t. Ekkor p1 | q1 q2 · · · qt , és mivel p1 prím, így p1 osztója a q1 q2 · · · qt szorzat valamely tényezőjének; legyen ez mondjuk q1 . Mivel q1 is prím, így p1 = q1 , és (1.8)-ból p2 · · · pk = q2 · · · qt következik. Hasonlóan láthatjuk be, hogy p2 = q2 , p3 = q3 , . . . , pk = qk , és így az 1 = qk+1 qk+2 · · · qt egyenlőséghez jutunk. Mivel az 1 nem lehet prímek szorzata, ezért a jobb oldalon maradt prímek „nem létezhetnek”, tehát csak k = t teljesülhet. Ez viszont azt jelenti, hogy nincs két különböző prímfelbontás. Adósak vagyunk még azzal az esettel, amikor n egy −1-nél kisebb egész szám. Ez esetben −n 1-nél nagyobb természetes szám, így a fent bizonyítottak szerint −n véges sok pozitív prím szorzatára bontható: −n = p1 p2 · · · pk . Innen n = = (−p1 )p2 · · · pk egy lehetséges prímfelbontás. Továbbá, ha n-nek lenne két olyan prímtényezős felbontása, amely nem csak a prímek sorrendjében és azok előjelében különbözne, akkor −n-nek is lenne két, nem csupán a prímek sorrendjében eltérő felbontása, ami ellentmond a fentieknek. Ha n > 1 és az n = p1 p2 · · · pk felbontásban az azonos prímtényezőket hatvány alakban írjuk fel, akkor az n természetes szám αr 1 α2 n = pα 1 p2 · · · pr
alakban is írható, ahol p1 , p2 , . . . , pr különböző prímszámok és α1 , α2 , . . . , αn pedig pozitív egész számok. Ezt szokás az n kanonikus alakjának nevezni. αr 1 α2 Nyilvánvaló, hogy ha n = pα 1 p2 · · · pr és d | n, akkor d kanonikus alakja
d = pβ1 1 pβ2 2 · · · pβr r ,
17
ahol 0 6 β1 6 α1 , 0 6 β2 6 α2 , . . . , 0 6 βr 6 αr . Más szóval, d kanonikus alakjában csak olyan prímek lehetnek jelen, melyek n kanonikus alakjában is jelen vannak, és legfeljebb akkora kitevőn. Az állítás megfordítása is igaz: minden ilyen kanonikus alakú természetes szám osztója n-nek. Ezek következménye, hogy ha n és m egynél nagyobb egészek, akkor lnko(n, m) megkapható úgy, hogy vesszük n és m kanonikus alakjaiból a közös prímtényezőket az előforduló kisebbik hatványon, majd azokat összeszorozzuk. Így például 56 = 23 · 7 és 140 = 22 · 5 · 7, ezért lnko(56, 140) = 22 · 7=28. A számelmélet alaptételből az is következik, hogy egy 0-tól és ±1-től különböző egész szám mindig osztható valamely prímszámmal. Ha már a prímek ilyen fontos szerephez jutottak, nézzünk még néhány velük kapcsolatos állítást. Először megmutatjuk, hogy végtelen sok prímszám van. Valóban, ha csak véges sok lenne, és mondjuk p1 , p2 , . . . , pn lennének az összes, akkor nézzük meg mit mondhatunk az N = p1 p2 · · · pn + 1 egész számról. Egy biztos: a számelmélet alaptétele szerint N prímek szorzatára bontható. Ebben a felbontásban viszont biztosan nem szerepel a felsorolt prímek egyike sem, hiszen N bármelyikkel osztva egyet ad maradékul, ami ellentmond annak, hogy p1 , p2 , . . . , pn tényleg az összes prím. Ha az n > 1 egész számról el szeretnénk dönteni, hogy prím-e vagy sem, elég azt megnézni, hogy van-e 1-től és önmagától különböző pozitív osztója. Legyen az n legkisebb pozitív osztója p. Ekkor n = pc valamely c egészre. Mivel c is osztója √ n-nek, így c > p, és n = pc > pp = p2 . Innen p 6 n adódik, ami azt jelenti, hogy az n > 1 egész szám legkisebb egytől különböző pozitív osztója nem lehet nagyobb √ n-nél. Például ahhoz, hogy az 1007-ről megállapítsuk, hogy prím-e vagy sem, elegendő √ 1007 ≈ 31,73-ig osztókat keresni. Sőt, az osztók keresését elég a prímek körében elvégezni, így csupán a 3, 5, 7, 11, 13, 17, 19, 23, 29 és 31 számokkal való oszthatóságot kell vizsgálni. Ezeket sorban ellenőrizve kiderül, hogy a 19 osztója az 1007-nek, így az 1007 nem lehet prím. Végül egy algoritmust mutatunk arra, hogyan állíthatjuk elő adott n pozitív egész számig az összes prímeket. Írjuk fel az egész számokat 2-től n-ig: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, . . . , n.
18
Ezen számok közül az elsőt bekeretezzük, majd a többszöröseit kihúzzuk: Z 11, Z 13, Z 15, . . . 2 , 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, Z Z Z A A A A listán lévő első olyan számot mely még sem bekeretezve, sem kihúzva nincsen, jelen esetben a 3-at, bekeretezzük, majd kihúzzuk a többszöröseit (amelyiket már korábban áthúztuk, azt nem kell még egyszer): Z ... 4, 5, 6, 7, 8, 9, Z 1Z 0, 11, Z 1Z 2, 13, Z 1Z 4, 15, 2 , 3 , Z A A A A A módszer ugyanígy folytatódik: az első át nem húzott és még be nem keretezett számot bekeretezzük, a többszöröseit pedig kihúzzuk. A bekeretezett számokról elmondható, hogy nem oszthatók egyetlen nála kisebb, egynél nagyobb számmal sem, tehát prímek. Amiket kihúztunk, pedig a többszörösei valamelyik bekeretezettnek, így azok nem lehetnek prímek. Ezt az algoritmust nevezzük az eratosztheneszi szita √ módszerének. Az előzőekben elmondottakból az is következik, hogy ha n-ig már az összes prímeket bekereteztük, akkor az eredeti lista minden olyan eleme, ami még nincs áthúzva prím lesz. 2
3
4
5
6
7
8
9
10
11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 60 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 1.6. ábra. A prímek listája 100-ig
19
1.3. A racionális számok Jóllehet az egész számokról sokmindent elmondtunk, de még olyan egyszerű egyenletet, mint a 2x − 1 = 0 sem lehet körükben megoldani. Világos, hiszen ide olyan szám kellene, melyet 2-vel megszorozva egyet kapunk, de ilyen egész szám nem létezik. Ismét építkeznünk kell, az eddig felállított szabályainkat betartva. Az ab alakú szimbólumokat, ahol a és b egész számok, és b 6= 0, törteknek nevezzük. Továbbá a-t a tört számlálójának, míg b-t a tört nevezőjének mondjuk. Az
a b
és
c d
törteket
egyenlőeknek tekintjük, ha ad = bc. Ily módon 2 3 1 = = = ... 2 4 6 Következik továbbá az is, hogy egy tört számlálóját és nevezőjét ugyanazzal a nullától különböző egész számmal osztva vagy szorozva vele egyenlő törtet kapunk. Amennyiben egy tört számlálójának és nevezőjének a legnagyobb közös osztója 1, akkor a törtet redukált törtnek nevezzük. Minden törtnek pontosan egy olyan redukált alakja van, ahol a nevező pozitív. Az összes törtek halmazát racionális számok halmazának nevezzük, melynek jelölésére a Q betűt használjuk. A racionális számokon az összeadást és a szorzást a következőképpen értelmezzük: a + b a · b
c ad + bc = , d bd c ac = . d bd
Megjegyezzük, hogy az első formulában az egyenlőség bal és jobb oldalain lévő + jel nem ugyanaz. A bal oldalon a + a racionális számok összeadását jelenti, melyről éppen ezzel a formulával akarjuk elmondani, hogy mit is értünk alatta, míg a jobb oldalon álló + egy tört számlálójában van, így az az egész számok összeadását jelképezi, amit már korábbról ismerünk. A második formulában a szorzással ugyanez a helyzet. Természetesen azt szeretnénk, ha ezek a műveletek rendelkeznének mindazon tulajdonságokkal, amit eddig tőlük megszoktunk: az összeadás is és a szorzás is legyen kommutatív és asszociatív. Könnyű látni, hogy ezek mind teljesülnek, példaként az összeadás asszociativitását nézzük meg: a b
+
c e ad + bc e (ad + bc)f + (bd)e + = + = = d f bd f (bd)f
20
=
adf + bcf + bde bdf
és a + b
c e + d f
a cf + de a(df ) + b(cf + de) + = = b df b(df ) adf + bcf + bde = . bdf =
Mindkét egyenlőség ugyanahhoz a formulához vezetett, így a bal oldalon lévő formulák is egyenlők kell legyenek, tehát a törtek összeadása valóban asszociatív. Vegyük észre, hogy menet közben a számlálóban az egész számok közötti összeadás és szorzás szinte minden korábban említett tulajdonságát kihasználtuk. Hasonlóan igazolhatjuk azt is, hogy a szorzás az összeadásra nézve disztributív. De hogyan lesz a racionális számok halmaza az egész számok halmazának bővítése? Hogyan érhetők tetten az egész számok a racionális számok között? A válasz egyszerű: az a egész számnak megfeleltetjük az
a 1
törtet. Ez egy kölcsönösen egy-
értelmű hozzárendelés az egész számok halmaza és a racionális számok na 1
o :a∈Z
részhalmaza között. Továbbá, ha az a és b egész számok helyett a nekik megfelelő a b 1 és 1 racionális számokat adjuk illetve szorozzuk össze, ab a+b 1 és 1 lesz, melyek pontosan az a + b, illetve ab egész
akkor összeg és a szorzat számoknak felelnek meg.
Ez azt jelenti, hogy ha egész számokat „racionális számokként” adunk, illetve szorzunk össze, az eredmény ugyanaz lesz, mintha egész számokként tettük volna velük ugyanezt. Mindezek alapján megállapodunk abban, hogy az
a 1
tört helyett ezentúl
egyszerűen a-t is írhatunk. Az is igaz, hogy a 0 (azaz a
0 1
tört) olyan racionális szám, melyet bármelyik
másikhoz hozzáadva, az a másik nem változik. Továbbá, az −a b -t
a b
racionális számhoz
hozzáadva az összeg 0 lesz, így minden racionális számnak van ellentettje. Az
ellentett létezése a kivonás lehetőségét kínálja, a kivonás ugyanis nem más, mint az ellentett hozzáadása. Könnyű látni, hogy az
1 1
törtet bármely törttel megszorozva
ez utóbbi nem változik, tehát az 1 a racionális számok körében a szorzásra nézve pontosan úgy viselkedik, mint az egész számok körében. De míg az egészek körében az 1 csak önmagával és −1-gyel volt osztható, az 11 -et minden 01 -től különböző tört osztja, vagyis minden
a b
6= 0 törthöz van olyan tört, nevezetesen a
21
b a,
hogy
a kettő szorzata éppen 1-gyel egyenlő. A
b a
törtet az
a b
reciprokának mondjuk.
Ha osztásnak a reciprokkal való szorzást tekintjük, akkor megállapíthatjuk, hogy bármely racionális számot bármely nullától különböző racionális számmal el lehet osztani, és az eredmény is racionális szám lesz. Megállapítható tehát, hogy a racionális számok körében az összeadás, a kivonás és a szorzás korlátlanul elvégezhető, sőt az osztás is azzal a megkötéssel, hogy a nullával való osztást nem értelmezzük. Végül a racionális számoknak egy újabb, az egész számokétól eltérő tulajdonságára hívjuk fel a figyelmet: bármely két különböző racionális szám között van további racionális szám. Valóban, legyenek hogy
a b
<
c d.
a b
és
c d
racionális számok, és tegyük fel,
Ekkor a számtani közepük a b
+ 2
c d
=
ad + bc 2bd
is racionális szám, továbbá a ad + bc c < < . b 2bd d A racionális számoknak ez a tulajdonsága azt jelenti, hogy a racionális számok
1.7. ábra. A [0; 1] intervallum felezésével, majd a keletkezett intervallumok tovább felezésével kapott felezőpontok „látszólag lefedik” az intervallumot
sűrűn helyezkednek el a számegyenesen, azaz a számegyenes bármely pontjának bármely környezetében van racionális szám. De ebből még nem következik, hogy a számegyenes minden pontja racionális számnak felel meg. Középiskolai tanulmányainkból ismert, hogy például az egységnégyzet átlójának hosszához tartozó szám nem lesz racionális.
1.4. A valós számok Az egyenletek megoldhatóságára visszatérve megállapíthatjuk, hogy az ax + b = 0 alakú egyenletek, ahol a és b racionális számok, és a 6= 0 mind megoldhatók a racionális számok körében, és az egyetlen megoldás x = − ab . Más a helyzet akkor, ha az egyenletben már az x ismeretlen négyzete is megjelenik: az x2 − 2 = 0 egyenletnek
22
már nincs megoldása a racionális számok körében. A számegyenes minden nem racionális számot reprezentáló pontjához rendeljük hozzá annak a 0-tól való (előjellel ellátott) távolságát, és ezekkel az úgynevezett irracionális számokkal egészítsük ki a racionális számok halmazát. Szemléletesen így jutunk el a valós számok halmazáig, √ √ melyben a fenti egyenletnek már két megoldása is van: 2 és − 2. A valós számok halmazában a négy alapművelet korlátlanul elvégezhető (a nullával való osztás kivételével), és minden nemnegatív számból tudunk négyzetgyököt vonni. Negatív számoknak azonban nem létezik valós négyzetgyöke, így például az x2 + 1 = 0 egyenlet megoldása még a valós számok körében sem lehetséges.
1.8. ábra. A valós számok és a számegyenes pontjai között kölcsönösen egyértelmű leképezés létesíthető
1.5. Feladatok 1.1. Feladat. Igazolja, hogy a) az első n pozitív egész összege
n(n+1) ; 2
b) az első n páratlan természetes szám összege n2 ; c) az első n pozitív egész köbeinek az összege
n(n + 1) 2
2 !
1.2. Feladat. Igazolja, hogy
1 (1 + 1) 1 + 2
1 1 1+ ··· 1 + =n+1 3 n
minden n > 1 természetes számra! 1.3. Feladat. Elevenítse fel a Kalkulusból ismert rendezési reláció fogalmát, majd igazolja, hogy az egész számok halmazán az oszthatóság rendezési reláció! 23
1.4. Feladat. Végezze el a maradékos osztást az összes lehetséges módon a ±82 és ±18 egészeken! 1.5. Feladat. Mivel egyenlők lnko(0, 0) és lkkt(0, 0)? 1.6. Feladat. Hajtsa végre az euklideszi algoritmust az a = 68 és b = 44 számokon, majd állapítsa meg a és b legnagyobb közös osztóit, és legkisebb közös többszöröseit! 1.7. Feladat. Bizonyítsuk be, hogy 11 | (62n + 3n+2 + 3n )! 1.8. Feladat. Egy természetes szám pozitív osztóinak száma mikor lesz páros, illetve páratlan? 1.9. Feladat. Két pozitív prímszám különbsége 2001. Hány pozitív osztója van a két prím összegének?
24
2. Komplex számok Célunk egy olyan (szám)halmaz felépítése, amely eleget tesz a következő kívánalmaknak: – elvégezhető benne a négy alapművelet a „megszokott” műveleti tulajdonságokkal; – tartalmazza a valós számok halmazát oly módon, hogy az alapműveletek a valós számokon úgy „működjenek”, ahogy azt megszoktuk; – korlátlanul lehessen benne gyököt vonni. Mivel a valós számok és a számegyenes pontjai között kölcsönösen egyértelmű leképezés létesíthető, a számfogalom további bővítése egy dimenzióban már nem lehetséges.
2.1. Műveletek a sík pontjain Tekintsük a sík pontjainak R2 = R × R = {(a, b)
:
a, b ∈ R} halmazát, és
definiáljuk rajta az összeadást és a szorzást a következőképpen: (a, b) + (c, d) = (a + c, b + d),
(a, b) · (c, d) = (ac − bd, ad + bc).
és
Ez az összeadás és szorzás mindig elvégezhető, tehát a sík bármely két pontjának összege és szorzata is a sík valamely pontja lesz. Mindkét művelet kommutatív és asszociatív, azaz bármely u, v, w ∈ R2 esetén teljesülnek az alábbi egyenlőségek: u+v =v+u
és
u · v = v · u;
(u + v) + w = u + (v + w)
és
(u · v) · w = u · (v · w).
Az összeadás ezen tulajdonságait a valós számoktól örökli, hiszen a komplex számok összeadásakor tulajdonképpen valós számokat adunk össze, koordinátánként. A szorzás asszociatív tulajdonságát bebizonyítjuk, mely után a kommutativitás ellenőrzése már nem jelenthet gondot. Legyen u = (a, b), v = (c, d) és w = (e, f ). Kiszámítva a (u · v) · w és u · (v · w) szorzatokat (és felhasználva, hogy a valós számok összeadása kommutatív) láthatjuk, hogy mindkettő ugyanazt a pontot adja eredményül: (u · v) · w = (a, b) · (c, d) · (e, f ) = (ac − bd, ad + bc) · (e, f ) = 25
= (ac − bd)e − (ad + bc)f, (ac − bd)f + (ad + bc)e = = (ace − bde − adf − bcf, acf − bdf + ade + bce) és u · (v · w) = (a, b) · (c, d) · (e, f ) = (a, b) · (ce − df, cf + de) = = a(ce − df ) − b(cf + de), a(cf + de) + b(ce − df ) = = (ace − adf − bcf − bde, acf + ade + bce − bdf ). Érvényes továbbá a zárójel-felbontási szabály, vagyis a szorzás az összeadásra nézve disztributív: (u + v) · w = u · w + v · w teljesül bármely u, v és w pontokra. Ennek ellenőrzése az olvasó feladata. Az origó olyan pont, melyet bármely másik ponthoz hozzáadva az a másik pont nem változik, ez lesz az úgynevezett zéruselem. Továbbá, bármely (a, b) ponthoz található olyan pont, nevezetesen a (−a, −b) pont, mellyel összeadva az eredmény éppen a zéruselem, más szóval, minden pontnak van ellentettje. Ennek köszönhetően a kivonás, mint az ellentett hozzáadása, a sík pontjain korlátlanul elvégezhető. Az (1, 0) pont olyan tulajdonságú, hogy bármely (a, b) pontot vele megszorozva az eredmény (a, b) lesz, ez az úgynevezett egységelem. Most pedig megmutatjuk, hogy minden (a, b) origótól különböző pontnak van reciproka, azaz van olyan (x, y) pont, mellyel (a, b)-t megszorozva eredményül az (1, 0) pontot kapjuk. Valóban, az (a, b) · (x, y) = (1, 0) egyenlőségből a szorzást elvégezve (ax − by, ay + bx) = (1, 0) adódik. Két rendezett elempár pontosan akkor egyenlő, ha megfelelő komponensei megegyeznek. Innen az ax − by = 1
(2.1)
ay + bx = 0 egyenletrendszert nyerjük, melynek megoldása könnyedén leolvasható, ha a vagy b egyike nulla. Ellenkező esetben az első egyenletet a-val, a másodikat b-vel szorozva kapjuk, hogy a2 x − aby = a aby + b2 x = 0, majd a két egyenletet összeadva az a2 x+b2 x = a egyenlethez jutunk. Innen kapjuk,
26
hogy x=
a . a2 + b2
Ha (2.1)-ben a szorzást fordított szereposztással végezzük el, azaz az első egyenletet szorozzuk b-vel, a másodikat a-val, majd a két egyenletet egymásból kivonjuk, azt kapjuk, hogy −b y= 2 . a + b2 Összegezve, az (a, b) origótól különböző pont reciproka 1 = (a, b)
a −b , 2 2 2 a + b a + b2
.
A reciprok létezése az osztás elvégezhetőségét jelenti. Az első kívánalom tehát maradéktalanul teljesül. A rendezett valós számpárok R2 halmazát a fent definiált összeadással és szorzással ellátva a komplex számok halmazának nevezzük és jelölésére a C szimbólumot használjuk. A z = (a, b) komplex szám első komponensét a z valós részének, második komponensét pedig a képzetes részének nevezzük. Jelölés: Re(z) = a és Im(z) = b. Tekintsük a komplex számok halmazának az R = {(a, 0) : a ∈ R} részhalmazát. Két R-beli elem összege és szorzata szintén eleme R-nek: (x, 0) + (y, 0) = (x + y, 0)
és
(x, 0) · (y, 0) = (xy, 0).
Az első komponenseket nézve (melyek nyilván valós számok) megállapíthatjuk, hogy R-ben a műveletek úgy „működnek” ahogy azt a valós számok körében megszoktuk. Továbbá, az f : R → R, f (x) = (x, 0) függvény kölcsönösen egyértelmű leképezés a valós számok és az R halmaz elemei között, tehát R elemei azonosíthatók a valós számokkal. A harmadik kívánalmunk teljesülésének igazolása később fog megtörténni, elöljáróban annyit elárulhatunk, hogy például az egységelem ellentettje, mely a (−1, 0) komplex szám (amit az imént éppen a −1-gyel azonosítottunk), „négyzetszám” lesz: (0, 1) · (0, 1) = (−1, 0). Jelöljük ezt a (0, 1) komplex számot i-vel, továbbá – a fentebb említett beágyazás által motiválva – az (a, 0) alakú komplex számot egyszerűen csak a-val. Ekkor az
27
2.1. ábra. Számhalmazok (a, b) komplex szám felírása az (a, b) = (a, 0) + (0, b) = (a, 0) + (b, 0) · (0, 1) felbontás miatt a + bi alakban is lehetséges, melyet a komplex szám algebrai alakjának nevezünk.
2.2. Műveletek algebrai alakban adott komplex számokkal Algebrai alakban felírt komplex számokkal az összeadást, a kivonást és a szorzást úgy kell elvégezni, mint általában a többtagú kifejezésekkel, emlékezetben tartva, hogy i2 = −1: (a + bi) ± (c + di) = (a + c) ± (b + d)i és (a + bi) · (c + di) = ac + adi + bci + bdi2 = ac + adi + bci − bd = = (ac − bd) + (ad + bc)i. A szemléletesség kedvéért álljon itt néhány példa: (−1 + i) + (3 − 2i) = 2 − i, (−1 + i) − (3 − 2i) = −4 + 3i, (−1 + i) · (3 − 2i) = −3 + 2i + 3i − 2i2 = −3 + 5i + 2 = −1 + 5i, (−5 − 3i) · 2i = −10i − 6i2 = 6 − 10i.
28
Mielőtt rátérnénk az osztásra, megjegyezzük, hogy a z = a + bi komplex szám konjugáltján a z = a − bi komplex számot értjük. Eszerint 1 + i = 1 − i, 3 − 2i = = 3 + 2i, 2,45 = 2,45, −4i = 4i. Könnyen ellenőrizhető, hogy tetszőleges z és w komplex számok esetén: – z = z akkor és csak akkor, ha z valós szám; – z = z; – z + w = z + w; – z · w = z · w; – z + z = 2 Re(z); – ha z = a + bi, akkor z · z = a2 + b2 . Most határozzuk meg az a + bi és a nullától különböző c + di komplex számok hányadosát. Az alapgondolat az, hogy egy tört számlálóját és nevezőjét a nevező konjugáltjával szorozva megszabadulhatunk a nevezőben lévő komplex számtól úgy, hogy a tört értéke nem változik: a + bi c − di ac + bd + (bc − ad)i ac + bd bc − ad a + bi = · = = 2 + 2 i. c + di c + di c − di c2 + d 2 c + d2 c + d2 Nézzük meg ugyanezt konkrét komplex számokkal, majd az eredményt vessük össze a szorzásnál látott példákkal: −1 + 5i −1 + 5i 3 + 2i −13 + 13i = · = = −1 + i, 3 − 2i 3 − 2i 3 + 2i 13 6 − 10i −2i −20 − 12i 6 − 10i = · = = −5 − 3i. 2i 2i −2i 4 Hatványozáshoz és gyökvonáshoz azonban az algebrai alak csak nehézkesen használható.
2.3. Komplex számok trigonometrikus alakja Világos, hogy az (a, b), vagy ha úgy tetszik, a + bi komplex szám egy derékszögű koordináta-rendszer rögzítése után jellemezhető az (a, b) pont origótól való távolságával, és azzal a α szöggel, mellyel a vízszintes tengely pozitív felét az origó körül pozitív (az óramutató járásával ellentétes) irányba el kell forgatni ahhoz, hogy az
29
áthaladjon az (a, b) ponton. Ezt az α szöget nevezzük a komplex szám argumentumának. Például, az 1 + i komplex szám argumentuma 45◦ , az 1 − i komplex számé pedig 315◦ . Általában véve, az argumentum meghatározásához a tg α =
b a
egyenlet
megoldása elégséges, feltéve, hogy a 6= 0. Ne feledjük, hogy a tangens függvény periódusa 180◦ , így az egyenletnek végtelen sok megoldása van; ebből az argumentum kiválasztásához elég megnézni, hogy a szóbanforgó komplex szám melyik síknegyedben van. Ha van elég bátorságunk radiánban számolni, akkor az argumentumot a
2.2. ábra. Komplex szám ábrázolása a síkon tangens függvény inverzének segítségével a következőképpen határozhatjuk meg: arctg(b/a) 2π + arctg(b/a) arg(z) = π/2 3π/2 π + arctg(b/a)
ha a > 0 és b > 0; ha a > 0 és b < 0; ha a = 0 és b > 0; ha a = 0 és b < 0; ha a < 0.
Az (a, b) komplex szám origótól való távolsága a Pitagorasz-tétel alapján
√
a2 + b2 ;
ezt a nemnegatív valós számot nevezzük a komplex szám abszolút értékének. Ez a fogalom is szinkronban van a valós számok köréből ismert abszolút értékkel, és minden z, w ∈ C esetén igazak az alábbi tulajdonságok: – |zw| = |z||w|; |z| – wz = |w| . Világos, hogy két, nullától különböző, abszolút értékével és argumentumával adott komplex szám pontosan akkor egyenlő, ha az abszolút értékeik megegyeznek, argumentumaik különbsége pedig 360◦ valamely egész számú többszöröse. Továbbá, ha adott a z = a + bi 6= 0 komplex szám origótól való r távolsága, és α argumentuma, 30
2.3. ábra. Az arctg függvény gráfja akkor a 2.2. ábra szerint a = r cos α és b = r sin α, ezért z = a + bi = r cos α + (r sin α)i = r(cos α + i sin α). Az egyenlőség jobb oldalán lévő formulát a z komplex szám trigonometrikus alakjának nevezzük. A 0 komplex számhoz nem rendelünk trigonometrikus alakot. Példaként írjuk fel a z = 1 + i komplex számot trigonometrikus alakban. Ekkor √ √ r = |z| = 12 + 12 = 2, az argumentum pedig a komplex számot a síkon ábrázol√ va könnyen le is olvasható: α = 45◦ . A trigonometrikus alak tehát z = 2(cos 45◦ + q √ √ √ + i sin 45◦ ). Legyen most z = − 3 + i. Ekkor r = |z| = ( 3)2 + 12 = 4 = 2. Az argumentum meghatározása pedig a tg α = − √13 egyenlet megoldásával lehetséges. Innen kapjuk, hogy α = −30◦ + k · 180◦ , ahol k teszőleges egész. Tekintettel arra, hogy z most a második síknegyedben van, így 90◦ < α < 180◦ , tehát α = 150◦ és z trigonometrikus alakja: z = 2(cos 150◦ + i sin 150◦ ).
2.4. Műveletek trigonometrikus alakban adott komplex számokkal A komplex számok trigonometrikus alakjának jelentősége abban rejlik, hogy ilyen alakban adott komplex számokkal bizonyos műveletek sokkal hatékonyabban végezhetők el. Legyenek z = r(cos α + i sin α) és w = s(cos β + i sin β) trigonometrikus alakban adott komplex számok. A sin(α + β) = sin α cos β + cos α sin β
31
2.4. ábra. Az f : R2 → [0, 2π[, f (a, b) = arg(a + bi) függvény által leírt felület
√
2.5. ábra. A z = − 3 + i komplex szám argumentuma és cos(α + β) = sin α sin β − cos α cos β addíciós képletek felidézése után könnyen ellenőrizhető, hogy z · w = r(cos(α + β) + i sin(α + β)), azaz trigonometrikus alakban adott komplex számok szorzásakor az abszolút értékek összeszorzódnak, míg az argumentumok összeadódnak. Lévén a pozitív egész kitevőre történő hatványozás ismételt szorzás, a z = r(cos α+i sin α) komplex szám
32
n-edik hatványa, ahol n pozitív egész, z n = |r · r ·{z. . . · r} cos(α + α + · · · + α) + i sin(α + α + · · · + α) = | {z } | {z } n db
n db
n db
n
= r (cos nα + i sin nα). Ezt a formulát Moivre-képletnek nevezzük, jelentése pedig az, hogy trigonometrikus alakban adott komplex szám hatványozásakor az abszolút értéket, mint valós számot az adott kitevőre emeljük, és az argumentumot pedig a kitevővel szorozzuk. Példaként kiszámítjuk az 1 − i komplex szám tizedik hatványát. Előtte megállapodunk abban, hogy algebrai alakban kitűzött feladatnál az eredményt is algebrai alakban várjuk. A Moivre-képlet alkalmazásához viszont át kell váltanunk trigono√ metrikus alakra: 1 − i = 2(cos 315◦ + i cos 315◦ ). Innen √ (1 − i)10 = ( 2)10 (cos(10 · 315◦ ) + i sin(10 · 315◦ )) = 32(cos 270◦ + i sin 270◦ ) = = 32(0 + (−1)i) = −32i. Könnyű belátni, hogy a z = r(cos α + i sin α) komplex szám reciproka 1 1 = (cos(−α) + i sin(−α)), z r ugyanis ekkor z · z1 = 1(cos 0◦ +i sin 0◦ ) = 1. A szorzás és a reciprok felhasználásával a z = r(cos α + i sin α) és w = s(cos β + i sin β) 6= 0 komplex számok hányadosa a következőképpen határozható meg: 1 1 z = z · = r(cos α + i sin α) · (cos(−β) + i sin(−β)) = w w s r = (cos(α − β) + i sin(α − β). s Más szóval, trigonometrikus alakban adott komplex számok osztásánál az abszolút értékeiket elosztjuk, argumentumaikat pedig kivonjuk. Ennélfogva a Moivre-képlet tetszőleges egész kitevőre érvényes, továbbá teljesülnek a hatványozás valós számok köréből is ismert tulajdonságai.
2.5. Gyökvonás komplex számból Célunkat teljes mértékben akkor érjük el, ha megmutatjuk, hogy a komplex számok körében korlátlanul elvégezhető a gyökvonás. Ehhez azonban tisztáznunk kell mit 33
is értünk egy komplex szám n-edik gyökén. Legyen n adott pozitív egész. A z komplex szám n-edik gyökén mindazon komplex számokat értjük, melyek n-edik hatványa z. Vigyázat! A valós számok körében a 9 négyzetgyöke a 3, a komplex számok körében viszont a fenti definíciónak a 3 mellett a −3 is eleget tesz. Tehát a z komplex szám n-edik gyöke általában nem egyetlen komplex szám, hanem komplex √ számok egy halmaza. Az ebből fakadó zavarok elkerülése végett a n · jelet kizárólag valós számok n-edik gyökének jelölésére fogjuk használni. Legyen z = r(cos α + i sin α) tetszőleges komplex szám, és keressük z n-edik gyökeit trigonometrikus alakban. Ha x = u(cos ϕ + i sin ϕ) egy n-edik gyöke z-nek, akkor xn = z teljesül. Alkalmazva a Moivre-képletet un (cos(n · ϕ) + i sin(n · ϕ)) = r(cos α + i sin α) adódik. Az egyenlőség mindkét oldalán egy-egy trigonometrikus alakban adott komplex szám szerepel, tehát az egyenlőség csak úgy teljesülhet, ha un = r
és
n · ϕ = α + k · 360◦ ,
valamely k egészre. Az első egyenlet az abszolút értékek miatt a valós számok √ körében értendő, így egyetlen megoldása u = n r. A második egyenletből pedig ϕ=
α+k·360◦ n
adódik. A z komplex szám n-edik gyökei tehát az √ n
α + k · 360◦ α + k · 360◦ r cos + i sin , n n
(2.2)
alakú komplex számok, ahol k ∈ Z. Ezek szerint minden nemnulla komplex számnak végtelen sok n-edik gyöke lenne? Próbaképpen határozzuk meg a −8 harmadik gyökeit! A −8 trigonometrikus alakja 8(cos 180◦ + i sin 180◦ ). A k alábbi értékeire a fenti képlet a következő eredményt adja. k=0: k=1: k=2:
√ 3 √ 3 √ 3
Folytatva ezt, a k = 3 esetben
8 (cos 60◦ + i sin 60◦ ) = 1 +
√
8 (cos 180◦ + i sin 180◦ ) = −2 8 (cos 300◦ + i sin 300◦ ) = 1 − √ 3
3i √
3i
√ 8 (cos 420◦ + i sin 420◦ ) = 1+ 3i adódik, ugyanaz
tehát mint a k = 0 esetben. Legyenek u és v tetszőleges egészek, és osszuk el az u − v egész számot mara-
34
dékosan n-nel: u − v = nq + t, ahol q és t egészek, valamint 0 6 t < n. Ekkor α + u · 360◦ α + (v + nq + t) · 360◦ α + v · 360◦ (nq + t) · 360◦ = = + = n n n n α + v · 360◦ t = + q+ · 360◦ . n n Ebből látszik, hogy a
α+u·360◦ n
α+v·360◦ n
és
szögek közötti eltérés pontosan a t = 0
esetben lesz 360◦ egész számú többszöröse, vagyis a (2.2) képlet által meghatározott komplex számok a k = u és k = v esetekben akkor és csak akkor egyeznek meg, ha u − v osztható n-nel. Tehát a (2.2) képlet k = 0, 1, . . . , n − 1 esetekre történő alkalmazásával n darab különböző komplex számot kapunk, és k semmilyen más értékére nem kapunk ezektől különböző eredményt. Ezáltal azt bizonyítottuk, hogy minden nullától különböző komplex számnak pontosan n darab n-edik gyöke van. Visszatérve a példához, a −8-nak 3 különböző harmadik gyöke létezik: −2 és √ 1 ± 3i. Megállapíthatjuk továbbá, hogy a komplex számok körében a gyökvonás valóban korlátlanul elvégezhető, így a komplex számok halmaza eleget tesz a kezdeti követelményeinknek. Az 1 is komplex szám, így neki is pontosan n darab n-edik gyöke van, ezeket n-edik egységgyököknek nevezzük. Ezek kiszámítása ugyancsak a (2.2) képlet alkalmazásával történhet. Mivel az 1 trigonometrikus alakja cos 0◦ + i sin 0◦ (az r = 1 szorzót elhagytuk), (2.2) alapján az n-edik egységgyökök a következők: εk = cos
k · 360◦ k · 360◦ + i sin , n n
ahol k = 0, 1, . . . , n − 1. A negyedik egységgyökök például: ε0 = cos 0◦ + i sin 0◦ = 1, ε1 = cos 90◦ + i sin 90◦ = i, ε2 = cos 180◦ + i sin 180◦ = −1, ε3 = cos 270◦ + i sin 270◦ = −i. Világos, hogy ε0 mindig 1, és belátható az is, hogy az n-edik egységgyökök mindegyike előállítható oly módon, hogy ε1 -et 0, 1, . . . , n − 1 kitevőkre emeljük. A fenti példát tekintve tehát a negyedik egységgyökök megkaphatók, mint i hatványai: i0 = 1, i1 = i, i2 = −1 és i3 = −i. Az n-edik egységgyökök ismeretében az n-edik gyökvonás tetszőleges z komplex
35
2.6. ábra. Negyedik egységgyökök számból könnyebben elvégezhető: ha w a z egy n-edik gyöke, akkor z összes n-edik gyöke wε0 , wε1 , . . . , wεn−1 , vagyis elég w-t végigszorozni az összes n-edik egységgyökkel. Ennek bizonyítását az olvasóra bízzuk. A tétel alkalmazásával kiszámítjuk a −4 = 4(cos 180◦ + i sin 180◦ ) negyedik √ gyökeit. Alkalmazva a (2.2) képletet a k = 0 esetre, azt kapjuk, hogy 2(cos 45◦ + +i sin 45◦ ) = 1+i az egyik negyedik gyök. Fejben tartva a negyedik egységgyököket, a maradék három a következő: (1 + i)i, (1 + i)(−1), (1 + i)(−i), azaz −1 + i, −1 − i és 1 − i. Végül megjegyezzük, hogy a valós számok n-edik gyökének középiskolából is√ √ √ mert tulajdonságai (pl. n ab = n a· n b) a komplex számok n-edik gyökére általában nem terjeszthetők ki.
2.6. Feladatok 2.1. Feladat. Töltse ki az alábbi táblázatot! z
Re(z)
Im(z)
z
−5 − i 1 0 2 + 3i i π −5
0
36
2.2. Feladat. Hol helyezkednek el a síkon azok a pontok, melyeknek megfelelő komplex számokra igaz, hogy 1. Re(z) + Im(z) = 1; 2. arg(z) = 45◦ ; 3. z = z1 ? 2.3. Feladat. Adja meg az i2 , i3 , i4 , i5 és i15342 értékét! Mivel egyenlő k
egyenlő i , ha n tetszőleges egész szám? 2.4. Feladat. Hozza algebrai alakra a 2 (1 − i)(3 + i) komplex számot! 2.5. Feladat. Legyen z = −1 + i és w = −3 − 4i. Határozza meg a (w + z)2 · w w−z kifejezés pontos értékének algebrai alakját! 2.6. Feladat. Adja meg a −2 + i,
3 + i,
−1 − 2i,
8,192 − 5,736i,
3i,
1−
√
3i
komplex számokat trigonometrikus alakban! 2.7. Feladat. Fejezze ki a cos 60◦ + i sin 60◦ cos 150◦ + i sin 150◦ komplex számot algebrai alakban! 2.8. Feladat. Adja meg a (1 + i)7 (1 − i)5 komplex számot algebrai alakban! 2.9. Feladat. Számítsa ki a második és a harmadik egységgyököket! 37
1 i3 ?
Mivel
2.10. Feladat. Határozza meg a
√
3(cos 30◦ + i sin 30◦ ) komplex szám nyolcadik
hatványát és harmadik gyökeit! 2.11. Feladat. Legyen a tetszőleges valós szám. Adja meg a komplex négyzetgyökeit! 2.12. Feladat. Számítsa ki a −2i és a −7 − 24i komplex számok négyzetgyökeit! 2.13. Feladat. Számítsa ki a −2i és a −7 − 24i komplex számok négyzetgyökeit trigonometrikus alak használata nélkül! (Útmutatás: keressük a −2i négyzetgyökeit a + bi alakban; ekkor (a + bi)2 = −2i.) 2.14. Feladat. Oldja meg a komplex számok halmazán a z · z + z − (10 + i) = 0 és a z2 − z = 0 egyenleteket!
38
3. Polinomok Legyen T a racionális, valós, illetve komplex számok halmaza közül az olvasó szívéhez legközelebb álló. Tekintsük T elemeit, az x úgynevezett „határozatlant”, és nézzük meg, hogy ezekből az összeadás és a szorzás segítségével véges sok lépésben milyen kifejezéseket állíthatunk elő. Könnyen látható, hogy ezek a kifejezések tartalmazhatják x bármilyen nemnegatív kitevőjű hatványát, azok bármilyen T -beli elemmel való szorzatát, illetve az ilyenek összegét. Más szóval, az esetleges zárójelek felbontása, összevonás és rendezés után egy f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0
(3.1)
alakú kifejezést kapunk, ahol a0 , a1 , . . . , an a T elemei, és n természetes szám. Az ilyen alakú kifejezéseket T feletti polinomnak nevezzük, az a0 , a1 , . . . , an számokat a polinom együtthatóinak mondjuk. Az aj xj kifejezést a polinom j-ed fokú tagjának nevezzük. Jelölésben f (x) helyett írhatunk f -et is, ha nem kívánjuk hangsúlyozni, hogy x a határozatlan. A polinomot definiáló képlet bonyolultságát az okozza, hogy az x határozatlan egy T -beli elemmel való szorzatát nem tudjuk ténylegesen elvégezni, így például az x kétszeresét csak formálisan, 2x-ként tudjuk kezelni, továbbá a különböző fokú tagokat is csak formálisan tudjuk összeadni. Az x-ről mindössze annyit feltételezünk, hogy rá is igaz az, ami T minden elemére, így például 0·x = 0. Ebből 0 · xk = 0 következik, így az ilyen alakú tagokat általában elhagyjuk. A (3.1) képletben például n-nél magasabb fokú tag nem szerepel, így azok együtthatóit mind nullának tekintjük. Egy polinomban tehát csak véges sok nullától különböző együttható lehet. A definíció szerint az is megtörténhet, hogy egy polinom mindegyik együtthatója nulla, az ilyen polinomot azonosan nulla polinomnak nevezzük és 0-val jelöljük. Ha f 6= 0, keressük meg azt a legnagyobb k egész számot, melyre ak 6= 0. Ezt a k számot az f polinom fokának nevezzük, és deg(f )-fel jelöljük. Az azonosan nulla polinom fokát nem szokás értelmezni. Ahhoz, hogy ne kelljen az azonosan nulla polinomot mindig kivételként kezelni, mi az azonosan nulla polinom fokát létezőnek, és minden más polinom fokánál kisebbnek tekintjük: legyen az azonosan nulla polinom foka −∞. A T feletti összes polinomok halmazát T [x] fogja jelölni. Két polinomot egyenlőnek tekintünk, ha az együtthatóik rendre megegyeznek, vagyis minden k > 0 esetén az xk együtthatója a két polinomban ugyanaz. Világos,
39
hogy egyenlő polinomok fokai is megegyeznek.
3.1. Műveletek polinomokkal A T feletti polinomok körében értelmezhetünk összeadást és szorzást a következőképpen. Az összeadást az azonos fokú tagok összeadásával végezzük, míg a szorzásnál minden tagot minden taggal szorzunk úgy, hogy az ai xi és a bj xj tagok szorzata ai bj xi+j lesz, majd az azonos fokú tagokat összevonva a kapott összeget x hatványai szerint csökkenő sorrendbe rendezzük. Legyen például f (x) = 3x2 − 2x + 1 és g(x) = 2x3 + 5x2 − 1. Ekkor f (x) + g(x) = 2x3 + 8x2 − 2x és f (x) · g(x) = 6x5 + 15x4 − 3x2 − 4x4 − 10x3 + 2x + 2x3 + 5x2 − 1 = = 6x5 + 11x4 − 8x3 + 2x2 + 2x − 1. Az összeg- és szorzatpolinomok fokáról az összeadandók, illetve a szorzótényezők fokának ismeretében a következőt mondhatjuk: Az összeg foka nem lehet nagyobb egyik összeadandó fokánál sem, azaz deg(f + g) 6 max{deg(f ), deg(g)}. Az egyenlőség csak akkor nem teljesül, ha az f és g azonos fokúak, és a legmagasabb fokú tagjaik együtthatóinak összege nulla. Továbbá, deg(f · g) = deg(f ) + deg(g), vagyis a szorzat polinom foka mindig a tényezők fokainak összegével egyenlő. Itt kihasználtuk, hogy T -beli elemek szorzata csak úgy lehet nulla, ha valamelyik tényezője nulla. Hogy ez a komplex számok körében is így van, majd egy későbbi fejezetben, általánosabb körülmények között fogjuk belátni. A polinomokon értelmezett összeadás kommutatív, asszociatív, zéruseleme az azonosan nulla polinom, továbbá minden f polinomnak létezik ellentettje, a −f polinom, melynek együtthatói éppen az f együtthatóinak ellentettjei. Így tehát a polinomok körében a kivonás, mint az ellentett hozzáadása, szintén elvégezhe-
40
tő. A kommutativitás és asszociativitás a szorzásra is igaz, az egységelem szerepét az f (x) = 1 polinom tölti be. Egyetlen legalább elsőfokú polinomnak sem létezik reciproka, hiszen szorzáskor a fokok összeadódnak, így legalább elsőfokú polinom egyetlen polinommal való szorzata sem lehet a nulladfokú f (x) = 1 polinom. Reciproka tehát csak a nulladfokú polinomoknak lehet, és van is, mivel azok pontosan a T nullától különböző elemei. Az egész számoknál látottakhoz hasonlóan, reciprok hiányában osztás helyett csak maradékos osztásról tudunk beszélni. 3.1. Tétel (Polinomok maradékos osztásának tétele). Bármely f és g (g 6= 0) T feletti polinomhoz egyértelműen léteznek olyan q és r szintén T feletti polinomok, amelyekre f = g · q + r, ahol r foka kisebb a g fokánál. Bizonyítás. Először megmutatjuk, hogy ha q és r valóban léteznek, akkor egyértelműen meghatározottak. Ezzel ellentétben tegyük fel, hogy léteznek olyan q1 , q2 , r1 és r2 polinomok, melyekre f = g · q1 + r1
és f = g · q2 + r2 ,
ahol deg(r1 ) és deg(r2 ) is kisebb mint deg(g), és q1 6= q2 . Kivonva a második egyenlőséget az elsőből, átrendezés után a g · (q2 − q1 ) = r1 − r2
(3.2)
egyenlőséget kapjuk. Mivel q1 6= q2 , a bal oldalon álló polinom foka legalább annyi, mint g foka, a jobb oldalon álló r1 − r2 polinom viszont g-nél kisebb fokú, ami ellentmondás. Tehát q1 = q2 , és így a (3.2) bal oldalán álló polinom azonosan nulla. Ekkor viszont r1 − r2 is azonosan nulla kell legyen, ahonnan r1 = r2 következik. Most megmutatjuk, hogyan konstruálhatók meg a q és r polinomok. Legyenek f = an xn + an−1 xn−1 + · · · + a1 x + a0 és g = bm xm + bm−1 xm−1 + · · · + b1 x + b0 6= 0 n, illetve m-ed fokú polinomok. Ha n < m, akkor a q = 0 és r = f szereposztással igaz az állítás: f = g · 0 + f . Az n > m esetben osszuk el f legmagasabb fokú tagját
41
g legmagasabb fokú tagjával, majd ezt a q1 =
an n−m an xn = x m bm x bm
hányadost szorozzuk meg g-vel és a szorzatot vonjuk ki f -ből! Jelölje ezt a különbséget f1 : f1 = f (x) − q1 (x) · g(x). Világos, hogy a kivonásnál f legmagasabb fokú tagja kiesik, így f1 foka kisebb, mint f foka. Ha deg(f1 ) < deg(g), akkor készen vagyunk: q = q1 és r = f1 . Ellenkező esetben ismételjük meg az eljárást úgy, hogy f helyett az f1 polinomot vesszük: megkonstruáljuk az f2 polinomot, melyre igaz, hogy deg(f2 ) < deg(f1 ) < < deg(f ). Ha deg(f2 ) < deg(g), megállunk, egyébként újból ismétlünk, de most f1 helyett f2 -vel. Mivel az f1 , f2 , . . . polinomok fokai egyre kisebbek, véges sok lépésben (mondjuk a k-adikban) eljutunk arra az esetre, amikor már deg(fk ) < < deg(g). Könnyen látható, hogy f = (q1 + q2 + · · · + qk−1 ) · g + fk , tehát a polinomok maradékos osztásának tétele igaz. A tételben szereplő q polinomot az f és a g hányadosának, míg az r polinomot az osztás maradékának nevezzük. Konkrét példán keresztül talán a bizonyítás is könnyebben megérthető. Osszuk el az f = −x5 − 5x3 + 4x − 1 polinomot maradékosan a g = x3 + 2x − 1 polinommal! Először elosztjuk f legmagasabb fokú tagját g legmagasabb fokú tagjával: −x5 /x3 = −x2 , ezt a hányadost írjuk az egyenlőségjel jobb oldalára: (−x5 − 5x3 + 4x − 1) : (x3 + 2x − 1) = −x2 A g polinomot megszorozzuk az előbb kapott hányadossal (−x2 -nel), és a szorzatot f alá írjuk: (−x5 − 5x3 + 4x − 1) : (x3 + 2x − 1) = −x2 − x5 − 2x3 + x2
42
Vonjuk ki f -ből az alatta lévő szorzatot: (−x5 − 5x3 + 4x − 1) : (x3 + 2x − 1) = −x2 −(−x5 − 2x3 + x2 ) − 3x3 − x2 + 4x − 1 A vonal alatt lévő polinom foka még nem kisebb, mint g foka, így azt f1 -nek tekintve folytatjuk az eljárást. Az f1 és g polinomok legmagasabb fokú tagjainak hányadosa −3x3 /x3 = −3, ezt hozzáadjuk az egyenlőség jobb oldalán lévő polinomhoz, majd g −3-szorosát az f1 alá írjuk, amit végül ki is vonunk f1 -ből: (−x5 − 5x3 + 4x − 1) : (x3 + 2x − 1) = −x2 − 3 −(−x5 − 2x3 + x2 ) − 3x3 − x2 + 4x − 1 −(−3x3 − 6x + 3) − x2 + 10x − 4 A bizonyítás jelöléseit követve a legalul lévő polinom f2 , melynek foka már kisebb g fokánál, így az eljárás véget ért. Az eredmény: q = −x2 − 3 és r = −x2 + 10x − 4. A számolás helyességéről a −x5 − 5x3 + 4x − 1 = (x3 + 2x − 1)(−x2 − 3) + (−x2 + 10x − 4) egyenlőség ellenőrzésével győződhetünk meg.
3.2. Polinomok helyettesítési értéke Legyen f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 egy T feletti polinom, és t adott eleme T -nek. Az f (t) = an tn + an−1 tn−1 + · · · + a1 t + a0 T -beli számot az f (x) polinom t helyen vett helyettesítési értékének nevezzük. Hangsúlyozzuk, hogy a fenti kifejezés már nem formális összeg, itt a műveletek már ténylegesen elvégezhetők. Az f polinomba akár T összes elemét behelyettesíthetjük, melynek eredményeként egy f ∗ : T → T függvényt kapunk, melyet az f -hez tartozó polinomfüggvénynek nevezünk. Gyakorlati szempontból egy polinom (mint formális összeg) és a hozzá tartozó polinomfüggvény között lényegi különbség nincs, később 43
azonban látni fogjuk, hogy ha a polinomok együtthatóit nem a komplex számok köréből vesszük, előfordulhat, hogy nem egyenlő polinomokhoz tartozó polinomfüggvények egyenlők. A polinomok adott helyen vett helyettesítési értékének kiszá-
3.1. ábra. Az f (x) = x2 valós számok feletti polinomhoz tartozó polinomfüggvény gráfja, melyet középiskolai tanulmányaiból mindenki ismer mításához elvégzendő műveletek számának csökkentésére alkalmas az úgynevezett Horner-elrendezés, melynek alapja, hogy az f (x) = an xn +an−1 xn−1 +· · ·+a1 x+a0 polinomban a legalább elsőfokú tagokból x kiemelhető: f (x) = (an xn−1 + an−1 xn−2 + · · · + a1 )x + a0 . A zárójelen belül újra és újra kiemelve x-et azokból a tagokból, melyekből lehetséges, f (x) = (an xn−1 + an−1 xn−2 + · · · + a1 )x + a0 = = ((an xn−2 + an−1 xn−3 + · · · + a2 )x + a1 )x + a0 = · · · =
(3.3)
= (· · · (((an x + an−1 )x + an−2 )x + an−3 )x + · · · + a1 )x + a0 adódik. Helyettesítsünk most x helyére t-t! A jobb oldalon lévő kifejezés kiértékeléséhez létrehozunk egy táblázatot úgy, hogy – a táblázat felső sorába a polinom együtthatói kerülnek, rendre a legmagasabb fokú tagtól a konstansig, a nullákat is beleértve; – a második sor fejlécébe a behelyettesítendő értéket írjuk, majd a főegyüttható alá magát a főegyütthatót másoljuk; 44
– a második sor többi celláját balról jobbra haladva töltjük ki úgy, hogy a következő cellába az azt megelőzőbe írt szám t szeresének, és a fölötte lévő együtthatónak az összegét írjuk. Jelölje a második sorba írt elemeket rendre cn , cn−1 , . . . , c0 . Könnyen látható, hogy cn = an ; cn−1 = an t + an−1 ; cn−2 = (an t + an−1 )t + an−2 ; .. . c0 = (· · · (((an t + an−1 )t + an−2 )t + an−3 )t + · · · + a1 )t + a0 . Ekkor (3.3) szerint c0 = f (t), azaz a táblázat utolsó cellájába írt érték éppen az f polinom t helyen vett helyettesítési értéke. Például a 3.2. ábrán látottak szerint az f (x) = 3x4 − 2x2 + x + 1 polinomba x = 2-t helyettesítve f (2) = 43 adódik. A táblázatból az is látszik, hogy f (2) meg-
2
3 3
0 3·2+0=6
−2 6 · 2 + (−2) = 10
1 10 · 2 + 1 = 21
1 21 · 2 + 1 = 43
3.2. ábra. Horner-táblázat az f (x) = 3x4 − 2x2 + x + 1 polinom x = 2 helyen vett helyettesítési értékének meghatározására
határozásához mindössze 4 darab szorzást és ugyanennyi összeadást használtunk, míg ha a behelyettesítést a „hagyományos” módszerrel végeznénk, akkor csupán a 3x4 tag kiértékelése máris 5 szorzásba kerülne. Könnyen igazolható a Horner-elrendezés egy másik hozadéka: ha az f polinomot maradékosan osztjuk az x − t elsőfokú polinommal, akkor a hányados együtthatói éppen a táblázat alsó sorában szereplő cn , cn−1 , . . . , c1 számok, c0 = f (t) pedig az osztás maradéka, azaz f (x) = (x − t)(cn xn−1 + cn−1 xn−2 + · · · + c2 x + c1 ) + f (t). A példánkban tehát 3x4 − 2x2 + x + 1 = (x − 2)(3x3 + 6x2 + 10x + 21) + 43, ami a szorzás elvégzésével könnyen ellenőrizhető. 45
(3.4)
3.3. Polinomok gyökei Azt mondjuk, hogy t ∈ T gyöke az f ∈ T [x] polinomnak, ha f (t) = 0. Itt T szerepe már fontosabb, mint az eddigiekben. Például az f (x) = x2 + 1 polinom tekinthető akár R, akár C feletti polinomnak is. Az első esetben f -nek nincs gyöke, hiszen nem létezik olyan t valós szám, melyre t2 + 1 = 0 teljesülne, míg a második esetben f gyökei az i és a −i komplex számok. (3.4) alapján könnyen látszik, hogy t pontosan akkor gyöke az f polinomnak, ha f felírható f (x) = (x − t)q(x) alakban, ahol q eggyel alacsonyabb fokú polinom, mint f . Ekkor az x − t elsőfokú polinomot az f polinom t-hez tartozó gyöktényezőjének nevezzük. Tegyük fel, hogy az f (x) polinom szorzattá alakítható, azaz vannak olyan g(x) és h(x) szintén T feletti polinomok, hogy f (x) = g(x)h(x). Ha t gyöke az f polinomnak, akkor f (t) = g(t)h(t) = 0. Mivel T -beli elemek szorzata csak úgy lehet nulla, ha valamelyik tényező nulla, g(t) = 0 vagy h(t) = 0 következik; vagyis t pontosan akkor gyöke az f polinomnak, ha vagy g-nek, vagy h-nak (esetleg mindkettőnek) gyöke. Legyen t1 az f nem azonosan nulla polinom egy gyöke, és legyen f (x) = (x − − t1 )q1 (x). Ha q1 -nek van gyöke, és az mondjuk t2 , akkor a hozzá tartozó gyöktényező q1 -ből ugyanúgy kiemelhető, és ekkor f (x) = (x − t1 )(x − t2 )q2 (x), ahol q2 már f -nél kettővel alacsonyabb fokú polinom. Az eljárást tovább folytathatjuk a q2 polinommal, feltéve, hogy van gyöke. Mivel a q1 , q2 , . . . polinomok foka egyre csökken, előbb vagy utóbb eljutunk az f (x) = (x − t1 )(x − t2 ) · · · (x − tk )qk (x)
(3.5)
felíráshoz, ahol a qk polinomnak már nincsen gyöke, ha másért nem, azért, mert az már nulladfokú. Világos, hogy ekkor t1 , t2 , . . . , tk az f összes gyöke, és a két oldalon a fokokat összehasonlítva kapjuk, hogy k 6 deg(f ). Igaz tehát a következő állítás: 3.2. Tétel. Minden nem azonosan nulla polinomnak legfeljebb annyi gyöke van, mint amennyi a foka. A teljesség kedvéért megemlítjük, hogy az azonosan nulla polinomnak T minden 46
elemét gyökének tekintjük. Ha a (3.5) gyöktényezős alakban a t1 , t2 , . . . , tk gyökök között valamely ti többször is előfordul, akkor azt mondjuk, hogy ti többszörös gyöke f -nek. Pontosabban, ha ti előfordulásainak száma s, akkor ti -t f s-szeres gyökének mondjuk. 3.3. Tétel (Polinomok azonossági tétele). Ha két legfeljebb n-ed fokú polinom helyettesítési értékei több mint n különböző helyen megegyeznek, akkor a két polinom egyenlő. Bizonyítás. Ha az f és g polinomok b helyen vett helyettesítési értékei megegyeznek, akkor f (b) = g(b), azaz f (b)−g(b) = 0. Ez utóbbit úgy is mondhatjuk, hogy b gyöke az f − g polinomnak. Ha f és g helyettesítési értékei több, mint n különböző helyen megegyeznek, az azt jelenti, hogy az f −g polinomnak több, mint n különböző gyöke van. De ha f és g legfeljebb n-ed fokú polinomok, akkor f − g is az, így az előző tétel értelmében f − g-nek csak úgy lehet n-nél több gyöke, ha f − g az azonosan nulla polinom, vagyis f = g. A tételből következik, hogy minden legfeljebb n-ed fokú polinom egyértelműen megadható az által, hogy megmondjuk n + 1 különböző helyen a helyettesítési értékét. Arról, hogy hogyan lehet megtalálni egy így megadott polinomot, a Numerikus módszerek című tantárgyban fog szó esni. A fejezet zárásaként megemlítjük, hogy az egész számoknál látottakhoz hasonlóan értelmezhetnénk a polinomok körében is az oszthatóságot, majd a prímpolinomok, a legnagyobb közös osztó, a legkisebb közös többszörös fogalmait. Végül a számelmélet alaptételéhez hasonló egyértelmű prímfaktorizációs tételt is bizonyíthatnánk. Jóllehet ezt itt nem tesszük meg, de az egész számoknál az említett fogalmakat úgy vezettük be, hogy minden további nélkül általánosítható legyen akár polinomokra is (például a legnagyobb közös osztó fogalmában megkerültük a 6 relációt, stb.). Az érdeklődő olvasó erről a témakörről például a [3] és az [5] művekből tájékozódhat.
3.4. Feladatok 3.1. Feladat. Adjon meg két negyedfokú polinomot, melyek összege másodfokú! 3.2. Feladat. Osszuk el maradékosan az f polinomot a g-vel! a) f (x) = 7x4 + 2x3 + 9x2 + 5 és g(x) = x3 − x + 1 b) f (x) = −x3 + 2x2 + x + 1 és g(x) = 2x2 + 1 47
3.3. Feladat. Ellenőrizze Horner-elrendezéssel, hogy a −3 gyöke-e az f (x) = x3 − 2x2 − 11x + 12 polinomnak! Ha igen, emelje ki a hozzá tartozó gyöktényezőt! 3.4. Feladat. Végezze el Horner-elrendezés segítségével a (2x5 − 3x2 + 5ix − 3) : (x − i) polinomosztást! 3.5. Feladat. Határozza meg a c értékét úgy, hogy az f (x) = 4x3 − 3x2 − x + c polinom helyettesítési értéke az x = 1 helyen 3 legyen! 3.6. Feladat. Általában hány összeadásra és szorzásra van szükség egy n-ed fokú polinom helyettesítési értékének kiszámításához a Horner-elrendezéssel? 3.7. Feladat. Adjon meg olyan harmadfokú polinomot, melynek a gyökei: 1, 2 és i!
48
4. Algebrai egyenletek Egyenlet alatt egy F (x) = G(x) szimbólumot értünk, ahol F és G valamilyen függvényei x-nek, és ennek megoldáshalmaza alatt mindazon t-k halmazát értjük, melyek beletartoznak mind az F , mind a G függvény értelmezési tartományába, és fennáll rájuk az F (t) = G(t) egyenlőség. Az egyenlet megoldáshalmazának elemeit az egyenlet megoldásainak nevezzük. Ha két egyenlet megoldáshalma megegyezik, akkor a két egyenletet ekvivalensnek mondjuk. Azokat az „eljárásokat”, melyeket egy adott egyenleten végrehajtva vele ekvivalens egyenletet kapunk, az egyenlet ekvivalens átalakításainak nevezzük. Egy egyenlet megoldásainak megkeresése általában úgy történik, hogy az egyenletet ekvivalens átalakítások egymásutánjával olyan egyenletre vezetjük vissza, amely megoldásainak megkeresése már kevesebb gondot jelent. Mi most csak azzal az esettel foglalkozunk, amikor F (x) is és G(x) is komplex együtthatós polinomok, pontosabban polinomfüggvények. Ekkor az egyenlet mindkét oldalának ugyanazzal a nullától különböző komplex számmal való szorzása, valamint az egyenlet mindkét oldalához ugyanannak a polinomnak a hozzáadása nyilván ekvivalens átalakítások. Ez utóbbi segítségével az F (x) = G(x) egyenlet f (x) = 0 alakra hozható, ahol f (x) természetesen az F (x) − G(x) polinom. Ha f legalább elsőfokú (komplex együtthatós) polinom, akkor az f (x) = 0 egyenletet algebrai egyenletnek nevezzük. Az algebrai egyenlet fokán az f polinom fokát értjük. Világos, hogy a t komplex szám pontosan akkor lesz megoldása az egyenletnek, ha t az f polinom gyöke, azaz f (t) = 0. Emiatt az egyenlet megoldásait az egyenlet gyökeinek is szokás nevezni. A következő tétel garantálja, hogy minden algebrai egyenletnek van megoldása a komplex számok halmazában. 4.1. Tétel (Az algebra alaptétele). Minden legalább elsőfokú komplex együtthatós polinomnak van gyöke. A tétel és (3.5) szerint tehát az f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 komplex együtthatós legalább elsőfokú polinom felírható f (x) = an (x − t1 )(x − t2 ) · · · (x − tn )
49
(4.1)
alakban, ahol a t1 , t2 , . . . , tn komplex számok az f gyökei. Az f polinom ezen alakját f gyöktényezős alakjának nevezzük. Az is világos, hogy t1 , t2 , . . . , tn megoldásai az f (x) = 0 egyenletnek, és a 3.2. tétel szerint más megoldás nincs. Természetesen a t1 , t2 , . . . , tn számok nem feltétlenül páronként különbözők, ami azt jelenti, hogy egy algebrai egyenlet megoldáshalmazának számosságáról csak annyit állíthatunk, hogy az nem lehet nagyobb az egyenlet fokánál. Az viszont igaz, hogy minden, legalább elsőfokú komplex együtthatós polinom pontosan annyi (nem feltétlenül különböző) elsőfokú polinom szorzatára bomlik, mint amennyi a polinom foka. Az (x − t1 )(x − t1 ) · · · (x − tn ) szorzatot kifejtve, egy olyan b0 xn − b1 xn−1 + · · · + (−1)n−1 bn−1 x + (−1)n bn polinomot kapunk, ahol: b0 = 1; b1 = t1 + t2 + · · · + tn ; b2 = t1 t2 + · · · + t1 tn + t2 t3 + · · · + tn−1 tn ; .. . bn = t 1 t 2 · · · t n . Szavakba öntve, a bk számot úgy kapjuk, hogy a t1 , t2 , . . . , tn gyökök közül kiválasztunk k darabot az összes lehetséges módon úgy, hogy egyet csak egyszer választunk, majd a kiválasztottakat összeszorozzuk, a kapott szorzatokat pedig összeadjuk. A (4.1) egyenlőség bal és jobb oldalán álló polinomok együtthatóit összevetve azt kapjuk, hogy bk = (−1)k
an−k . an
Erre a képletre a polinom gyökei és együtthatói közötti összefüggésként szokás hivatkozni. Ha például az ax2 + bx + c = 0 másodfokú egyenlet megoldásai x1 és x2 , akkor a fenti képletből a jól ismert x1 + x2 = −
b a
és
formulákat kapjuk.
50
x1 · x2 =
c a
4.1. Algebrai egyenletek megoldóképlete A következőkben azt vizsgáljuk, hogyan lehet egy általános algebrai egyenlet megoldásait megtalálni. Egy algebrai egyenlet megoldóképletén olyan formulát értünk, amely a négy alapművelet és a gyökvonás segítségével az egyenlet együtthatóiból előállítja az összes megoldást. Például az ax+b = 0 elsőfokú egyenlet esetén csupán kivonás és osztás segítségével megkapható az egyetlen megoldás: b x=− , a tehát ez a megoldóképlet. 4.1.1. Másodfokú algebrai egyenletek A másodfokú egyenletek megoldóképletével már középiskolában is találkoztunk, ott azonban az egyenlet együtthatói valós számok voltak, és a képlet csak akkor működött, ha nem negatív számból kellett négyzetgyököt vonni. Tekintsük most az ax2 + bx + c = 0 másodfokú egyenletet (itt a, b, c már komplex számok), és szorozzuk meg mindkét oldalát 4a-val: 4a2 x2 + 4abx + 4ac = 0. A bal oldalon teljes négyzetté egészítést végezve kapjuk, hogy (2ax + b)2 − b2 + 4ac = 0, amiből (2ax + b)2 = b2 − 4ac adódik. Ebből látható, hogy 2ax + b a D = b2 − 4ac komplex szám valamely négyzetgyökével kell, hogy egyenlő legyen. Ha D = 0, akkor 2ax + b = 0, így x=−
b 2a
az egyetlen megoldás, ha pedig D 6= 0, akkor a következő két megoldás létezik: x1 =
−b + z 2a
és
51
x2 =
−b − z , 2a
ahol z a D egyik négyzetgyöke. Az x2 − 2x + 2 = 0 egyenlet esetén például D = (−2)2 − 4 · 1 · 2 = −4, a −4 egyik négyzetgyöke 2i, így az egyenlet két megoldása x1 =
2 + 2i =1+i 2
és
x2 =
2 − 2i = 1 − i, 2
melyek helyességéről visszahelyettesítéssel könnyedén meggyőződhetünk. Módszerünk természetesen olyan másodfokú egyenletek megoldására is alkalmas, melynek együtthatói nem valós komplex számok. Ilyen esetben a megoldások meghatározása nyilván több számolással jár. 4.1.2. Harmadfokú algebrai egyenletek Ebben a részben az ax3 + bx2 + cx + d = 0 harmadfokú egyenlet megoldását tűzzük ki célul. Első lépésben osszuk el az egyenlet mindkét oldalát a-val:
c d b x3 + x2 + x + = 0, a a a
majd vezessük be az y = x + b/3a új ismeretlent, vagyis írjunk x helyére y − b/3a-t! Ekkor a hatványozások és a lehetséges összevonások elvégzése után az 3
y +
c b2 − 2 a 3a
y+
bc d 2b3 − 2+ 3 27a 3a a
= 0.
egyenlethez jutunk. Látható, hogy ebben az egyenletben már nincsen másodfokú tag, így az y 3 + py + q = 0
(4.2)
alakba írható, ahol p és q az eredeti egyenlet együtthatóiból alapműveletek segítségével kifejezhető komplex számok. Elegendő tehát a (4.2) egyenletet megoldanunk, hiszen annak megoldásaiból b/3a kivonásával megkaphatjuk az eredeti egyenlet megoldásait. Ha q = 0, akkor (4.2) bal oldalán y kiemelhető, és azt kapjuk, hogy a 0 és a −p négyzetgyökei lesznek a megoldások. A p = 0 esetben pedig a megoldások pontosan a −q köbgyökei. Marad tehát az az eset, amikor sem p, sem q nem nulla. Legyenek u és v tetszőleges komplex számok. Ekkor (u + v)3 = u3 + 3u2 v + 3uv 2 + v 3 ,
52
ahonnan rendezés után (u + v)3 − 3uv(u + v) − (u3 + v 3 ) = 0 adódik. Összevetve ezt a (4.2) egyenlettel arra a következtetésre jutunk, hogy ha sikerülne az u és v komplex számokat megválasztani, hogy −3uv = p és −(u3 + + v 3 ) = q egyidejűleg teljesül, akkor y = u + v a (4.2) egyenlet megoldása lenne. Az első egyenlet köbre emelése, majd rendezése, valamint a második egyenlet rendezése után az p 3 u3 v 3 = − 3 3 3 u + v = −q egyenletrendszerhez jutunk. A másodfokú egyenletek gyökei és együtthatói közötti összefüggés alapján elmondható, hogy a z 2 + qz −
p 3 3
=0
olyan másodfokú egyenlet, melynek megoldásai pontosan u3 és v 3 . Nincs más hátra tehát, mint ezt a másodfokú egyenletet megoldani, majd a megoldásokból köbgyököt vonni. Ha w a q 2 − 4(p/3)3 komplex szám egyik négyzetgyöke, akkor a másodfokú egyenletek megoldóképlete szerint z1 = u3 =
−q + w 2
és
z2 = v 3 =
−q − w . 2
Köbgyökvonás után u-ra is és v-re is 3-3 értéket kapunk, így a (4.2) egyenlet y = = u + v megoldására látszólag 9 komplex szám pályázik. Tudjuk, hogy 3-nál több megoldás nem lehet, ezért e 9 között biztosan vannak egybeesők. De így akár az is megtörténhetne, hogy az egybeesők száma már oly sok, hogy a módszer végül nem is adja meg (4.2) összes megoldásait. Ezen kérdések precíz tárgyalására a jegyzet keretei között nem vállalkozunk, csupán a végeredményt közöljük. Igazolható, hogy ha az u1 , u2 , u3 komplex számok az u különböző köbgyökei, akkor v1 = −
p , 3u1
v2 = −
53
p , 3u2
v3 = −
p , 3u3
választással az y 1 = u 1 + v1 ,
y2 = u2 + v2 ,
y3 = u3 + v3
komplex számok a (4.2) összes megoldásai. A módszer elmélyítése érdekében oldjuk meg az x3 + 6x2 + 6x − 13 = 0 egyenletet! Először végrehajtjuk az x = y−6/3 = y−2 helyettesítést, azaz tekintjük az 3
2
(y − 2) + 6 (y − 2) + 6 (y − 2) − 13 = 0 egyenletet, melyből a hatványozások és a lehetséges összevonások elvégzése után az y 3 − 6y − 9 = 0
(4.3)
egyenlethez jutunk. A (4.2) jelöléseit követve most p = −6 és q = −9. A következő lépés a 2
z − 9z −
−6 3
3
= z 2 − 9z + 8 = 0
másodfokú egyenlet megoldása; a megoldások: z1 = 1 és z2 = 8. Igazából nekünk csak az egyik megoldásra van szükségünk, jobbanmondva annak a köbgyökeire. A 1 komplex köbgyökei, más szóval a harmadik egységgyökök pedig u1 = 1,
√ 1 3 u2 = − + i, 2 2
√ 1 3 u3 = − + i. 2 2
Innen
4.1. ábra. A harmadik egységgyökök
54
p −6 =− = 2, 3u1 3·1 √ √ p −6 4 4(1 − 3i) √ = v2 = − =− = = −1 − 3i, √ 3 3u2 4 −1 + 3i 3 −1 2 + 2 i v1 = −
és hasonlóan kapjuk, hogy v3 = −1 +
√
3i. A (4.3) egyenlet megoldásai tehát
y1 = u1 + v1 = 1 + 2 = 3, √ ! √ √ 1 3 3 3 y2 = u2 + v2 = − + i + −1 − 3i = − − i, 2 2 2 2 √ ! √ √ 1 3 3 3 y3 = u3 + v3 = − − i + −1 + 3i = − + i, 2 2 2 2 és innen az eredeti egyenlet megoldásait úgy kapjuk, hogy mindegyikből kivonunk 2-t: x1 = 1,
√ 7 3 x2 = − − i, 2 2
√ 7 3 x3 = − + i. 2 2
4.2. ábra. Az f : R → R, f (x) = x3 + 6x2 + 6x − 13 polinomfüggvény gráfja
4.1.3. Magasabb fokú egyenletek A másod- és harmadfokú egyenletekhez hasonlóan negyedfokú egyenletekhez is lehetséges megoldóképletet konstruálni, ám annak bonyolultsága miatt inkább csak a megoldásokat a négy alapművelet és gyökvonás segítségével előállító algoritmust
55
szokás közölni. Sajnos magasabbfokú egyenletek esetén már ez sem lehetséges. 4.2. Tétel (Ruffini-Abel-tétel). Ötöd, vagy annál magasabb fokú általános algebrai egyenletnek nincs megoldóképlete. Mit tehetünk mégis? Nyilván, ha az f (x) = 0 algebrai egyenlet bal oldalán álló f polinom az f1 és f2 polinomok szorzata, akkor az egyenlet összes megoldása megkapható az f1 (x) = 0 és f2 (x) = 0 egyenletek megoldásával. Ha a két tényező közül az egyik legalább elsőfokú, akkor az egyenlet megoldása így két alacsonyabb fokú egyenlet megoldására redukálható. Speciálisan, ha valahogyan sikerülne megsejtenünk az f (x) = 0 algebrai egyenlet egy t megoldását, akkor a hozzá tartozó gyöktényezőt kiemelve az f (x) = (x − t) · q(x) egyenlőséghez jutunk, így az f (x) = = 0 egyenlet megoldását az eggyel alacsonyabb fokú q(x) = 0 egyenlet megoldására vezethetjük vissza. Mivel a q polinom előállítása akár a maradékos osztás elvégzésével, akár a Horner-elrendezéssel lehetséges, a kérdés már csak az, hogy hogyan sejthető meg az egyenlet egy megoldása. Erre csak speciális esetekben, a következő alfejezetben adunk választ.
4.2. Valós együtthatós egyenletek Ebben a részben olyan algebrai egyenletekkel fogunk foglalkozni, melyek együtthatói valós számok. Először azt fogjuk megmutatni, hogy az ilyen egyenletek nem valós megoldásai „párosával” fordulnak elő. 4.3. Tétel. Ha a t komplex szám megoldása az f (x) = 0 valós együtthatós egyenletnek, akkor t is az. Bizonyítás. Ha t megoldás, akkor f (t) = 0, melyből mindkét oldal konjugálásával kapjuk, hogy f (t) = 0, azaz an tn + an−1 tn−1 + · · · + a1 t + a0 = 0. Felhasználva, hogy összeg konjugáltja a konjugáltak összege, valamint szorzat konjugáltja a konjugáltak szorzata, n
n−1
an t + an−1 t
+ · · · + a1 t + a0 = 0
adódik. Az együtthatók most valós számok, azok konjugáltja pedig önmaga, így n
an t + an−1 t
n−1
+ · · · + a1 t + a0 = 0, 56
amely pontosan azt jelenti, hogy t gyöke az f (x) polinomnak, azaz f (t) = 0. A tétel ismeretében vizsgáljuk fölül a legalább elsőfokú valós együtthatós f polinom (4.1) gyöktényezős alakját. Ha a ti gyök egy valós szám, akkor a hozzá tartozó x − ti gyöktényező egy valós együtthatós elsőfokú polinom. Ha pedig ti nem valós szám, akkor a tétel szerint ti konjugáltja is ott van a gyökök között: legyen az mondjuk tj . Ekkor a ti -hez és tj -hez tartozó gyöktényezők szorzata (x − ti )(x − tj ) = x2 − (ti + tj )x + ti tj = x2 − (ti + ti )x + ti ti , ahol a konjugálás tulajdonságai szerint ti + ti és ti ti már valós számok. Tehát a két gyöktényező szorzata egy valós együtthatós másodfokú polinomot eredményez. Az eljárás megismételhető minden nem valós gyökpárra, így igaz a következő állítás. 4.4. Tétel. Minden legalább elsőfokú R feletti polinom felírható első- és másodfokú R feletti polinomok szorzataként úgy, hogy a másodfokú polinomok egyikének sincs gyöke a valós számok halmazában. Ha az f valós együtthatós polinom páratlan fokú, akkor (4.1) szerint gyöktényezőinek száma is páratlan. Mivel a nem valós gyökökhöz tartozó gyöktényezők párokba rendezhetők, így lennie kell olyan gyöktényezőnek is, ami pár nélkül marad, más szóval létezik valós gyök. 4.5. Tétel. Minden páratlan fokú valós együtthatós algebrai egyenletnek van valós megoldása (vagyis olyan megoldása, amely valós szám). Ha jól meggondoljuk, ez az állítás következik az alábbi, kalkulusból ismert tételből is. 4.6. Tétel (Bolzano-tétel). Legyen f : [a, b] → R. Ha f folytonos, és f (a) 6= f (b), akkor minden olyan λ valós számhoz, amely az f (a) és az f (b) által meghatározott nyílt intervallumban van, létezik olyan x0 ∈]a, b[, amelyre f (x0 ) = λ. Nyilván, az f valós együtthatós polinomfüggvény folytonos, és ha f páratlan fokú, akkor limx→−∞ f (x) = −∞ és limx→+∞ f (x) = +∞ miatt vannak olyan a és b valós számok, hogy f (a) < 0 és f (b) > 0. Ekkor λ = 0 választással a Bolzanotétel állítása pontosan az, hogy az f függvénynek van zérushelye az ]a, b[ nyílt intervallumban, azaz az f (x) = 0 egyenletnek van ott megoldása. 4.7. Tétel (Racionális gyökteszt). Az f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 = 0 57
4.3. ábra. A Bolzano-tétel szemléltetése egész együtthatós algebrai egyenletnek az r racionális szám csak akkor megoldása, ha r felírható
u v
alakban, ahol u az a0 -nak, v pedig az an -nek osztója.
Bizonyítás. Minden r racionális szám felírható
u v
alakban, ahol u és v egész számok,
v 6= 0, továbbá lnko(u, v) = 1. Tegyük fel, hogy r megoldása a fenti egyenletnek, azaz an
u n v
+ an−1
u n−1 v
+ · · · + a1
u + a0 = 0. v
Mindkét oldalt szorozva v n -nel az an un + an−1 un−1 v + · · · + a1 uv n−1 + a0 v n = 0 egyenlőséget kapjuk. Az egyenlőség jobb oldala osztható v-vel, így a bal oldal is. Ott viszont a másodiktól kezdődően minden tag osztható v-vel, így az elsőnek is oszthatónak kell lennie v-vel. Mivel a feltevés szerint u és v relatív prímek, ez csak úgy lehet, ha v osztója an -nek. Ugyanezt az analízist elvégezve az u-val való oszthatóságra, kapjuk, hogy u osztója kell legyen az a0 -nak. Megjegyezzük, hogy a racionális gyökteszt racionális együtthatós algebrai egyenletekre is alkalmazható, ugyanis az egyenlet mindkét oldalát a nevezők legkisebb közös többszörösével megszorozva vele ekvivalens egész együtthatós algebrai egyenletet kapunk. Alkalmazva a racionális gyöktesztet az x4 − 2x3 − x + 2 = 0
58
negyedfokú egyenlet racionális gyökeinek megkeresésére azt kapjuk, hogy ha az egyenletnek van racionális megoldása, akkor annak tovább nem egyszerűsíthető alakja csak olyan
u v
tört lehet, ahol u | 2 és v | 1. Tehát u ∈ {−2, − 1, 1, 2}
melyből
v ∈ {−1, 1},
és
u ∈ {−2, − 1, 1, 2} v
adódik. Hogy ezek közül melyik lesz valóban megoldás, arról a Horner-elrendezés segítségével győződünk meg: 1
−2
0
−1
2
Megoldás?
−2
1
−4
8
−17
36
−
−1
1
−3
3
−4
6
−
1
1
−1
−1
−2
0
X
2
1
0
0
−1
0
X
Az egyenlet összes racionális megoldásai tehát az 1 és 2. Reménykedünk abban, hogy az olvasóban is felmerült az igény az egyenlet összes megoldásának megkeresésére. Ehhez először kiemeljük az x − 1 és x − 2 gyöktényezőket. Az x − 1 kiemelése a fenti táblázat 1-hez tartozó sora segítségével történhet: x4 − 2x3 − x + 2 = (x − 1)(x3 − x2 − x − 2).
(4.4)
Az x − 2 gyöktényező x3 − x2 − x − 2 harmadfokú polinomból történő kiemeléséhez egy újabb Horner-táblát készítünk:
2
1
−1
−1
−2
1
1
1
0
Innen következik, hogy x3 − x2 − x − 2 = (x − 2)(x2 + x + 1), melyet (4.4)-be helyettesítve végül x4 − 2x3 − x + 2 = (x − 1)(x − 2)(x2 + x + 1) adódik. Az egyenlet további megoldásai tehát pontosan az x2 +x+1 = 0 másodfokú 59
egyenlet megoldásai, melyek megkeresését már nyugodt szívvel bízzuk az olvasóra.
4.4. ábra. Az f : R → R, f (x) = x4 − 2x3 − x + 2 polinomfüggvény gráfja
4.2.1. Egy közelítő módszer A fejezetet egy olyan módszer ismertetésével zárjuk, mely már nemcsak algebrai egyenletekre alkalmazható, hanem minden olyan f (x) = 0 egyenletre, ahol f egy [a; b] intervallumon értelmezett, valós értékű, folytonos függvény. Ez a módszer már kivezet a diszkrét matematika tárgyköréből, célunk vele csupán példát adni arra, hogy céljaink elérése érdekében a diszkrét matematika és a kalkulus hogyan léptethető párbeszédbe. Keressünk olyan x1 és x2 pontokat az [a; b] intervallumban, melyekre f (x1 ) és f (x2 ) előjele különböző. Ha nincsenek ilyen pontok, akkor az egyenletnek nyilván nincs megoldása az [a, b] intervallumban. Ha vannak, akkor a Bolzano-tétel értelmében az x1 és x2 végpontú nyílt intervallum tartalmaz megoldást. Vegyük az intevallum felezőpontját: legyen x3 =
x1 +x2 . 2
Az f (x3 ) előjele az f (x1 ) és f (x2 ) előjeleinek
egyikétől biztosan különbözik, így a Bolzano-tétel szerint vagy az x1 és x3 , vagy az x2 és x3 végpontú nyílt intervallumban van megoldása az egyenletnek, és ezen intervallum hossza fele az x1 és x2 végpontú intervallum hosszának. Megismételve az eljárást, az n-edik lépésben már egy
|x1 −x2 | 2n−1
hosszúságú intervallumot kapunk,
amely biztosan tartalmazza az egyenlet egy megoldását. Világos, hogy ha n tart a végtelenbe, akkor az intervallumok hosszainak sorozata tart nullához, azaz az hxn i sorozat az egyenlet egy megoldásához konvergál. Fontos megjegyezni, hogy ez az úgynevezett intervallumfelezés módszere véges sok lépésben általában nem 60
4.5. ábra. Az intervallumfelezéses eljárás első négy lépése vezet pontos megoldáshoz, csak közelíti azt. Emiatt előírunk egy pontosságot, és az iterációt mindaddig végezzük, amíg a keletkező intervallum hossza (és ezáltal az intervallum bármely pontjának a pontos megoldástól való távolsága) kisebb nem lesz, mint az előírt pontosság. Példaként keressünk az f (x) = x3 + ln x − 5 = 0 egyenletnek megoldását az [1; 2] intervallumon, 0,1 pontossággal! Mivel f (1) = −4 és f (2) = 3,6931, így valóban van megoldás az ]1; 2[ intervallumon. Legyen x1 = 1, x2 = 2 és x3 pedig a felezőpont: x3 = 1,5. Ekkor f (1,5) = −1,2195, és lévén f (1,5) negatív, f (2) pedig pozitív, így az ]1,5; 2[ intervallum biztosan tartalmazza az egyenlet egy megoldását. Legyen x4 =
1,5+2 2
= 1,75 az ]1,5; 2[ intervallum felezőpontja. Most az f (1,75) =
= 0,919 előjelét figyelve megállapítható, hogy a ]1,5; 1,75[ intervallumban garantáltan van megoldás; az eljárást ennek az intervallumnak a felezésével folytatjuk: legyen x6 =
1,5+1,75 2
= 1,625. Mivel f (1,625) = −1,1944, most újra az interval-
lum kezdőpontját cseréljük le: az ]1,625; 1,75] lesz a megoldást biztosan tartalmazó intervallum. Ennek felezőpontja x7 = 1,6875, és mivel f (1,6875) = −0,7178, így a megoldást tartalmazó intervallum az ]1,6875; 1,75[ nyílt intervallumra szűkül. Ennek az intervallumnak a hossza már kisebb, mint 0,1, így megállhatunk: az intervallum bármelyik pontja közelebb van az egyenlet egy megoldásához, mint 0,1.
61
4.6. ábra. Az f : R → R, f (x) = x3 + ln x − 5 függvény gráfja az [1; 2] intervallum fölött
4.3. Feladatok 4.1. Feladat. Oldjuk meg a komplex számok halmazán az alábbi egyenleteket! a) 3x2 − 2x + 1 = 0 b) x2 + 2x + 5 = 0 c) x2 + (−4 + 3i)x + 1 − 5i = 0 d) (2 + i)x2 − (5 − i)x + 2 − 2i = 0 e) x3 − 9x2 + 18x + 28 = 0 f) x3 − 3ix2 + 3x − i = 0 g) x3 − 6x + 4 = 0 4.2. Feladat. Határozzuk meg a következő egyenletek racionális gyökeit! a) x3 − 2x2 + x − 2 = 0 b) 2x4 − 3x2 + 5x − 4 = 0 c) x4 − 32 x3 + 3x2 − 6x − 4 = 0 4.3. Feladat. Oldja meg az alábbi egyenleteket a komplex számok halmazán! a) x4 − 8x3 + 18x2 − 27 = 0 a) x4 − 4x3 − 8x + 32 = 0 62
4.4. Feladat. Oldja meg az x3 − x − 2 = 0 egyenletet algebrai és intervallumfelezéses módszerekkel, az utóbbinál 0,1 pontossággal! Hány további lépésre lenne még szükség a 0,01 pontosság eléréséhez? Segítségül megmutatjuk az f : R → R, f (x) = x3 − x − 2 polinomfüggvény gráfját (4.7. ábra).
4.7. ábra. Az f : R → R, f (x) = x3 − x − 2 polinomfüggvény gráfja
63
5. Algebrai struktúrák Az előző fejezetekben gyakran előfordult, hogy bevezettünk valamilyen új objektumot (számot, polinomot, stb.), majd azokon műveleteket értelmeztünk. Ebben a fejezetben megpróbálunk az objektumoktól elvonatkoztatni, és csak a műveletekre, valamint azok tulajdonságaira koncentrálni. Először azt tisztázzuk, mit is értünk műveleten. A matematikában műveletvégzéskor tulajdonképpen az történik, hogy egy halmazból veszünk két elemet (ettől lesz kétváltozós a művelet), és ahhoz hozzárendeljük ugyanazon halmaz valamely elemét. Az S nemüres halmazon értelmezett kétváltozós műveleten tehát egy f: S×S →S függvényt értünk. Ily módon az egész számok halmazán az összeadáson, a szor-
5.1. ábra. Az S halmazon értelmezett kétváltozós művelet S bármely két eleméhez egyértelműen hozzárendel egy szintén S-beli elemet záson, és a kivonáson kívül művelet lesz például a legnagyobb közös osztó képzése is. De nem lesz művelet az osztás, hiszen az nem hajtható végre bármely két egész számmal. Megjegyezzük, hogy f helyett általában valamilyen „műveleti jelet” (+ +, ·, ∪, ∩, ?, ∗, . . . ) írunk, és ekkor f (a, b) helyett pedig az a + b, a · b, a ∪ b, a ∩ b, a ? ? b, a ∗ b, . . . szimbólumot használjuk. Az S halmazt a rajta értelmezett f1 , f2 , . . . műveletekkel együtt algebrai struktúrának nevezzük, és erre az (S, f1 , f2 , . . . ) jelölést alkalmazzuk. Legutóbb például a (T [x], +, ·) algebrai struktúrát ismertük meg, ahol T [x] a T feletti (T alatt egyelőre még mindig a racionális, valós, vagy komplex számok halmazának valamelyikét értjük) összes polinomok halmazát jelöli, a + és a · szimbólumok pedig a rajta értelmezett összeadást, illetve szorzást. Azt mondjuk, hogy az S halmazon értelmezett ∗ művelet asszociatív, ha minden
64
a, b, c ∈ S esetén (a ∗ b) ∗ c = a ∗ (b ∗ c) teljesül. Asszociatív művelet például az összeadás és a szorzás az egész számok halmazán, az összeadás és a szorzás a polinomok halmazán, az összeadás és a szorzás a komplex számok halmazán, az unió egy nemüres halmaz hatványhalmazán, a függvények kompozíciója, stb. Viszont a kivonás az egész számok halmazán, az osztás a nemnulla valós számok halmazán, a vektoriális szorzás a 3 dimenziós euklideszi tér vektorain már nem asszociatív műveletek. A következő tétel azt állítja, hogy asszociatív művelet esetén a zárójelezés szabadsága nemcsak három, hanem tetszőleges számú elemre fennáll. 5.1. Tétel. Ha az S halmazon értelmezett ∗ művelet asszociatív, akkor véges sok elemen végrehajtott művelet eredménye független a zárójelezéstől. Bizonyítás. Legyen n > 3 és a1 , a2 , . . . , an ∈ S, és legyen A = (. . . ((a1 ∗ a2 ) ∗ a3 ) ∗ · · · ) ∗ an , továbbá jelölje az a1 , a2 , . . . , an elemeknek egy tetszőleges zárójelezés melletti műveleti eredményét B. Az n szerinti teljes indukcióval megmutatjuk, hogy A = B. Ez n = 3-ra az asszociativitás következménye. Most tegyük fel, hogy n > 3, és az állítás igaz minden háromnál nagyobb vagy egyenlő és n-nél kisebb természetes számra. Világos, hogy B felírható C ∗ D alakban, ahol C és D legfeljebb n − 1 elem valamilyen zárójelezés melletti eredménye. Ha a D kifejezés csak az an elemet tartalmazza, akkor B = C ∗ an , és az indukciós feltevést alkalmazva C-re B = A adódik. Ha pedig D legalább 2 elemet tartalmaz, akkor az indukciós feltevés szerint D = E ∗ an , ahol E-ben az elemek száma már csak legfeljebb n − 2. Alkalmazva az asszociativitást, majd az indukciós feltevést C ∗ E-re, kapjuk, hogy B = C ∗ D = C ∗ (E ∗ an ) = (C ∗ E) ∗ an = = (. . . ((a1 ∗ a2 ) ∗ a3 ) ∗ · · · ) ∗ an = A.
Azt mondjuk, hogy az (S, ∗) algebrai struktúra félcsoport, ha ∗ asszociatív. Ilyen például az (N, +) és az (N, ·), stb.
65
Legyen ∗ az S halmazon értelmezett művelet. Ha S-ben van olyan e elem, hogy e ∗ a = a és a ∗ e = a teljesülnek minden a ∈ S esetén, akkor ezt az e elemet (a ∗ műveletre vonatkozó) neutrális elemnek nevezzük. Ha a művelet összeadás, akkor a neutrális elemet zéruselemnek, míg szorzás esetén egységelemnek is nevezzük. Például – az N, Z, Q, R, C halmazokon értelmezett összeadás és szorzás neutrális elemei rendre a 0 és az 1; – a T feletti polinomok körében értelmezett összeadás és szorzás neutrális elemei rendre az azonosan nulla polinom és az f (x) = 1 polinom; – egy H halmaz hatványhalmaza felett értelmezett unió műveletének a neutrális eleme az üres halmaz; – az egész számok körében értelmezett legnagyobb közös osztó műveletének neutrális eleme a 0. Könnyen belátható, hogy egy algebrai struktúrában műveletenként legfeljebb egy neutrális elem lehet, ugyanis ha e és f is neutrális elemek volnának a ∗ műveletre nézve, akkor egyrészt e ∗ f = e, másrészt e ∗ f = f , melyekből a művelet eredményének egyértelműsége miatt e = f következik. Legyen ∗ az S halmazon értelmezett művelet, melyre vonatkozó neutrális elem az e. Azt mondjuk, hogy az S halmaz a elemének létezik inverze, ha van olyan x ∈ S, hogy a ∗ x = x ∗ a = e teljesül. Ekkor az x elemet az a inverzének nevezzük és a−1 -gyel jelöljük. Ha a művelet összeadás, akkor az a elem inverzét szokás −a val is jelölni és az a ellentettjének nevezni. Ha a művelet a szorzás, akkor az inverz elemet gyakran reciproknak hívjuk. A (Z, +) és (Z, ·) félcsoportok közül az elsőben a 2 inverze a −2, a másodikban azonban a 2 elemnek nem létezik inverze. Könnyű látni, hogy (Z, +) algebrai struktúrában minden elemnek van inverze, a (Z, ·)-ban csak a −1 és 1 elemeknek létezik inverzük, és mindkettőnek az inverze önmaga. 5.2. Tétel. Legyen (S, ∗) neutrális elemmel rendelkező félcsoport. Ekkor: 1. S minden elemének legfeljebb egy inverze van. 2. Ha az a ∈ S-nek létezik inverze, akkor a−1 -nek is és (a−1 )−1 = a. 3. Ha az a és b S-beli elemeknek létezik inverzük, akkor a∗b-nek is és (a∗b)−1 = = b−1 ∗ a−1 . 66
Bizonyítás. 1. Tegyük fel, hogy b és c az a elem inverzei. Ekkor b ∗ a = a ∗ b = e és c ∗ a = = a ∗ c = e és c = c ∗ e = c ∗ (a ∗ b) = (c ∗ a) ∗ b = e ∗ b = b. 2. Mivel a ∗ a−1 = a−1 ∗ a = e, így a tényleg inverze a−1 -nek, és az előző pont értelmében nem létezik másik inverz. 3. Az asszociativitás miatt (a ∗ b) ∗ (b−1 ∗ a−1 ) = a ∗ ((b ∗ b−1 ) ∗ a−1 ) = = a ∗ (e ∗ a−1 ) = a ∗ a−1 = e, és hasonlóan kapjuk azt is, hogy (b−1 ∗ a−1 ) ∗ (a ∗ b) = e. Az S halmazon értelmezett ∗ művelet kommutatív, ha minden a, b ∈ S esetén a ∗ b = b ∗ a. Ahogy azt a következő tétel mutatja, a kommutativitás és asszociativitás együtt egy igen kényelmes számolási lehetőséget biztosít. 5.3. Tétel. Kommutatív félcsoportban véges sok elemen végrehajtott művelet eredménye sem a zárójelezéstől, sem az elemek sorrendjétől nem függ. Bizonyítás. Nyilván, ha a műveletet véges sok elemen hajtjuk végre, abban bármely két szomszédos elem sorrendje felcserélhető, ugyanis az előző tétel miatt a zárójelezést irányíthatjuk úgy, hogy először a szóbanforgó két elemen kelljen a műveletet elvégezni, majd arra a két elemre alkalmazhatjuk a kommutativitást. Mivel szomszédos elemek véges sokszori felcserélésével az elemek bármely sorrendjéhez el lehet jutni (lásd buborékrendezés), az állítás igaz. Azt mondjuk, hogy az (S, ∗) algebrai struktúra csoport, ha ∗ asszociatív, S-nek van neutrális eleme és S minden elemének létezik inverze. Ha az (S, ∗) csoportban ∗ kommutatív, akkor a csoportot kommutatív csoportnak vagy Abel-csoportnak nevezzük. Például a (Z, +), (Q, +), (Q\{0}, ·) (Miért kell kivenni a nullát?), (T [x], +) algebrai struktúrák mindegyike Abel-csoport. Nemkommutatív csoportokra a későbbiekben fogunk példát mutatni. Megjegyezzük, hogy az 5.2. tétel 3. része miatt egy neutrális elemmel rendelkező S félcsoport invertálható elemeinek halmaza csoportot alkot a félcsoport műveletére
67
nézve. Ezt a félcsoport egységcsoportjának nevezzük, és U (S)-sel jelöljük. Például U (Z) = {−1, 1}. Könnyen látható, hogy ha csak a páros (2-vel osztható) egészek halmazát tekintjük, az szintén csoportot alkot az egész számok összeadására nézve, ugyanis két páros szám összege is páros, a 0 is páros, és minden páros szám ellentettje is páros. Legyen (G, ∗) csoport és H egy részhalmaza a G-nek. Azt mondjuk, hogy H részcsoportja G-nek, ha (H, ∗) is csoport, azaz H maga is csoportot alkot a G-beli csoportműveletre nézve. Mint az imént láttuk, a (Z, +) csoportnak a páros számok halmaza részcsoportja. Annak eldöntése, hogy egy részhalmaz részcsoport-e vagy sem, általában az alábbi tétel segítségével történik: 5.4. Tétel (Részcsoport-kritérium). A (G, ∗) csoport H nemüres részhalmaza akkor és csak akkor részcsoport, ha a−1 ∗ b ∈ H bármely a, b ∈ H esetén. Bizonyítás. Definíció szerint, ha H részcsoport, akkor bármely a, b ∈ H esetén a−1 , továbbá a−1 ∗ b szintén elemei H-nak. Fordítva, tegyük fel, hogy a−1 ∗ b ∈ H tetszőleges a, b ∈ H esetén. A b helyett a-t választva kapjuk, hogy e = a−1 ∗ a is benne van a H-ban, és ha b helyett e-t írunk, akkor azt kapjuk, hogy a−1 ∗ e = a−1 is a H-ban van, tehát H minden elemének az inverze is H eleme. Ekkor viszont választhatunk a helyett a−1 -t, így a ∗ b ∈ H adódik, tehát ∗ művelet a H halmazon. Mivel az asszociativitás öröklődik G-ből, a bizonyítás készen van. A következőkben olyan algebrai struktúrákkal foglalkozunk, melyekben már két kétváltozós művelet van. Az (S, +, ·) algebrai struktúrát gyűrűnek nevezzük, ha a következő tulajdonságok mindegyike teljesül: 1. (S, +) Abel-csoport; 2. minden a, b, c ∈ S esetén a · (b + c) = a · b + a · c
és
(b + c) · a = b · a + c · a,
azaz a szorzás az összeadásra nézve mindkét oldalról disztributív. Megjegyezzük, hogy a gyűrűműveletek nem feltétlenül az összeadás és a szorzás kell, hogy legyenek, de mivel a legtöbb esetben mégis azok, nem tartottuk indokoltnak a definícióban absztrakt műveleti jelek használatát. Gyűrűk például a (Z, +, ·), (R, +, ·), (T [x], +, ·) és a (P (H), 4, ∩) algebrai struktúrák. Ez utóbbinál H egy
68
nemüres halmaz, P (H) a H hatványhalmaza, 4 pedig a halmazok szimmetrikus különbsége, azaz A4B = (A \ B) ∪ (B \ A). Itt most a szimmetrikus különbség játssza az összeadás, míg a metszet pedig a szorzás szerepét.
5.2. ábra. Gyűrűben bármely két elem összege mellett azok szorzata is eleme a gyűrűnek
Teljes indukcióval könnyen bizonyítható, hogy egy gyűrű tetszőleges a1 , . . . , am , b1 , . . . , bn elemeire érvényes, hogy m X
! ai
i=1
·
n X
bj =
j=1
m X n X
ai · bj .
i=1 j=1
Azt mondjuk, hogy a gyűrű asszociatív, ha a · asszociatív; kommutatív, ha a · kommutatív; egységelemes, ha (S, ·)-nak van neutrális eleme. A részcsoportokéhoz hasonlóan értelmezzük a részgyűrű fogalmát. Azt mondjuk, hogy az R gyűrű egy H részhalmaza részgyűrűje R-nek, ha maga is gyűrű az R-beli gyűrűműveletre nézve. 5.5. Tétel (Részgyűrű-kritérium). A (R, +, ·) gyűrű H nemüres részhalmaza akkor és csak akkor részgyűrű, ha bármely a, b ∈ H esetén a − b és a · b is elemei H-nak. Részgyűrűje például a páros számok halmaza az egész számoknak, az egész számok a valós számoknak, a valós számok a komplex számoknak a szokásos műveletekre nézve. Most az egész számok bizonyos részhalmazai segítségével konstruálunk újabb gyűrűket. Legyen m egy rögzített, egynél nagyobb egész szám, és legyen Zm = {0, 1, . . . , m − 1}. Definiáljuk a Zm halmazon az összeadást és a szorzást a következőképpen: a + m b, illetve a · m b alatt az a + b, illetve ab egész m-mel való osztási maradékát értjük. Az 69
egész számokra vonatkozó maradékos osztás tétele és annak következményei miatt +m és ·m műveletek a Zm halmazon, sőt, Zm kommutatív és asszociatív egységelemes gyűrű, melyet az egész számok modulo m szerinti maradékosztály gyűrűjének hívunk. Az 5.3 ábrán megmutatjuk Z2 , az 5.4. ábrán pedig a Z6 összeadó- és szorzótábláját. +2 0 1
0 0 1
·2 0 1
1 1 0
0 0 0
1 0 1
5.3. ábra. Z2 összeadó- és szorzótáblája
+6 0 1 2 3 4 5
0 0 1 2 3 4 5
1 1 2 3 4 5 0
2 2 3 4 5 0 1
3 3 4 5 0 1 2
4 4 5 0 1 2 3
·6 0 1 2 3 4 5
5 5 0 1 2 3 4
0 0 0 0 0 0 0
1 0 1 2 3 4 5
2 0 2 4 0 2 4
3 0 3 0 3 0 3
4 0 4 2 0 4 2
5 0 5 4 3 2 1
5.4. ábra. Z6 összeadó- és szorzótáblája Az (R, +, ·) gyűrű egy nullától különböző a elemét nullosztónak nevezzük, ha van olyan nullától különböző b ∈ R, hogy a · b = 0 vagy b · a = 0. Az R gyűrű nullosztómentes, ha nem tartalmaz nullosztót. Könnyű látni, hogy a Z6 gyűrűben 2 · 6 3 = 0, tehát a 2 és a 3 nullosztók. A kommutatív, asszociatív, egységelemes, nullosztómentes gyűrűket integritás-tartományoknak is nevezzük. Emlékezzünk vissza, hogy a valós számok nullosztómentességét erősen kihasználtuk például az x3 − x = 0 egyenlet megoldásakor. Ugyanis a bal oldalt szorzattá alakítva x(x2 − 1) = 0 adódik, ahonnan, mivel a valós számok körében egy szorzat csak akkor 0, ha valamelyik tényezője 0, mondtuk, x = 0 vagy x2 − 1 = 0 következik. A gondolatmenet helyessége abból következik, hogy ha egy R gyűrű valamely a elemének van inverze a szorzásra nézve, akkor az nem lehet nullosztó. Ugyanis ha a mégis nullosztó lenne, akkor lenne olyan b ∈ R \ {0} elem, hogy ab = 0. Az egyenlet mindkét oldalát a−1 -gyel balról megszorozva b = 0 adódik, ami ellentmondás. Mivel a valós számok körében minden nullától különböző elemnek van inverze, ezért R tényleg nem tartalmaz nullosztót.
70
Az (R, +, ·) gyűrűt testnek nevezzük, ha (R \ {0}, ·) Abel-csoport. A Komplex számok című fejezet elején tulajdonképpen azt igazoltuk, hogy az R × R halmaz a rajta bevezetett összeadással és szorzással testet alkot. Belátható az is, hogy Zm pontosan akkor test, ha m prím. Legyen T egy test, és T egységelemét jelölje 1. Azt a legkisebb n pozitív egész számot, melyre 1 + · · · + 1 = 0, | {z } n db
a T test karakterisztikájának nevezzük. Ha nincs ilyen n, akkor azt mondjuk, hogy a T test karakterisztikája nulla. Világos, hogy a Q, R és a C testek karakterisztikája 0, míg a Zp test karakterisztikája p. A test nullosztómentességét kihasználva könnyen igazolható, hogy egy test karakterisztikája vagy 0, vagy prím. Ha a T test egy részhalmaza maga is testet alkot a T -beli műveletekkel, akkor azt a részhalmazt T résztestének mondjuk. A polinomok témakörén belül mindvégig rögzítve volt egy T számhalmaz, melyből a polinomok együtthatóit vettük. Ott azt mondtuk, hogy legyen T a Q, R vagy C halmazok egyike. Most utólag már azt is mondhatnánk: legyen T egy test. Az olvasóra bízzuk annak ellenőrzését, hogy a Polinomok című fejezet állításai akkor is igazak maradnak, ha T alatt a fent felsoroltaktól különböző testet értünk. Legyen most T = Z2 , és tekintsük e fölött az f (x) = x és a g(x) = x2 polinomokat. Mivel a Z2 test összesen két elemet tartalmaz, az f -hez és g-hez tartozó polinomfüggvények az f ∗ (0) = 0, f ∗ (1) = 1,
és g ∗ (0) = 02 = 0, g ∗ (1) = 12 = 1
egyenlőségek által adottak. Ezzel a példával azt akarjuk érzékeltetni, hogy különböző polinomokhoz tartozhat ugyanaz a polinomfüggvény, tehát vannak olyan körülmények, amikor polinom és polinomfüggvény között különbséget kell tenni. Könnyű belátni, hogy Z2 felett végtelen sok polinom van (pl. x, x2 , x3 , . . . ) de csak négy különböző polinomfüggvény. Végül említést teszünk egy, az informatikában különösen fontos algebrai struktúráról. Az (S, ∪, ∩) algebrai struktúrát hálónak nevezzük, ha az alábbi tulajdonságok mindegyike teljesül: 1. (S, ∪) és (S, ∩) kommutatív félcsoport,
71
2. teljesül a úgynevezett elnyelési törvény, azaz a ∪ (a ∩ b) = a és a ∩ (a ∪ b) = a fennállnak bármely a, b ∈ S-re. Hálót alkot például a H nemüres halmaz összes részhalmazaiból álló P (H) hatványhalmaz a halmazok uniójára és metszetére nézve. Sőt, ekkor az is elmondható, hogy mindkét műveletre nézve van neutrális elem (∅ és H), mindkét művelet disztributív a másikra nézve, továbbá P (H) minden eleméhez van olyan A, szintén P (H)-beli elem (ez nem lesz más, mint az H \ A), melyre igaz, hogy A ∪ A = H és A ∩ A = ∅. Az ilyen tulajdonságú hálót Boole-algebrának nevezzük, az A 7→ A egyváltozós műveletet pedig komplementer-képzésnek.
5.1. Feladatok 5.1. Feladat. Igazolja, hogy tetszőleges nemüres H halmaz félcsoport az a ∗ b = b művelettel! Van-e mindig neutrális eleme? 5.2. Feladat. Igazoljuk, hogy (Q+ , ∗) félcsoport, ahol Q+ a pozitív racionális számok halmaza és a∗b=
ab ! a+b
Van-e neutrális eleme? 5.3. Feladat. Csoport-e a (Z, ∗), ahol a + b ha a páros, a∗b= a − b ha a páratlan? 5.4. Feladat. Csoport-e a (R \ {−1}, ∗), ahol a ∗ b = a + b + ab? 5.5. Feladat. Legyen c egy rögzített pozitív valós szám. Igazolja, hogy (] − c, c[, ∗) csoport, ahol a∗b=
a+b ! 1 + ab c2
5.6. Feladat. Igazolja, hogy az (A ∪ B) \ C = (A \ C) ∪ (B \ C) és C \ (A ∪ B) = (C \ A) ∪ (C \ B)
72
egyenlőségek közül az egyik igaz tetszőleges A, B és C halmazokra, a másik nem! Ez indokolja, hogy a gyűrű fogalmában a disztributivitást mindkét oldalról megköveteljük. 5.7. Feladat. Legyen H egy nemüres halmaz, és jelölje P (H) a H összes részhalmazainak halmazát. Igazolja, hogy P (H) gyűrű, ha az összeadás a szimmetrikus differencia, a szorzás pedig a metszetképzés! 5.8. Feladat. Írja fel Z4 és Z5 összeadó- és szorzótábláját! Keressen nullosztókat és invertálható elemeket ezekben a gyűrűkben! 5.9. Feladat. Mutassa meg, hogy minden kettőtől különböző karakterisztikájú testben az x + x = 0 egyenletnek az x = 0 az egyetlen megoldása! √ 5.10. Feladat. Igazolja, hogy {a + b 5 : a, b ∈ Z} részgyűrűje (R, +, ·)-nak! 5.11. Feladat. Vegyen egy négyelemű halmazt, majd vezessen be rajta olyan összeadást és szorzást, melyre nézve testet alkot! 5.12. Feladat. Vezessen be a H = {0, 1} halmazon két kétváltozós műveletet és egy komplementer-képzést úgy, hogy az így kapott algebrai struktúra Boole-algebra legyen!
73
6. Kombinatorikai alapok Ebben a fejezetben a „hányféleképpen lehet” kezdetű kérdésekre keressük a választ.
6.1. Variáció, permutáció, kombináció Jól ismert, hogy 1 biten két különböző állapot ábrázolható, jelölje ezeket 0 és 1. Egy bájt pedig 8 bitből áll. Hány különböző állapot ábrázolható egy bájton? A
6.1. ábra. Az 1 bájton ábrázolható összes állapotok feladat egyszerű. A bájt első bitje 0 és 1 lehet, ez két lehetőség. Ugyanez igaz a második bitre is, így az első két biten ábrázolható különböző állapotok: 00, 01, 10 és 11. Folytatva a harmadik helyiértékkel, az előzőleg kapott elem után kerülhet 0 is és 1 is, ez 8 lehetőséget jelent. Folytatva az eljárást könnyen láthatjuk, hogy 8 biten 28 = 256 különböző állapot ábrázolható. A probléma a következőképpen általánosítható: Ha n darab különböző elemből kiválasztunk k darabot úgy, hogy a kiválasztás sorrendje számít, és egy elemet többször is kiválaszthatunk, akkor az n elem egy k-ad osztályú ismétléses variációját kapjuk. A fenti példában mutatott módszerrel könnyedén igazolható, hogy n elem k-ad osztályú ismétléses variációinak száma: k Vn,ism = nk .
Egy jelenleg forgalomban lévő CD lemez tárolókapacitása 700 MB. Ez t = 700 · 1024 · 1024 · 8 = 5872025600 bit, melyen 2t különböző állapot ábrázolható, vagy más szóval 2t darab különböző tartalommal megírt CD lemez létezik. Érdekes belegondolni, hogy mi történne, 74
ha ezt mind legyártanánk. Nagyrészt olyan lemezeket kapnánk, melyek tartalmát semmi nem tudná értelmezni, de köztük lenne a kedvenc lemezünk, és valamelyiken rajta lenne a jövő évszázad slágere is, melyet még meg sem írtak. Ennek a különös jelenségnek nyilván az az oka, hogy 2t egy szokatlanul nagy szám. Kicsit másabb, de hasonló gondolatmenettel kezelhető az a probléma, hogy hány különböző autó azonosítására alkalmas a Magyarországon jelenleg használatos, három betűből és három számból álló forgalmi rendszám, feltéve, hogy minden rendszám kiadható. Ha úgy vesszük, itt egy 6 hosszúságú karakter-sorozat előállítása a cél, melynek első, második és harmadik elemét 26 (az angol ábécé betűinek száma), a maradék hármat pedig 10 (a lehetséges számjegyek száma) lehetőség közül választhatjuk ki. Erre pedig 263 · 103 = 17576000 lehetőség van. Nyilván a 6, 26 és 10 számoknak nincs speciális jelentősége, így ismét próbálkozhatunk általánosítással. Ha kiválasztunk k darab elemet úgy, hogy az elsőt n1 , a másodikat n2 , és így tovább, a k-adikat nk darab elem közül választhatjuk, akkor ezen k darab elem kiválasztására n1 n2 · · · nk lehetőség van. Az elemek kiválasztásának sorrendje nyilván számít. Ha n darab különböző elemből kiválasztunk k darabot úgy, hogy a kiválasztás sorrendje számít, és egy elemet csak egyszer választhatunk, akkor az n elem egy k-ad osztályú ismétlés nélküli variációját kapjuk. Most meghatározzuk n elem k-ad osztályú ismétlés nélküli variációinak számát. Az első elemet n darab, a másodikat már csak a maradék n − 1 elem közül választhatjuk ki. A harmadikra n − 2, az utolsó, k-adik elem kiválasztására már csak n − (k − 1) lehetőségünk marad. Az eredmény tehát: Vnk = n(n − 1) · · · (n − (k − 1)). Az n nemnegatív egész faktoriálisának az 1 ha n 6 1; n! = 1 · 2 · 3 · · · n ha n > 1 egész számot nevezzük. Megjegyezzük, hogy n! rekurzívan is értelmezhető az (n + + 1)! = n!(n + 1) és 0! = 0 előírásokkal. Alkalmazva ezt a jelölést, Vnk =
n! . (n − k)!
75
Ha a kiválasztásnál mind az n darab elemet felhasználjuk (tehát k = n), akkor tulajdonképpen az n elem egy sorrendjéhez jutunk, amely nem más, mint az elemek kiválasztásának sorrendje. n darab különböző elem egy rögzített sorrendjét az n darab elem egy (ismétlés nélküli) permutációjának nevezzük. Az előbb elmondottak szerint n darab elem permutációinak száma: Pn = Vnn = n!. Tehát egy 32 lapos magyarkártya-pakli megkeverésekor 32! különböző sorrend állhat elő, amely már egy 36 jegyű szám. Ha azonban olyan kártyajátékot játszunk, melyben csak a lapok színe számít, az értéke nem, akkor egy adott keverés után azonos színű lapok sorrendjének változtatásával a lapok egy másik, de a játék szempontjából az eredetivel lényegében azonos sorrendjét kapjuk. Négy szín van, mindegyik színből nyolc lap, így a lapok egy rögzített sorrendjéhez 8!8!8!8! = (8!)4 a játék szempontjából azonos sorrend rendelhető. Ekkor a játék szempontjából különböző sorrendek száma:
32! . 8!8!8!8!
Ha n darab elem között van k1 , k2 , . . . , km egymással megegyező, akkor ezen n darab elem egy rögzített sorrendjét az n darab elem egy k1 , k2 , . . . , km típusú ismétléses permutációjának nevezzük. n darab elem k1 , k2 , . . . , km típusú ismétléses permutációinak száma: Pnk1 ,k2 ,...,km =
n! . k1 !k2 ! · · · km !
Az eddigi feladatokban a kiválasztás sorrendje fontos volt. Van azonban, amikor ez nem számít. Például az ötöslottón lényegtelen, hogy milyen sorrendben húzzuk le a számokat, csak az a fontos, hogy pont arra az ötre tippeljünk, amit majd kihúznak. Az első elemet 90 közül, a másodikat a maradék 89-ből, és így tovább, 5 = az 5. számot már csak 86 közül választhatjuk, így az öt szám kiválasztására V90
= 90·89·88·87·86 lehetőségünk van. Azonban ugyanazt az 5 számot P5 = 5! = 120 sorrendben jelölhetjük meg, és ez nyilván ugyanazon tippnek számít, így ha biztos öttalálatost szeretnék, legalább 5 V90 90 · 89 · 88 · 87 · 86 90! = = = 43949268 P5 5! 5!85!
76
darab lottószelvény kitöltése szükséges. Ha n darab különböző elemből kiválasztunk k darabot úgy, hogy a kiválasztás sorrendje nem számít, és egy elemet csak egyszer választhatunk (vagyis egy n elemű halmaznak kiválasztjuk egy k elemű részhalmazát), akkor az n elem egy k-ad osztályú ismétlés nélküli kombinációját kapjuk. n elem összes k-ad osztályú ismétlés nélküli kombinációinak száma: Cnk = Az
n! k!(n−k)!
Vnk n! . = Pk k!(n − k)!
szám jelölésére, ahol 0 6 k 6 n, az
n k
jelölést is használjuk, melyet „n alatt a k”-nak olvasunk. Ha pedig 0 6 n < k, akkor nk értékét 0-nak tekintjük, ami összhangban van azzal, hogy n különböző elem közül n-nél többet ismétlés nélkül nem lehet (0-féleképpen lehet) kiválasztani. Adósok vagyunk még azzal az esettel, amikor egy elemet többször is kiválaszthatunk. Ha n darab különböző elemből kiválasztunk k darabot úgy, hogy a kiválasztás sorrendje nem számít, és egy elemet többször is kiválaszthatunk, akkor az n elem egy k-ad osztályú ismétléses kombinációját kapjuk. k n elem k-ad osztályú ismétléses kombinációinak Cn,ism száma már nem kapha-
tó meg a fentiekhez hasonló, egyszerű okoskodással. Az általánosság nyilván nem sérül, ha azt feltételezzük, hogy az n darab elem, melyből választunk éppen az 1, 2, . . . , n számok. Válasszunk ki ezekből k darabot úgy, hogy egy elem többször is szerepelhet! Jelölje a legkisebb kiválasztott elemet a1 , a következőt a2 , és így tovább, végül a legnagyobbat ak ! Ekkor 1 6 a1 6 a2 6 a3 6 · · · 6 ak 6 n, ahol az ismétlés miatt egyenlőség is előfordulhat. Továbbá, a b1 = a1 ,
b2 = a2 + 1,
b3 = a3 + 2,
...,
bk = ak + (k − 1)
elemek között már nincsenek egyenlőek és 1 6 b1 < b2 < b3 < · · · < bk 6 n + k − 1, tehát a b1 , b2 , . . . , bk elemek tekinthetők úgy, mintha az 1, 2, . . . , n + k − 1 elemek közül választottuk volna ki őket ismétlés nélkül. Az olvasó könnyen beláthatja, 77
hogy ez a hozzárendelés megfordítható, azaz n darab elem minden k-ad osztályú ismétléses kombinációja n + k − 1 darab elem pontosan egy k-ad osztályú ismétlés nélküli kombinációjához tartozik. Így k Cn,ism
=
k Cn+k−1
=
n+k−1 . k
A hanyag postás tehát, aki a szórólapok kiosztását esetlegesen végzi, 6 egyforma szórólapot 10 postaládába 6 6 C10,ism = C15 =
15 6
= 5005
-féleképpen tud elhelyezni, ugyanis mind a 6 szórólap elhelyezéséhez a 10 postaláda közül választ egyet, nem törődve azzal, hogy esetleg valamelyikbe többet is dob, így valóban 10 elem 6-od osztályú ismétléses kombinációjáról van szó.
6.2. Binomiális és polinomiális tétel Az (x + y)2 = x2 + 2xy + y 2 azonosság jól ismert, és könnyen ellenőrizhető. Most képletet adunk (x + y)n kiszámítására tetszőleges n nemnegatív egész esetén. Világos, hogy (x + y)n olyan n tényezős szorzat, melynek minden tényezője x + y: (x + y)(x + y) · · · (x + y) . | {z }
(6.1)
n darab tényező
Ha alkalmazzuk a disztributivitást, és minden tagot minden taggal megszorzunk, az eredmény egy olyan összeg lesz, melynek minden tagja xk y l alakú, ahol k + + l = n. Most megszámoljuk, hány esetben kapjuk az xk y n−k szorzatot. Ilyen tag úgy áll elő, ha (6.1) pontosan k darab tényezőjéből választunk x-et, a maradék n − k tényezőből pedig az y-t, és azokat szorozzuk össze. n darab tényezőből k darabot pedig Cnk -féleképpen választhatunk, ugyanis a szorzás kommutatív, és így a kiválasztás sorrendje nem számít. A következő tételt bizonyítottuk. 6.1. Tétel (Binomiális tétel). Legyenek x, y valamely T test elemei, és legyen n nemnegatív egész. Ekkor n
(x + y) =
n X n k=0
78
k
xk y n−k .
n k
A fenti formula magyarázatot ad arra, miért is nevezik az
számokat bino-
miális együtthatóknak. A binomiális tétel kiterjeszthető többtagú összeg hatványozására. Legyen k > 2 egész, és legyenek x1 , x2 , . . . , xk valamely test elemei. Számítsuk ki az (x1 + x2 + + · · · + xk )n hatványt, ahol n > 0 egész! Ez egy n-tényezős szorzat: (x1 + x2 + · · · + xk )n = (x1 + x2 + · · · + xk ) · · · (x1 + x2 + · · · + xk ) . | {z }
(6.2)
n darab tényező
A zárójelek felbontása után a tagok xi11 xi22 · · · xikk alakúak, ahol i1 +i2 +· · ·+ik = n. Pontosan ezt a tagot kapjuk, ha (6.2) jobb oldalán álló szorzat n tényezője közül i1 -ből x1 -et választunk, a maradék n − i1 tényező közül i2 -ből választunk x2 -t, és így tovább. Tehát összesen n n − i1 n − i1 − i2 − · · · − ik−1 ··· = i1 i2 ik (n − i1 )! (n − i1 − i2 − · · · − ik−1 )! n! ··· = = i1 !(n − i1 )! i2 !(n − i1 − i2 )! ik ! (n − i1 − i2 − · · · − ik )! | {z } =0!=1
n! = i1 !i2 ! · · · ik ! esetben kapjuk az xi11 xi22 · · · xikk tagot. 6.2. Tétel (Polinomiális tétel). Legyenek k > 2 és n > 0 egészek, és x1 , x2 , . . . , xk valamely test elemei. Ekkor (x1 + x2 + · · · + xk )n =
X i1 +i2 +···+ik
n! xi11 xi22 · · · xikk . i !i ! · · · i ! 1 2 k =n
A k = 2 estben nyilván a binomiális tételt láthatjuk viszont. Példaként megnézzük (a + b + c + d)8 esetén az a2 bc3 d2 tag együtthatóját. A tétel szerint ez
8! = 1680. 2!1!3!2!
6.3. A binomiális együtthatók tulajdonságai Most áttekintjük a binomiális együtthatók néhány alapvető tulajdonságát. Legyen n nemnegatív egész, és 0 6 k 6 n.
79
n elem közül k darabot úgy is kiválaszthatunk, hogy megmondjuk, melyik az az n − k darab elem, melyet nem választunk. Erre reflektál az n n = k n−k
(6.3)
egyenlőség, mely algebrai úton is könnyen igazolható:
n n−k
n! n! n! = = = = (n − k)!(n − (n − k))! (n − k)!k! k!(n − k)!
n . k
Most vegyünk a meglévő n elemünkhöz egy újabb, n + 1-edik elemet, és válasszunk ki belőle visszatevés nélkül k +1 elemet! Ez kétféleképpen történhet: vagy közte van az új elem a kiválasztottaknak (és k darab pedig az eredeti n elem közül való), vagy mind a k +1 elem a régiek közül való. Az elsőre Cnk , a másodikra Cnk+1 lehetőségünk k+1 van. Kaptuk tehát, hogy Cn+1 = Cnk + Cnk+1 , azaz
n+1 k+1
=
n n + . k k+1
(6.4)
Ez az egyenlőség is nyilván bizonyítható algebrai úton: a bal oldal (n + 1)! n+1 (n + 1)! = , = (k + 1)!(n + 1 − (k + 1))! (k + 1)!(n − k)! k+1 míg a jobb oldal n n n! n! + = + , k k+1 k!(n − k)! (k + 1)!(n − (k + 1))! melyből közös nevezőre hozás után n n n!(k + 1) + n!(n − k) = + = (k + 1)!(n − k)! k k+1 n!(k + 1 + n − k) (n + 1)! = = (k + 1)!(n − k)! (k + 1)!(n − k)! adódik, tehát a bal és jobb oldalak közötti egyenlőség fennáll. Felhasználva ezt a tulajdonságot, a binomiális együtthatók könnyen felírhatók a 6.2. ábrán látható háromszög alakú elrendezésben. A háromszög sorainak és a sorok elemeinek számozása nullával kezdődik, a nulladik sor csak az 1-et tartalmazza. A következő sorokban minden elem a felette balra és felette jobbra található két
80
6.2. ábra. A Pascal-háromszög szám összege (a sor széleinél egytagú összeg is megengedett). Például a második sorban az első szám 0 + 1 = 1, a második szám pedig 1 + 1 = 2. Az így szerkesztett háromszöget Pascal-háromszögnek nevezzük, mely n-edik sorának k-adik eleme ép pen nk . A (6.3) azonosság a Pascal-háromszög szimmetrikus tulajdonságára utal. Az
n+1 k+1
n n−1 k = + + ··· + k k k
(6.5)
egyenlőség azt állítja, hogy a Pascal-háromszög n + 1-edik sorának k + 1-edik eleme a fölötte lévő sorok k-adik elemeinek összege. Bizonyítása (6.4) többszöri alkalma-
6.3. ábra. A (6.5) azonosság az n = 5, k = 2 esetben
81
zásával könnyen elvégezhető:
n+1 k+1
n n + = k k+1 n n−1 n−1 = + + = k k k+1 .. . n n−1 k = + + ··· + . k k k =
Végül bebizonyítjuk, hogy
n+1 k+1
n+1 n = . k+1 k
Valóban,
n+1 k+1
n!(n + 1) (n + 1)! = = (k + 1)!(n + 1 − (k + 1))! k!(k + 1)(n − k)! n+1 n! n+1 n = = . k + 1 k!(n − k)! k+1 k =
6.4. Feladatok 6.1. Feladat. Hány darab hatjegyű szám van a 10-es számrendszerben? Ebből hány darab nem osztható 10-zel? 6.2. Feladat. Egy lifthez 5 ember érkezik, de egyszerre csak 3 ember fér be. Hányféleképpen választhatjuk ki az első menet utasait? 6.3. Feladat. Egy 15 tagú klub elnököt, titkárt és jegyzőt választ. Hányféleképpen tehetik ezt meg? És ha Kovács úrnak mindenképp szeretnének valami tisztséget adni? 6.4. Feladat. Hányféleképpen ültethető le egy padra 10 gyerek? És egy kerekasztal köré? (Ez utóbbinál az egymásba forgatással átvihető ülésrendeket azonosnak tekintjük.) 6.5. Feladat. Hány különböző számsorozatot kapunk, ha tízszer dobunk egy kockával?
82
6.6. Feladat. 10 egyforma sört, 6 egyforma röviditalt és 9 egyforma üdítőt osztunk ki 25 ember között úgy, hogy mindenki pontosan egyvalamit kap. Hányféleképpen tehetjük ezt meg? 6.7. Feladat. Hány olyan hatjegyű szám van, melyben pontosan két számjegy azonos? 6.8. Feladat. Hány olyan hatjegyű szám létezik, amelyben van két azonos számjegy? És hány ilyen tizenötjegyű szám létezik? 6.9. Feladat. Hányféleképpen tölthető ki egy hatoslottó szelvény? Hány 5, 4 és 3 találatos kitöltés van? 6.10. Feladat. Egy 8 férfiból és 5 nőből álló társaságból hányféleképpen választhatunk 6 főt úgy, hogy legalább két nő legyen köztük? 6.11. Feladat. Ötfajta szeletelt csokit árulnak. Hányféleképpen vehetünk 12 szeletet? 6.12. Feladat. Egy 14 mérkőzéses TOTÓ első négy meccséről tudjuk, hogy biztosan nem végződhet döntetlennel. Legalább hány szelvényt kell kitölteni ahhoz, hogy biztosan legyen telitalálatos? 6.13. Feladat. Igazolja kombinatorikai megfontolással, hogy egy n elemű halmaznak 2n darab részhalmaza van! 6.14. Feladat. A (6.5) összefüggés alapján adjon rekurzív formulát az
n k
bino-
miális együttható kiszámítására! 6.15. Feladat. A binomiális tétel alkalmazásával állapítsa meg, hogy a (2x2 + x3 )9 kifejezésben, a hatványozás és a lehetséges összevonások elvégzése után, mi lesz az x6 együtthatója! 6.16. Feladat. A hatványozás és a lehetséges összevonások elvégzése után mennyi lesz az x5 y 2 z 2 tag együtthatója az (x + 3y + 2z)9 kifejezésben? 6.17. Feladat. Igazolja, hogy a Pascal-háromszög n-edik sorában lévő számok összege 2n ! Útmutatás: a binomiális tételt alkalmazva számítsuk ki az (1 + 1)n hatványt! 6.18. Feladat. Igazolja, hogy a Pascal-háromszög n-edik sorában lévő számok váltakozó előjellel összeadva (pozitív előjellel kezdve) nullát eredményeznek! 83
6.19. Feladat. Legyen n nemnegatív egész, és 0 6 k 6 m 6 n. Igazolja, hogy n m n n−k = ! m k k m−k
84
7. Determinánsok Ebben a fejezetben egy olyan fogalommal ismerkedünk meg, amely a továbbiakban hasznos algebrai segédeszköz lesz. Ehhez azonban a permutációk tulajdonságainak alaposabb ismerete szükséges.
7.1. Permutáció, mint bijektív leképezés Legyen M = {1, 2, . . . , n}, ahol n > 1 egész, és legyen i1 , i2 , . . . , in az 1, 2, . . . , n számok egy permutációja. Ekkor az az f függvény, melyre f (1) = i1 , f (2) = i2 , . . . , f (n) = in , az M halmaz egy önmagára való kölcsönösen egyértelmű leképezése. Például, ha M = {1, 2, 3, 4, 5}, akkor a 2, 5, 4, 1, 3 sorrendhez tartozó f : M → M függvény a következő: f (1) = 2, f (2) = 5, f (3) = 4, f (4) = 1, f (5) = 3, melyet majd úgy fogunk jelölni, hogy f=
1
2
3
4
5
2
5
4
1
3
! .
A gondolatmenet megfordítható: ha f az M halmaz egy önmagára való kölcsönösen egyértelmű leképezése, akkor f (1), f (2), . . . , f (n) az 1, 2, . . . , n elemek egy átrendezése, vagyis permutációja. Az 1, 2, . . . , n számok helyett n darab különböző elemet tekintve bizonyítást nyert, hogy n különböző elem egy permutációja nem más, mint az n elemből álló halmaz egy önmagára való kölcsönösen egyértelmű leképezése. Jelölje SM az M halmaz összes permutációinak halmazát. Könnyen meggyőződhetünk arról, hogy (SM , ·) csoport, ahol a · művelet a leképezések kompozíciója. Ezt a csoportot a M halmaz teljes transzformáció-csoportjának nevezzük. Abban a speciális esetben, mikor M = {1, 2, . . . , n}, n-ed fokú szimmetrikus csoportról beszélünk, melyet Sn -nel jelölünk. Mint fentebb már előrevetítettük, Sn egy f elemét a következő alakban fogjuk megadni: f=
1 f (1)
2
···
f (2) · · ·
85
n
!
f (n)
.
Az alábbi példa S6 két elmének szorzását szemlélteti: 1
2
3
4
5
6
2
5
6
1
3
4
! ·
1
2
3
4
5
6
6
3
2
4
5
1
! =
1
2
3
4
5
6
4
6
5
1
3
2
! .
A szorzást – mint a leképezések szorzását – jobbról balra végezzük el: például a második permutáció az 1-hez a 6-ot, az első permutáció a 6-hoz a 4-et rendeli, ezért rendel a szorzat 1-hez 4-et. Azt mondjuk, hogy az 1
f=
···
2
f (2) · · ·
f (1)
!
n
f (n)
permutációban a k és l elemek inverzióban állnak, ha k < l, de f (k) > f (l). Jelölje I(f ) az f permutáció összes inverzióinak a számát. Azt mondjuk, hogy az f permutáció páros, ha I(f ) páros, egyébként f páratlan. Például az f=
1
2
3
4
5
6
2
5
6
1
3
4
!
permutációban az 1 és 4, a 2 és 4, a 2 és 5, a 2 és 6, a 3 és 4, a 3 és 5, valamint a 3 és 6 elemek állnak inverzióban. Tehát I(f ) = 7, így f páratlan permutáció. Most megmutatjuk, hogy ha egy permutációban két elem képét felcseréljük, akkor a permutáció paritása az ellenkezőjére változik. Valóban, cseréljük fel az f=
1
···
f (1)
···
···
i
f (i) · · ·
j
···
f (j) · · ·
!
n f (n)
permutációban az i és a j képét. Ekkor a g=
1
···
f (1)
···
i
···
f (j) · · ·
j
···
f (i) · · ·
n
!
f (n)
permutációhoz jutunk. A csere után az i és a j elemek egymás közötti inverziója biztosan megváltozik. Továbbá, könnyen látható, hogy az i elem inverziója egy i és j között lévő x számmal pontosan akkor változik meg (azaz ha nem voltak inverzióban, akkor abban lesznek, ha abban voltak, nem lesznek), ha az x és j közötti inverzió is megváltozik. Más inverziókban nem történik változás, így végül a változások száma páratlan. Páros permutációból tehát páratlan lesz, és fordítva.
86
Belátható, hogy az I=
1
2
···
n
1
2
···
n
!
identikus permutációból kiindulva bármely permutációhoz eljuthatunk csak elempárok egymás utáni cseréjével. Például ha 1
2
3
4
5
2
5
4
1
3
1
2
3
4
5
2
1
3
4
5
1
2
3
4
5
2
5
4
3
1
f=
! ,
akkor a 1
2
3
4
5
1
2
3
4
5
! → →
! → ! →
1
2
3
4
5
2
5
3
4
1
1
2
3
4
5
2
5
4
1
3
! → !
cseresorozat alkalmas. Az identikus permutációban egyetlen inverzió sincs, így az páros. Mivel elemek cseréjekor a paritás ellentettjére változik, így páros permutációhoz páros számú elempár-cserével, míg páratlanhoz páratlan számú cserével juthatunk. Mi történik, ha két páros permutációt összeszorzunk? Mivel a permutációk szorzása leképezések egymás után való elvégzését jelenti, így páros számú elemcsere után még páros számú elemcserét végzünk, tehát a szorzat is páros lesz. Ugyanígy kapjuk, hogy páratlan permutációk szorzata is páros, ellentétes paritású permutáció szorzata pedig páratlan. Legyen f egy páros permutáció, és legyen f −1 az inverze. Ekkor f f −1 = I, I páros, tehát f −1 -nek is párosnak kell lennie. A fent leírtak igazolják, hogy a páros permutációk Sn -ben részcsoportot alkotnak.
7.2. Mátrixok értelmezése Legyenek m és n adott pozitív egész számok, és legyenek aij , ahol 1 6 i 6 m és 1 6 j 6 n, egy rögzített T test elemei. Az
a11
a12
···
a1n
a21 A= .. .
a22 .. . am2
···
a2n .. .
···
amn
am1
87
táblázatot m × n típusú (T test feletti) mátrixnak nevezzük. Ezek szerint egy m × × n típusú mátrix egy olyan táblázat, melyben T -beli elemek m számú sorban és n számú oszlopban vannak elrendezve. Például a " B=
1
−3
0
π
2
7,5
83
11
#
táblázat tekinthető úgy, mint egy valós számok feletti 2 × 4 típusú mátrix. Az a11 , a22 , a33 , . . . elemeket a mátrix főátlójának, az am1 , am−1,2 , am−2,3 , . . . elemeket pedig a mátrix mellékátlójának mondjuk. A főátló tehát a bal felső sarokból indulva átlósan lefelé, a mellékátló pedig a bal alsó sarokból átlósan felfelé indulva járható be. A B mátrix főátlóját az 1 és a 7,5, míg mellékátlóját a 2 és −3 elemek alkotják. Az A mátrix transzponáltján az
a11
a21
···
am1
a12 A = .. .
a22 .. .
···
am2 .. .
a1n
a2n
···
anm
T
mártixot értjük, ami úgy is felfogható, mint az a mátrix, melyet az A mátrix sorainak és oszlopainak felcserélésével kapunk. Az előző példában szereplő B mátrix transzponáltja
1
−3 BT = 0 π
2
7,5 . 83 11
Két mátrixot egyenlőnek tekintünk, ha azonos típusúak, és azonos indexű elemeik megegyeznek. Az n × n típusú mátrixokat négyzetes mátrixoknak is nevezzük. A fent leírt A mátrixot röviden úgy is írhatjuk, hogy [aij ], illetve [aij ]m×n , ha a típusát is hangsúlyozni akarjuk, továbbá az i-edik sorának j-edik elemét néha (A)ij -vel is jelöljük.
88
7.3. A determináns értelmezése Vegyünk egy n×n típusú A = [aij ] mátrixot, és vegyük az Sn szimmetrikus csoport egy tetszőleges f=
1 f (1)
2
···
f (2) · · ·
n
!
f (n)
elemét! Tekintsük az első sor f (1)-edik elemét: a1f (1) , a második sor f (2)-edik elemét: a2f (2) , és így tovább, végül az n-edik sor f (n)-edik elemét: anf (n) . Jól látszik, hogy minden sorból és minden oszlopból pontosan egy elemet vettünk. Szorozzuk ezeket az elemeket össze: a1f (1) a2f (2) · · · anf (n) , majd változtassuk a szorzat előjelét az ellentettjére, ha az f permutáció páratlan! Ha f páros, a szorzat változatlan marad. Ezen előjelkorrekció után a szorzatunk (−1)I(f ) a1f (1) a2f (2) · · · anf (n) alakú. Készítsük el ezeket a szorzatokat Sn összes elemére, majd adjuk őket össze! Az így kapott összeget nevezzük az A mátrix determinánsának. Precízebben: determinánson azt a T test feletti négyzetes mátrixok halmazán értelmezett, a T testbe képező det függvényt értjük, amely az
a11
a12
···
a1n
a21 A= .. .
a22 .. .
···
a2n .. .
an1
an2
···
ann
mátrixhoz a det A =
X
(−1)I(f ) a1f (1) a2f (2) · · · anf (n)
f ∈Sn
elemet rendeli. A det A elemet az A mátrix determinánsának nevezzük. Még egyszer hangsúlyozzuk, hogy a determináns egy függvény, míg egy adott mátrix determinánsa a T test egy eleme (ami általában egy szám). A (−1)I(f ) a1f (1) a2f (2) · · · anf (n) szorzatot az A mátrix determinánsa (f permutációhoz tartozó) tagjának nevezzük. Könnyű belátni, hogy egy 1 × 1 típusú mátrix determinánsa definíció szerint
89
nem más, mint a mátrix egyetlen eleme. Most megnézzük, hogyan számítható ki egy 2 × 2 típusú mátrix determinánsa. Legyen " A=
a11
a12
a21
a22
# .
Az 1, 2 elemeknek 2 permutációja van: f1 =
1
! 2
1
2
és f2 =
1
! 2
2
1
;
f1 inverzióinak száma 0, míg f2 inverzióinak száma 1, ezért az f1 -hez tartozó tag (−1)0 a11 a22 = a11 a22 , az f2 -höz tartozó tag pedig (−1)1 a12 a21 = −a12 a21 . Az A mátrix determinánsa ezek összege: det A = a11 a22 − a12 a21 . Igazoltuk tehát, hogy egy 2 × 2 típusú mátrix determinánsát úgy is megkaphatjuk, hogy a főátlón lévő elemek szorzatából kivonjuk a mellékátlón lévő elemek szorzatát. Csupán a teljesség kedvéért álljon itt egy példa: " det
3
# −2
1
5
= 3 · 5 − (−2) · 1 = 17.
Legyen most a11 A = a21
a12
a13
a22
a23
a31
a32
a33
egy adott 3 × 3 típusú mátrix. Az A determinánsának kiszámításához szükségünk van az S3 csoportra, melynek elemeit az alábbi táblázat első oszlopa tartalmazza.
90
+ a11
+ a12
+ a13
a11
a12
a21
a22
a23
a21
a22
a31 −
a32 −
a33 −
a31
a32
7.1. ábra. 3 × 3 típusú mátrix determinánsának kiszámítása f 1
2
! 3
1
2
1
2
3 ! 3
1
3
1
2
2
1
1
2
2
3
1
2
3
1
1
2
2 ! 3
3
2
1
2 ! 3 3 ! 3 1 ! 3
I(f )
det A f -hez tartozó tagja
0
a11 a22 a33
1
−a11 a23 a32
1
−a12 a21 a33
2
a12 a23 a31
2
a13 a21 a32
3
−a13 a22 a31
Az A mátrix determinánsa tehát a táblázat harmadik oszlopában lévő elemek összege: det A = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 .
(7.1) (7.2)
Valószínűleg senkinek sem támadt kedve ezt a képletet fejben tartani. Van azonban egy módszer, mely segítségével a képlet könnyen rekonstruálható. Írjuk az A mátrix mellé az első két oszlopát még egyszer, majd adjuk össze a főátlón és a vele párhuzamos átlókon lévő elemek szorzatait, és ebből az összegből vonjuk ki a mellékátlón, és a vele párhuzamos átlókon lévő elemek szorzatait (lásd: 7.1. ábra)! Ekkor (7.1) szerint éppen az A mátrix determinánsát kapjuk.
91
Egy konkrét példa erre: 2 det 1 5
−1 4 1
3
−2 = 2 · 4 · (−1) + (−1) · (−2) · 5 + 3 · 1 · 1− −1 − 3 · 4 · 5 − 2 · (−2) · 1 − (−1) · 1 · (−1) = −52.
Nagyon fontos, hogy az itt bemutatott módszerek csak 2 × 2, illetve 3 × 3 típusú mátrixokon működnek. Ha például egy 4 × 4 típusú mátrix determinánsát szeretnénk definíció szerint kiszámolni, akkor már az S4 mind a 4! = 24 eleme paritásának vizsgálata is elég fárasztó lenne. Ahhoz, hogy nagyobb mátrixok determinánsa is barátibb mennyiségű számolással elérhetővé váljon, a determinánst jobban meg kell ismernünk.
7.4. A determináns tulajdonságai Ebben a részben mátrix alatt minden esetben egy T test feletti n×n típusú mátrixot értünk, konstanson pedig T egy tetszőleges elemét. 7.1. Tétel. Transzponált mátrix determinánsa megegyezik az eredeti mátrix determinánsával. Bizonyítás. Tekintsük az A = [aij ]n×n és B = [bij ]n×n mátrixokat. Ekkor det A =
X
(−1)I(f ) a1f (1) a2f (2) · · · anf (n)
f ∈Sn
és det B =
X
(−1)I(g) b1g(1) b2g(2) · · · bng(n) .
g∈Sn
Tegyük fel, hogy B = AT . Ekkor det AT = det B =
X
(−1)I(g) ag(1)1 ag(2)2 · · · ag(n)n .
g∈Sn
Mivel transzponáláskor csupán sor-oszlop csere történik, a determináns értékének kiszámításakor pedig olyan szorzatokkal dolgozunk, melyhez minden sorból és oszlopból pontosan egy elemet veszünk, következik, hogy a det AT kiszámításához használt összes szorzat megjelenik az A determinánsának kiszámításánál
92
is. A kérdés csak az, hogy az előjelük ugyanaz marad-e. Tegyük fel, hogy az a1f (1) a2f (2) · · · anf (n) és ag(1)1 ag(2)2 · · · ag(n)n szorzatok ugyanazokat a tényezőket tartalmazzák, csak más sorrendben. Keressük meg azt a j-t, melyre g(j) = 1; ekkor j = f (1) is teljesül. Végignézve ugyanezt a 2, . . . , n számokra is, láthatjuk, hogy az f és g permutációk egymás inverzei. Ekkor viszont a paritásuk megegyezik. A tétel szerint tehát 1 det 3 1
2 −2 1
3 1 4 = det 2 2 3
3 −2 4
1 1 , 2
melynek ellenőrzése az eddig elmondottak jó gyakorlása lehet az olvasó számára. A fenti tétel értelmében a determináns kiszámításával kapcsolatos további tételekben a „mátrix sora” helyett mindig mondhatunk „mátrix oszlopát” is. 7.2. Tétel. Ha egy mátrix egy sorának minden eleme nulla, akkor a mátrix determinánsa is nulla. Bizonyítás. A definícióból látszik, hogy ha egy sor minden eleme nulla, akkor a mátrix determinánsát adó összeg minden tagjában egy szorzótényező biztosan nulla. 7.3. Tétel. Ha egy mátrix egy sorát úgy változtatjuk meg, hogy a sor elemeihez konstansokat adunk hozzá, akkor az így kapott mátrix determinánsa egyenlő az eredeti mátrix determinánsának, és azon mátrix determinánsának az összegével, melynek a szóban forgó sorába csak a hozzáadott konstansokat írjuk, a többi sort pedig
93
változatlanul hagyjuk. Formálisan:
a11 .. . det ai1 + c1 .. . an1 a11 . . . = det ai1 . .. an1
a12 .. . ai2 + c2 .. . an2 a12 .. .
···
ai2 .. .
···
an2
···
···
a1n .. .
· · · ain + cn = .. . ··· ann a1n a11 a12 . .. .. . . . . ain + det c1 c2 . .. .. .. . . ann an1 an2
···
···
···
a1n .. . cn , .. . ann
ahol a jobb oldalon lévő összeg második tagjában a c1 , c2 , . . . cn elemek az i-edik sorban vannak, és minden más sorban az eredeti elemek szerepelnek. Bizonyítás. Írjuk fel az eredeti mátrix determinánsát, majd alkalmazzuk a disztributivitást: X
(−1)I(f ) a1f (1) · · · (aif (i) + cf (i) ) · · · anf (n) =
f ∈Sn
=
X
(−1)I(f ) a1f (1) · · · aif (i) · · · anf (n) +
f ∈Sn
+
X
(−1)I(f ) a1f (1) · · · cf (i) · · · anf (n) .
f ∈Sn
7.4. Tétel. Ha egy mátrix egy sorának minden elemét megszorozzuk ugyanazzal a c konstanssal, akkor a mátrix determinánsa is c-szeresére változik. Bizonyítás. Szorozzuk meg egy mátrix egy sorának minden elemét ugyanazzal a c konstanssal! Ekkor a mátrix determinánsának minden tagja pontosan c-szeresére változik, ugyanis a szóbanforgó sorból minden tag pontosan egy elemet tartalmaz. Az összegből c-t kiemelve a maradó rész nyilván az eredeti mátrix determinánsa.
7.5. Tétel. Ha egy mátrix két azonos sort tartalmaz, akkor a determinánsa nulla.
94
Bizonyítás. Tegyük fel, hogy az A = [aij ]n×n mátrixban az i-edik és j-edik sorok megegyeznek. Tekintsük az A mátrix determinánsának egy adott f permutációhoz tartozó a1f (1) · · · aif (i) · · · ajf (j) · · · anf (n) tagját, így előjelkorrekció nélkül. Az i-edik és j-edik sorok egyenlősége miatt a1f (1) · · · aif (i) · · · ajf (j) · · · anf (n) = a1f (1) · · · ajf (i) · · · aif (j) · · · anf (n) , és ez utóbbi szorzat pontosan a g=
1
···
f (1)
···
···
i
f (j) · · ·
j
···
f (i) · · ·
n
!
f (n)
permutációhoz tartozó tag, előjelkorrekció nélkül. Mivel az f és g permutációk pontosan két elem képében térnek el, paritásuk ellentétes. Tehát két azonos sort tartalmazó mátrix determinánsának minden tagjához hozzárendelhető egy másik, hogy a kettő összege nulla, így a determináns maga is nulla. 7.6. Tétel. Ha egy mátrix egyik sora egy másik sorának konstansszorosa, akkor a mátrix determinánsa nulla. Bizonyítás. Használva az előző tételeket
a11 . . . ai1 . det .. cai1 . . . an1
a12 .. . ai2 .. . cai2 .. . an2
···
···
···
···
a1n a11 . .. . . . ain ai1 . .. = c · det .. . ai1 cain . .. . . . ann an1
a12 .. . ai2 .. . ai2 .. . an2
···
···
···
···
a1n .. . ain .. =0 . ain .. . ann
7.7. Tétel. A determináns értéke nem változik, ha egy mátrix egy sorához hozzáadjuk egy másik sor konstansszorosát.
95
Bizonyítás. Szintén az előző tételek következménye, hogy
a11 a12 ··· a1n .. .. .. . . . ai1 ai2 ··· ain .. .. .. det = . . . aj1 + cai1 aj2 + cai2 · · · ajn + cain .. .. .. . . . an1 an2 ··· ann a11 a12 a11 a12 · · · a1n . . .. .. .. . . . . . . . ai2 ai2 · · · ain ai1 ai1 . . .. .. .. = det .. + det .. . . . cai1 cai2 aj1 aj2 · · · cajn . . .. .. .. . . . . . . . an1 an2 an1 an2 · · · ann a11 a12 · · · a1n . .. .. . . . . ai2 · · · ain ai1 . .. .. = det .. . . aj1 aj2 · · · ajn . .. .. . . . . an1 an2 · · · ann
···
···
···
···
a1n .. . ain .. = . cain .. . ann
Ennek a tételnek majd fontos szerepe lesz az úgynevezett eliminációs módszerben. Emellett jól használható a mátrixban lévő „nagy” számok csökkentésére is a következő értelemben: ha az
30
20
15
12
20 A= 105 170
15
12
84
70
140
120
10 60 105
mátrix első oszlopából kivonjuk a másodikat (vagy ha úgy tetszik, a mátrix első oszlopához hozzáadjuk a második −1-szeresét), a második oszlopból kivonjuk a
96
harmadikat, végül a harmadikból a negyediket, akkor az 10 5 A1 = 21 30
5
3
12
3
2
14
10
20
15
10 60 105
mátrixot kapjuk, melynek determinánsa a fenti tétel értelmében megegyezik az A mátrixéval. A hatást tovább fokozhatjuk, ha az A1 mátrix első oszlopából ismételten kivonjuk a másodikat, a másodikból a harmadikat, majd a negyedikből a harmadik négyszeresét, de ennek elvégzése már az olvasó feladata. 7.8. Tétel. Ha egy mátrix két sorát felcseréljük, akkor a mátrix determinánsa előjelet vált. Bizonyítás. Vegyünk egy négyzetes mátrixot! Adjuk hozzá az i-edik sorhoz a jediket, majd a j-edik sorból vonjuk ki az i-ediket! Végül az i-edik sorhoz adjuk
97
hozzá a j-ediket! A 7.6. és 7.7. tételek szerint
a11 . . . ai1 . det .. aj1 . . . an1
a12 .. . ai2 .. . aj2 .. . an2
···
···
···
···
a1n a11 .. .. . . ain ai1 + aj1 .. .. = det . . aj1 ajn .. .. . . ann an1
a11 a12 ··· .. .. . . ai1 + aj1 ai2 + aj2 · · · .. .. = det . . −ai1 −ai2 ··· . . .. .. an1 an2 ··· a11 a12 · · · a1n . .. .. . . . . ajn aj1 aj2 · · · . .. .. . = − det .. . . ai1 ai2 · · · ain . .. .. . . . . an1 an2 · · · ann
a12 ··· .. . ai2 + aj2 · · · .. . aj2 ··· .. . an2 ··· a11 a1n . .. . . . ain + ajn aj1 . .. = det .. . −ai1 −ain . .. . . . an1 ann
a1n .. . ain + ajn .. = . ajn .. . ann a12 .. . aj2 .. . −ai2 .. . an2
···
···
···
···
a1n .. . ajn .. = . −ain .. . ann
7.5. Kifejtési tételek Egy m × n típusú mátrix egy k-ad rendű aldeterminánsán egy olyan k × k típusú mátrix determinánsát értjük, melyet az eredetiből úgy kapunk, hogy kiválasztunk k darab sort és k darab oszlopot, és vesszük a kiválasztott sorok és oszlopok metszéspontjain lévő elemeket. Az n × n típusú A mátrix d aldeterminánshoz tartozó d∗ komplementer aldeterminánsán azon (n − k) × (n − k) típusú mátrix determinánsát értjük, melynek alkotóelemei nem szerepelnek a kijelölt sorokban illetve oszlopokban. Ha a kijelölt sorok illetve oszlopok indexei i1 , . . . , ik és j1 , . . . , jk , akkor a d-hez tartozó adjungált komplementer aldetermináns d+ = (−1)i1 +···+ik +j1 +···+jk d∗ . 98
Például az
2
1 A= −3 1
0
0
−1
3
2 1
3
4 1 −5 2 −1
mátrixban az 1. és 2. sorokat, valamint a 1. és 3. oszlopokat kiválasztva, azok metszéspontjain a "
2
# 0
1
3
mátrix keletkezik, melynek determinánsa 6. Ez tehát az A egy másodrendű aldeterminánsa. Az ehhez tartozó komplementer aldetermináns pedig " det
2
# −5
1
−1
= 3,
az adjungált komplementer aldetermináns pedig (−1)1+2+1+3 · 3 = −3. Talán sejthető, hogy egy négyzetes mátrix aldeterminánsaiból valahogyan előállítható kell legyen az eredeti mátrix determinánsa. Az alábbiakban azt nézzük meg, hogyan. 7.9. Lemma. Tekintsünk egy n × n típusú A mátrixot és annak egy d k-ad rendű aldeterminánsát. Ha d egy tetszőleges tagját megszorozzuk d+ egy tetszőleges tagjával, akkor det A egy tagját kapjuk. Bizonyítás. Először az i1 = 1, . . . , ik = k és j1 = 1, . . . , jk = k esetet tekintjük, vagyis amikor az aldeterminánshoz tartozó mátrix kiválasztásához az első k darab sort és oszlopot választjuk. Legyen f ∈ Sn olyan permutáció, ami a k + 1, . . . , n elemeket fixen hagyja. Ez nyilván felfogható mint egy Sk -beli permutáció, és d ehhez tartozó tagja (−1)I(f ) a1f (1) · · · akf (k) alakú. Hasonlóan, ha g ∈ Sn az 1, . . . , k elemeket hagyja fixen, akkor d∗ g-hez tartozó tagja (−1)I(g) ak+1,g(k+1) · · · ang(n) alakú, ami (1 + · · · + k) + (1 + · · · + k) páros volta miatt éppen d+ -nak is tagja. A kettő szorzata (−1)I(f )+I(g) a1f (1) · · · akf (k) ak+1,g(k+1) · · · ang(n) , 99
ami pontosan a det A f g permutációhoz tartozó tagja. Tekintsük most az általános esetet, amikor a kiválasztott sorok és oszlopok i1 , . . . , ik és j1 , . . . , jk indexei tetszőlegesek. Ekkor az i1 indexű oszlopot az összes őt megelőzővel megcserélve i1 − 1 lépésben elérhetjük, hogy az első helyre kerüljön. Ugyanígy az i2 indexű oszlop i2 − 2 oszlopcserével kerülhet a második helyre. Folytatva az eljárást az összes sorra és oszlopra, t = (i1 − 1) + · · · + (ik − k) + (j1 − 1) + · · · + (jk − k) számú sor illetve oszlopcserével elérhetjük, hogy a kiválasztott aldetermináns a bal felső sarokban jelenjen meg. Ha B jelöli az így átrendezett mátrixot, akkor det A = (−1)t det B = (−1)i1 +···+ik +j1 +···+jk det B, ahol a kitevőből a biztosan páros tagokat már elhagytuk. Ha α tagja d-nek, β pedig d∗ -nak, akkor az előzőekben igazoltak miatt αβ tagja det B-nek és így (−1)i1 +···+ik +j1 +···+jk αβ tagja det A-nak. 7.10. Tétel (Laplace-féle kifejtési tétel). Ha egy négyzetes mátrixból kiválasztunk k darab sort és ezen sorok segítségével képezzük az összes k-ad rendű aldeterminánst, majd azokat mind megszorozzuk a saját adjungált komplementer aldeterminánsával, akkor ezen szorzatok összege éppen a mátrix determinánsa lesz. Bizonyítás. Ha veszünk egy k-ad rendű d aldeterminánst az A négyzetes mátrixból, akkor az előző lemma szerint d és d+ tagjainak szorzatai tagjai det A-nak. Ez k!(n − k)! darab tagot jelent aldeterminánsonként. A kiválasztott k darab sor segítségével viszont n n! = k k!(n − k)! k-ad rendű aldetermináns képezhető, tehát összesen n! tagot kapunk. Mivel ezek a tagok különbözőek, és mind tagjai a det A-nak, az összegük nem lehet más, mint det A. Ha a fenti A mátrix determinánsát a mátrix első két sora szerint fejtjük ki, a
100
következőt kapjuk: " 2
0
#
" 1+2+1+2
1
# −5
· (−1) · det + 1 −1 2 −1 " # " # 2 0 2 −5 1+2+1+3 + det · (−1) · det + 1 3 1 −1 " # " # 2 3 2 1 1+2+1+4 + det · (−1) · det + 1 4 1 2 " # " # 0 0 −3 −5 1+2+2+3 + det · (−1) · det + −1 3 1 −1 " # " # 0 3 −3 1 1+2+2+4 + det · (−1) · det + −1 4 1 2 " # " # 0 3 −3 2 1+2+3+4 + det · (−1) · det + 3 4 1 1
det A = det
=(−2) · 9 + 6 · (−1) · 3 + 5 · 3 + 0 + 3 · (−1) · (−7) + (−9) · (−5) = 45. A negyedik összeadandó helyére azért írtunk csak 0-t, mert az aldeterminánst kiszámolva 0-t kaptunk, és ha egy szorzat egyik tényezője 0, akkor már a szorzat a további tényezőktől függetlenül 0. Ezáltal megkíméltük magunkat egy újabb 2 × 2 típusú mátrix determinánsának kiszámításától. Gyakran előfordul, hogy a Laplace-féle kifejtési tételt csak egy sorra alkalmazzuk. Ezt a verziót külön tételként is szokás megemlíteni: 7.11. Tétel (Kifejtési tétel). Ha egy négyzetes mátrix egy sorának minden elemét megszorozzuk a hozzá tartozó adjungált komplementer aldeterminánssal, majd ezeket a szorzatokat összeadjuk, eredményül a mátrix determinánsát kapjuk. Bizonyítás. Mivel egy mátrix elsőrendű aldeterminánsai éppen a mátrix elemei, ez a tétel nem más, mint a Laplace-féle kifejtési tétel k = 1 esetén. Ha most az A mátrix determinánsát annak egy sora szerint szeretnénk kifejteni, akkor azt a sort célszerű választani, ami a legtöbb nullát tartalmazza, ugyanis a sor elemei determinánsok előtti szorzótényezőként jelennek meg, és amikor azok nullák, a hozzájuk tartozó determinánsok kiszámítása szükségtelenné válik. Tehát
101
esetünkben a kifejtést az első sor szerint érdemes megtenni: −1 1+1 det A = 2 · (−1) · det 2 1
3
4
1
−1
1 −5 + 0 + 0 + 3 · (−1)1+4 · det −3 1 2 −1
2 1
3 1 . 2
A számolás befejezését (melynek lényegi része a két 3 × 3 típusú mátrix determinánsának valamilyen módszerrel való meghatározása) az olvasóra bízzuk. A következő tétel pedig inkább elméleti jelentőségű. 7.12. Tétel (Ferde kifejtési tétel). Ha egy négyzetes mátrix egy sorának minden elemét megszorozzuk egy másik sor ugyanazon oszlopában lévő eleméhez tartozó adjungált komplementer aldeterminánssal, majd ezeket a szorzatokat összeadjuk, eredményül nullát kapunk. Bizonyítás. Szorozzuk meg az A = [aij ]n×n mátrix i-edik sorának minden elemét az i-től különböző j-edik sor megfelelő elemeihez tartozó adjungált komplementer aldeterminánsokkal, és legyen mindezek összege t; ekkor t = ai1 Aj1 + · · · + ain Ajn , ahol Ajk jelöli az ajk elemhez tartozó adjungált komplementer aldeterminánst. Könnyen látható, hogy t értéke független a j-edik sor elemeitől. Írjuk a j-edik sor elemei helyére az i-edik sor elemeit, legyen az így kapott mátrix B. Ekkor t nem változik, és alkalmazva a kifejtési tételt a j-edik sorra, kapjuk, hogy t = det B. De mivel B két azonos sort tartalmaz, t = 0 adódik, amit bizonyítani kellett. Még egyszer megjegyezzük, hogy mivel mátrixnak és transzponáltjának a determinánsa megegyezik, így a kifejtési tételekben is mondhatunk sor helyett oszlopot. Összefoglalva, a kifejtési tételek arra kínálnak lehetőséget, hogy egy n × n típusú mátrix determinánsára „kisebb” mátrixok determinánsaiból következtessünk. Segítségükkel a determináns függvény rekurzívan is megadható. Látható azonban, hogy „nagy” mátrixok determinánsának a kiszámítása még mindig nagyon sok számolást igényel.
102
7.6. A determináns értékének kiszámítása eliminációval Egy négyzetes mátrixot felső háromszögmátrixnak nevezünk, ha főátlója alatt minden elem nulla: a11 0 . . . 0
a12
···
a1n
a22 .. .
···
a2n .. , .
0
···
ann
azaz aij = 0 teljesül minden olyan esetben, amikor i > j; továbbá alsó háromszögmátrixnak, ha a főátlója felett minden elem nulla:
0
···
0
a21 . . .
a22 .. .
···
0 .. .
,
an1
an2
···
ann
a11
vagyis ha aij = 0 bármely i < j esetén. 7.13. Tétel. Ha egy mátrix felső vagy alsó háromszögmátrix, akkor determinánsa egyenlő a főátlón lévő elemek szorzatával. Bizonyítás. Mivel a felső háromszögmátrixok megkaphatók mint az alsó háromszögmátrixok transzponáltjai, a 7.1. tétel értelmében elég csak alsó háromszögmátrixokra igazolni az állítást. Alkalmazva a kifejtési tételt az első sorra
0
···
0
a21 det .. .
a22 .. .
···
0 .. .
an1
an2
···
ann
a11
0
···
0
a32 = a11 det . . .
a33 .. .
···
0 .. .
,
an2
an3
···
ann
a22
ahonnan az eljárást ismételve kapjuk az állítást. Az eliminációs módszer lényege, hogy egy négyzetes mátrixon bizonyos átalakításokat végzünk, mígnem egy olyan felső háromszögmátrixot kapunk, melynek determinánsából következtethetünk az eredeti mátrix determinánsára. A felső háromszögmátrixszá alakítást oszloponként végezzük. Tekintsük először a mátrix első oszlopát! Ha abban minden főátló alatti elem nulla, akkor az már eleve olyan alakú, mint egy felső háromszögmátrix első oszlopa, tehát áttérhetünk a második oszlop-
103
ra. Ha nem, akkor pedig sorcserével elérhető, hogy az első sor első eleme ne nulla legyen (nem biztos, hogy szükség van sorcserére, ha igen, ügyeljünk az előjelváltozásra, lásd: 7.8. tétel). Ekkor az első sor megfelelő konstansszorosait a második, harmadik, stb. sorokhoz hozzáadva elérhetjük, hogy az első oszlop második, harmadik, stb. eleme nulla legyen. Ekkor – a 7.7. tétel értelmében – a determináns értéke nem változik. Nézzük most a második oszlopot! Ha ebben a harmadiktól kezdődően minden elem nulla, akkor ez az oszlop formailag megfelel egy felső háromszögmátrix második oszlopának, így nincs semmi tennivalónk, folytathatjuk a 3. oszloppal. Ellenkező esetben esetleges sorcserével elérhető, hogy a második sor második eleme ne legyen nulla. (Ehhez a második sort csak az alatta lévő sorok valamelyikével érdemes cserélni, hiszen az első sorral felcserélve elrontanánk a sor első oszlopában előbb kialakított nullát.) Ezután a második sor megfelelő konstansszorosait hozzáadva a harmadik, negyedik, stb. sorokhoz elérhető, hogy a második oszlopban a főátló alatti elemek mind nullák legyenek. Hasonlóan folytatjuk az eljárást a harmadik, negyedik, majd legvégül az utolsó előtti oszloppal. A végeredmény egy olyan felső háromszögmátrix lesz, melynek determinánsa legfeljebb előjelben tér el az eredeti mátrix determinánsától. Ez az algoritmus ebben a formában is korrekt, kézi végrehajtásakor azonban a számítás könnyítése érdekében még beiktathatunk néhány extra lépést. A fejezet zárásaként kiszámítjuk az
2
1 A= −3 1
0
0
−1
3
2 1
3
4 1 −5 2 −1
mátrix determinánsát eliminációs módszerrel is: 1 −1 3 4 1 −1 3 4 2 0 0 3 = − det 0 2 −6 −5 = det A = − det −3 2 1 −5 0 −1 10 7 1 1 2 −1 0 2 −1 −5 1 −1 3 4 1 −1 4 3 0 2 −6 −5 0 2 −5 −6 = − det = det 0 0 4,5 7 = 45. 0 0 7 4,5 0 0 5 0 0 0 0 5
104
Most pedig leírjuk, hogy az egyes lépésekben pontosan mit csináltunk. 1. A fentieket követve, először az első oszlop első elemével kellene az alatta lévőket eliminálni. Ehhez kényelmi okokból célszerű az első két sort felcserélni, ugyanis ekkor az első oszlop első eleme 1 lesz, melynek minden alatta lévő elem többszöröse (extra lépés!). Ekkor a determináns előjelet vált. 2. Kivonjuk az első sor kétszeresét a másodikból, hozzáadjuk az első sor háromszorosát a harmadikhoz, végül kivonjuk az első sort a negyedikből. Ekkor a determináns nem változik. 3. Az első oszloppal kész vagyunk, most a második oszlop főátló alatti elemeinek kinullázása következik. Itt most a következő két lehetőséget érdemes mérlegelni: vagy hozzáadjuk a 2. sor felét a harmadikhoz (ekkor törtek is megjelennek), és kivonjuk a második sort a negyedikből; vagy mint az első lépésben, először megcseréljük a második és a harmadik sorokat és utána eliminálunk. Mi az első mellett voksolunk, ekkor a determináns nyilván nem változik. 4. A harmadik oszlop következik, de ott az elimináció elkerülhető, ha megcseréljük a negyedik oszloppal. A determináns újra előjelet vált. 5. A jobb oldalon most már egy felső háromszögmátrix determinánsa áll, mely értéke a főátlón lévő elemek szorzata, azaz 1 · 2 · 4,5 · 5.
7.7. Feladatok 7.1. Feladat. Előfordulhat-e, hogy egy csupa egész számokat tartalmazó négyzetes mátrix determinánsa nem egész szám? Válaszát indokolja! 7.2. Feladat. Az [aij ]6×6 mátrix determinánsában milyen előjellel szerepelnek az a) a23 a31 a42 a56 a14 a65 b) a32 a43 a14 a51 a66 a25 szorzatok? 7.3. Feladat. Számítsa ki az alábbi mátrixok determinánsait: " # " # " # 2 3 2 1 sin x cos x A= , B= , C= , 1 4 −1 2 − cos x sin x
105
" D=
1+ 2+
√ √
2 3
√ # 2− 3 √ , 1− 2
1
1
E = −1
0
−1
−1 −2 3 −4 1!
1 G = 2
−5
3
1 1 , 0
0 F = 1
1
1
1
1 1 , 0
0
2
7.4. Feladat. Mi a kapcsolat az A és B mátrixok determinánsa között? a11 A = a21
a12
a13
a22
a23
a31
a32
a33
2a11 B = 2a21
3a12
5a13
3a22
5a23
2a31
3a32
5a33
7.5. Feladat. Hogyan változik egy mátrix determinánsa, ha a sorait fordított sorrendben írjuk fel? 7.6. Feladat. Hogyan változik egy mátrix determinánsa, ha minden elemét ugyanazzal a konstanssal szorozzuk? 7.7. Feladat. Határozza meg x értékét, ha 1 1 det 1 1
1
1
1
1−x
1
1
2−x
1
1
1 = 0! 1 3−x
7.8. Feladat. Számítsa ki az alábbi mátrixok determinánsait kifejtés segítségével! 0 0 A= 5 1
0
5
0
6
6
7
2
3
1 2 , 3 4
8 1 B= 0 0
6
0
0
0
8
6
0
1
8
6
0
1
8
0
0
0
1
0 0 , 6 8
7.9. Feladat. Számítsa ki az 4 2 A= 0 2
6
4
4
1
0
3
1
2
3
0 3 5
106
2 0 C= 1 0 3
−1
1
7
2
0
2
1
1
3
2
0 −2
3
2
1
2 0 1 . 0 1
mátrix determinánsát eliminációs módszerrel! 7.10. Feladat. Határozza meg az alábbi n × n típusú mátrixok determinánsait! 1 1 1 1 0 1 A = 1 1 0 . . . . . . . . . 1 1 1
1
a1 2 V = a1 . . . an−1 1
···
1
···
1 1 .. . 0
···
···
1
1
···
a2
a3
···
a22 .. .
a23 .. .
···
an−1 2
an−1 3
···
1
an a2n .. . an−1 n
A V mátrix determinánsa (Vandermonde-determináns) mikor egyenlő nullával?
107
8. Műveletek mátrixokkal Most az előző fejezetben bevezetett mátrixok körében értelmezünk műveleteket. Először az összeadást, mely csak azonos típusú mátrixokkal végezhető el: az A = = [aij ]m×n és B = [bij ]m×n mátrixok összegén azt az A + B = [cij ]m×n mátrixot értjük, melyre cij = aij + bij minden 1 6 i 6 m és 1 6 j 6 n esetén. Az A + B mátrix kiszámításához tehát a megfelelő indexű elemeket kell összeadni. Például:
−2
1
0
3
4 + −1 5 −3
2 −3
1
2 = 1 −3 −6
1 6 . 2
Különböző típusú mátrixok összegét nem értelmezzük. Jelölje Mm×n (T ) az összes T test feletti m × n típusú mátrixok halmazát. A fenti definíció szerint + művelet az Mm×n (T ) halmazon, és mivel a mátrixok összege a T testbeli összeadásra van visszavezetve, + asszociatív és kommutatív. A zéruselem az az m × n típusú mátrix, melynek minden eleme nulla (zérómátrix ), és az A = [aij ]m×n mátrix ellentettje az a B = [bij ]m×n mátrix, melyre bij = −aij minden 1 6 i 6 m és 1 6 j 6 n esetén. Tehát (Mm×n (T ), +) Abel-csoport. Kicsit komplikáltabb lesz a mátrixok szorzása. Először is, az A és B mátrixok AB szorzatát csak akkor értelmezzük, ha az A mátrix oszlopainak száma megegyezik a B mátrix sorainak számával. Ekkor, ha az A mátrixból kiválasztunk egy sort (mondjuk az i-ediket), a B mátrixból pedig egy oszlopot (legyen ez a j-edik), akkor ennek a sornak és oszlopnak pontosan ugyanannyi eleme van. Szorozzuk ezt a sort és oszlopot oly módon össze, hogy az első elemet az elsővel, a másodikat a másodikkal, és így tovább, végül az utolsót az utolsóval. Ezen szorzatok összege lesz a szorzatmátrix i-edik sorának j-edik eleme (8.1. ábra). Ugyanez precízen: az A = [aij ]m×n és B = [bij ]n×k mátrixok szorzatán azt az AB = [cij ]m×k mátrixot értjük, melyre cij = ai1 b1j + ai2 b2j + · · · + ain bnj minden 1 6 i 6 m és 1 6 j 6 k esetén. Legyenek " A=
1
2
# 0
−1
3
4
2
és B = −3 −5
1 2 . 7
Az AB szorzat kiszámításának talán legszemléletesebb módszere, amikor a két
108
8.1. ábra. Mátrixok szorzása mátrixot egy táblázatba helyezzük a következőképpen:
1
2
0
−1
3
4
2 −3
1 2
−5
7
A beírt mátrixok sorait illetve oszlopait elválasztó vonalak behúzása után kirajzolódó négyzetrács szépen mutatja, hogy a szorzat egy 2 × 2 típusú mátrix lesz, amely – első sorának első eleme: 1 · 2 + 2 · (−3) + 0 · (−5) = −4, – első sorának második eleme: 1 · 1 + 2 · 2 + 0 · 7 = 5, – második sorának első eleme: (−1) · 2 + 3 · (−3) + 4 · (−5) = −31, – második sorának második eleme: (−1) · 1 + 3 · 2 + 4 · 7 = 33.
109
Tehát
" AB =
−4
5
−31
33
# .
Az alábbi állítás következménye, hogy (Mn×n (T ), ·) félcsoport. 8.1. Tétel. Ha A = [aij ]m×n , B = [bij ]n×k és C = [cij ]k×l , akkor (AB)C = A(BC). Bizonyítás. A mátrixszorzás definíciója szerint az AB szorzat létezik, és m × k típusú, és ekkor az (AB)C szorzat is létezik, mely egy m × l típusú mátrix. Ugyanígy látható be, hogy az A(BC) szorzat is létezik, ami szintén egy m × l típusú mátrix. Most megmutatjuk, hogy ez a két mátrix elemenként megegyezik. Valóban, felhasználva, hogy T test, ((AB)C)ij =
k X
(AB)iu (C)uj
u=1
=
k n X X = (A)iv (B)vu u=1
(C)uj
v=1
k X n k X n X X ((A)iv (B)vu )(C)uj = (A)iv ((B)vu (C)uj ) u=1 v=1
=
!
n X k X
u=1 v=1
(A)iv ((B)vu (C)uj ) =
v=1 u=1
n k X X (A)iv (B)vu (C)uj v=1
u=1
n X (A)iv (BC)vj = (A(BC))ij . = v=1
8.2. Tétel. (Mn×n (T ), +, ·) nemkommutatív, asszociatív, egységelemes gyűrű. Bizonyítás. Ahhoz, hogy (Mn×n (T ), +, ·) asszociatív gyűrű, már csak a disztributivitást kell belátni. Ha A = [aij ], B = [bij ] és C = [cij ] mind n×n típusú mátrixok, akkor a T -beli disztributivitás miatt (A(B + C))ij = =
n X k=1 n X
aik (B + C)kj =
n X
aik (bkj + ckj )
k=1
(aik bkj + aik ckj ) =
k=1
n X k=1
= (AB + AC)ij .
110
aik bkj +
n X k=1
aik ckj
A jobb oldali disztributivitás is hasonlóan igazolható. Az egységelem szerepét az az n × n típusú mátrix tölti be, melynek a főátlójában minden eleme 1, máshol pedig minden eleme 0: 1 0 0 1 En = .. .. . . 0
0
···
0 0 .. . .
···
1
···
Ezt a mátrixot n × n típusú egységmátrixnak nevezzük, és En -nel jelöljük. Legyen például " A=
1
# 2
1
1
és B =
" −1
0
#
2
1
.
Kiszámítva az AB és BA szorzatokat, láthatjuk, hogy a szorzás nem kommutatív.
8.3. Tétel (Determinánsok szorzástétele). Ha A és B n×n típusú mátrixok, akkor det(AB) = det A · det B. Bizonyítás. Legyenek A = [aij ] és B = [bij ] n × n típusú mátrixok, és legyen C az a (2n) × (2n) típusú mátrix, melynek – bal felső sarkában az A mátrix, – jobb felső sarkában az n × n típusú zérómátrix, – bal alsó sarkában az az n × n típusú mátrix, melynek főátlójában minden elem −1, máshol minden elem nulla, – jobb alsó sarkában pedig a a11 . .. an1 C= −1 . . . 0
B mátrix van: ···
a1n .. .
0 .. .
···
···
ann
0
···
···
0 .. .
b11 .. .
···
···
−1
bn1
···
0 .. . 0 . b1n .. . bnn
A Laplace-féle kifejtési tétel első n sorra történő alkalmazásával kapjuk, hogy det C = det A · (−1)(1+···+n)+(1+···+n) det B = det A · det B. 111
Most adjuk hozzá az első sorhoz az (n + 1)-edik sor a11 -szeresét, majd az (n + 2)edik sor a12 -szeresét, és így tovább, végül a (2n)-edik sor a1n -szeresét! Utána adjuk hozzá a második sorhoz az (n + 1)-edik sor a21 -szeresét, majd az (n + 2)-edik sor a22 -szeresét, és így tovább, végül a (2n)-edik sor a2n -szeresét! Az eljárást folytatva a többi sorra végül az n-edik sorhoz adjuk az (n + 1)-edik sor an1 -szeresét, majd az (n + 2)-edik sor an2 -szeresét, stb., végül a (2n)-edik sor ann -szeresét. Az így keletkezett mátrix a
0 . .. 0 C1 = −1 . . . 0
···
0 .. .
(AB)11 .. .
···
···
0
(AB)1n
···
···
0 .. .
b11 .. .
···
···
−1
bn1
···
(AB)1n .. . (AB)nn , b1n .. . bnn
és a 7.7. tétel miatt det C1 = det C. Alkalmazva ismét a Laplace-féle kifejtési tételt a C1 mátrix első n sorára, azt kapjuk, hogy det C1 = det(AB) · (−1)((n+1)+···+2n)+(1+···+n) · (−1)n . Mivel a −1 kitevőjében lévő összeg páros, ezért det C1 = det(AB), és így det(AB) = = det A · det B. Az alábbi tétel szerint az osztás még a négyzetes mátrixok körében sem végezhető el korlátlanul. 8.4. Tétel. Egy négyzetes mátrixnak pontosan akkor létezik inverze a szorzásra nézve, ha determinánsa nem nulla. Bizonyítás. Tegyük fel először, hogy az A n × n típusú mátrixnak létezik inverze, és legyen ez B. Ekkor AB = En , és a determinánsok szorzástétele miatt det A · det B = det(AB) = det En = 1, tehát det A 6= 0. Fordítva, ha A = [aij ]n×n olyan mátrix, melynek determinánsa nem nulla, akkor
112
legyen B = [bij ]n×n az a mátrix, melyre bji =
Aij , det A
ahol Aij az A mátrix aij eleméhez tartozó adjungált komplementer aldeterminánsa. Ha ezzel a mátrixszal bármelyik oldalról megszorozzuk A-t, a kifejtési tétel garantálja, hogy a szorzat főátlójában csak egyesek lesznek, a ferde kifejtési tétel pedig azt, hogy máshol mindenütt nulla. Tehát AB = En , azaz B valóban az A inverze. A bizonyításból az is kiderült, hogy ha egy négyzetes mátrixnak létezik inverze, akkor az inverzmátrix hogyan állítható elő. Például, ha
1
−2
A= 1
−1
−1
0
1 , −3
0
akkor det A = −1 6= 0 miatt A-nak létezik inverze, és
1+1
A−1
−1
1
(−1) 0 −1 1 (−1)1+2 = −1 −1 1 (−1)1+3 −1
2+1
−3 1
−3
−1
2+2
(−1)
(−1)2+3
1
6 3 −2
0
3+1
−3
1
0
−1
−3
−1
−1
−3 = −2
0
−1
0
(−1)
−2
1 −1
−2 0
−1
2
(−1)
−2
0
1 −1 1 0 (−1)3+2 1 1 = −1 1 −2 (−1)3+3 1 −1
−1
−1
1 . −1
Hogy a kapott mátrix valóban az A inverze, arról az AA−1 = E3 egyenlőség ellenőrzésével győződhetünk meg. Megjegyezzük, hogy azon n × n típusú mátrixok, melyek determinánsa nem nulla, csoportot alkotnak a mátrixok szorzására nézve.
113
8.1. Feladatok 8.1. Feladat. Végezze el az alábbi műveleteket! " 1
2
4
5
3
#
1
0 1
1
1
1
0
#3 −5
" 4
· 2 , 6 −1
,
−1
2
1 1 1 · 2 0 3
#n
" a
1
0
a
3 −4 1 , −5 2 −2
"
" ,
1
−2
−1
0
sin x
cos x
− cos x
sin x
#n ,
x1 3 · x2 5 x3 #
8.2. Feladat. Legyen A=
" −2
# 0
3
2
B=
" −1
1
#
2
0
" C=
1
1
2
2
−1
−1
# .
Adja meg az ((A − B) · C)T mátrixot! 8.3. Feladat. Igazolja, hogy ha A = [aij ]m×n és B = [bij ]n×k típusú mátrix, akkor (AB)T = B T AT ! 8.4. Feladat. Keressen az (Mn×n (T ), +, ·) gyűrűben nullosztókat! 8.5. Feladat. Keresse meg azokat a 2 × 2 típusú mátrixokat, melyek a szorzásra nézve felcserélhetők az
"
1
# 2
3
4
mátrixszal! 8.6. Feladat. Legyen G=
(" a b
# a b
) : a, b ∈ R .
Van-e G-nek neutrális eleme a mátrixszorzásra nézve? Igazolja, hogy a 6= b megszorítással G csoportot alkot a mátrixszorzásra nézve!
114
8.7. Feladat. Keresse meg az alábbi mátrixok inverzeit! 1 A = 2
−1
3
−2
1
−1 4 , −1
B=
" a
b
#
c
d
" ,
C=
sin x
cos x
− cos x
sin x
#
8.8. Feladat. Igazolja, hogy ha A invertálható mátrix, akkor AT is invertálható és (AT )−1 = (A−1 )T . 8.9. Feladat. Oldja meg a "
4
# 1
−6
2
" ·X =
4
# −1
2
3
mátrixegyenletet! 8.10. Feladat. Igazolja, hogy mindazon n × n típusú mátrixok, melyek determinánsa 1, csoportot alkotnak a mátrixok szorzására nézve! 8.11. Feladat. Csoportot alkot-e a mátrixok szorzására nézve a (" H=
#
x
y
−y
x
) : x, y ∈ R, x2 + y 2 6= 0
halmaz? 8.12. Feladat. Legyen A egy olyan négyzetes mátrix, melyre An = 0 valamely n esetén. Mutassa meg, hogy det A = 0!
115
9. Vektorterek Középiskolai tanulmányainkban vektor alatt a sík vagy tér egy szabadvektorát értettük, azaz egy irányított szakaszt, úgy, hogy az egymásba eltolással átvihető irányított szakaszok között nem tettünk különbséget. Ezeket a szabadvektorokat össze lehetett adni, sőt még meg is lehetett bármilyen valós számmal szorozni úgy, hogy az eredmény szintén szabadvektor lett. A felsőbb matematikában a vektor fogalma ez utóbbi műveletek elvégezhetőségét és azok bizonyos tulajdonságát ragadja meg. Legyen V egy adott csoport és T egy test. Azt mondjuk, hogy a V csoporton értelmezve van a (T -beli) skalárokkal való szorzás, ha adva van egy · : T × V → V függvény. Ekkor az (α, a) ∈ T × V elem képét α · a-val jelöljük és az a α-szorosának mondjuk. Példaként tekintsük a T test feletti m × n típusú mátrixok halmazát, és egy λ testbeli elem és egy A mátrix szorzatát értelmezzük úgy, hogy a mátrix minden elemét megszorozzuk λ-val. Általában ezt szoktuk a mátrixok skalárral való szorzásán érteni. Legyen (V, +) egy Abel-csoport és T egy test. Azt mondjuk, hogy V vektortér (vagy lineáris tér) a T test felett, ha értelmezve van rajta a T -beli skalárokkal való szorzás, és minden a, b ∈ V és λ, µ ∈ T esetén teljesülnek a következő tulajdonságok: 1. λ(a + b) = λa + λb, 2. (λ + µ)a = λa + µa, 3. (λµ)a = λ(µa), 4. 1a = a. Ekkor V elemeit vektoroknak nevezzük. Példák: 1. Mm×n (T ) a fent bevezetett skalárral való szorzással vektortér a T test felett. 2. A T test elemeiből alkotott rendezett elem n-esek halmaza vektortér a T test felett, ha az összeadást és a skalárral való szorzást komponensenként végezzük el: (a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) = (a1 + b1 , a2 + b2 , . . . , an + bn ) és λ · (a1 , a2 , . . . , an ) = (λa1 , λa2 , . . . , λan ). 116
Ezt a vektorteret T n -nel jelöljük. Megjegyezzük, hogy T n elemeit gyakran azonosítjuk az n × 1 vagy 1 × n típusú mátrixokkal. 3. Vektortér minden test bármely részteste felett. 4. Az összes T -beli együtthatós polinom a szokásos összeadással és konstanssal való szorzással vektorteret alkot a T test fölött. 5. Az összes valós számsorozatok halmaza vektortér a valós számtest fölött. 6. Jelölje E az euklideszi geometriai teret. Az E tér pontjaiból képzett rendezett párokat irányított szakasznak mondjuk. Az (A, B) és (C, D) irányított szakaszokat ekvivalensnek nevezzük, ha van a térnek olyan p : E → E eltolása, amelyre p(A) = C és p(B) = D teljesül, azaz a p eltolás az első irányított szakasz kezdő-, illetve végpontját a másik kezdő-, illetve végpontjába viszi át. Könnyen látható, hogy ez reláció reflexív, szimmetrikus és tranzitív, azaz ekvivalencia-reláció. Szabadvektorok alatt az ezen ekvivalencia-reláció osztályait értjük. Egy szabadvektor tehát egymásból párhuzamos eltolással megkapható szakaszoknak a halmaza. Egy szabadvektor egy elemét a szabadvektor reprezentánsának mondjuk. Világos, hogy minden szabadvektor egyértelműen azonosítható bármely reprezentánsával, továbbá minden szabadvektornak a tér bármely pontjából indul reprezentánsa. Vegyük az a és b szabadvektorok
9.1. ábra. Szabadvektorok összeadása egy-egy olyan reprezentánsát, melyre az a vektor reprezentánsának végpontja és a b reprezentánsának kezdőpontja egybeesik. Jelölje c azt a szabadvektort, melyhez az a fenti reprezentánsának kezdőpontjából induló, és a b reprezentánsának végpontjába érkező szakasz tartozik. Az a és b szabadvektorok összegén éppen a c szabadvektort értjük. Mint az a 9.2. ábrán is látszik, az összeg nem függ a reprezentánsok megválasztásától, tehát a definíció korrekt. A nempárhuzamos vektorok összegének meghatározására az úgynevezett pa-
117
9.2. ábra. A szabadvektorok összeadása nem függ a reprezentánsok megválasztásától
9.3. ábra. Szabadvektorok összeadása paralelogramma módszerrel
ralelogramma módszer is használható (9.3. ábra). Most definiáljuk az a szabadvektor λ valós számmal történő szorzását: ha λ pozitív skalár, tekintsük a-nak egy (O, A) reprezentánsát, és alkalmazzuk az O középpontú λ arányú hasonlóságot. Jelölje A0 az A képét. Ekkor λa alatt az (O, A0 ) által reprezentált szabadvektort értjük. Ha λ negatív, akkor |λ| arányú középpontos hasonlóság, majd O-ra való tükrözés alkalmazásával kapjuk az A0 pontot. Legyen végül 0 · a = 0, bármely a szabadvektor esetén, ahol az egyenlőség jobb oldalán lévő 0 az additív zéruselemet jelenti. Könnyen belátható, hogy az így definiált összeadással és skalárral való szor-
9.4. ábra. Az a vektor és néhány skalárszorosa zással a szabadvektorok halmaza vektortér a valós számtest felett. Például a szabadvektorok összeadásának kommutativitása a paralelogramma módszer 118
alapján, asszociatív tulajdonsága pedig a definíció alapján könnyen belátható (l. 9.5. és 9.6. ábrák).
9.5. ábra. A szabadvektorok összeadása kommutatív
9.6. ábra. A szabadvektorok összeadása asszociatív
Legyen V vektortér a T test felett, λ ∈ T és a ∈ V . Nem nehéz igazolni, hogy λa = 0 akkor és csak akkor teljesül, ha λ = 0 vagy a = 0. A V vektortér L részhalmazát altérnek nevezzük, ha L maga is vektortér a V -beli műveletekkel, ugyanazon test fölött. Minden vektortérnek altere a {0} és önmaga. Az alábbi állítás a részcsoport-kritérium (5.4. tétel) egyenes következménye: 9.1. Tétel (Altérkritérium). A V vektortér L nemüres részhalmaza pontosan akkor altér, ha bármely a, b ∈ L és λ ∈ T esetén a − b és λa is elemei L-nek. Néhány példa altérre: 1. A szabadvektorok körében egy rögzített szabadvektor és annak összes skalárszorosai alteret alkotnak. 2. R2 -ben, egy origón átmenő egyenesre illeszkedő pontok halmaza is altér. 3. Egy test fölötti polinomok vektorterében altér egy adott n-nél nem nagyobb fokszámú polinomok halmaza. 4. Az Mn×n (T ) vektortérben a felső háromszögmátrixok halmaza. 5. Szintén alteret alkot a valós számsorozatok vektorterében a konvergens sorozatok halmaza. 119
9.7. ábra. R2 alterei Tekintsük egy vektortér tetszőleges számú alterét és jelölje H mindezek metszetét. Ha a, b ∈ H, akkor a és b benne vannak mindegyik altérben, így az altérkritérium szerint a − b is, és ha λ ∈ T , akkor λa is benne van mindegyik altérben, tehát a − b ∈ H és λa ∈ H. Ekkor viszont az altérkritérium szerint H altér. Igazoltuk tehát, hogy alterek metszete is altér. Nem mondható el ugyanez az alterek uniójáról: belátható, hogy két altér uniója csak úgy lehet altér, ha egyikük tartalmazza a másikat. A továbbiakban vektorrendszeren a vektortér véges vagy végtelen számú vektorát értjük, úgy, hogy abban egy vektor akár többször is szerepelhet (valójában a vektorrendszer ennyiben különbözik vektorok egy halmazától). Következésképpen a vektortér részhalmazai is vektorrendszereknek tekinthetők. Legyen V vektortér és H egy nemüres vektorrendszere V -nek. A H által generált altér alatt V a H vektorrendszert tartalmazó altereinek a metszetét értjük. Ezt az alteret L(H) jelöli. L(H) nyilván V „legszűkebb” olyan altere lesz, mely tartalmazza a H vektorrendszert. A legszűkebb jelző itt azt jelenti, hogy minden olyan altér, ami tartalmazza a H vektorrendszert, szükségképpen tartalmazza L(H)-t is.
9.8. ábra. L(H) a V H-t tartalmazó altereinek metszete Legyenek a1 , a2 , . . . , an a V vektortér vektorai, és λ1 , λ2 , . . . , λn adott skalárok. Ekkor a λ1 a1 + λ2 a2 + · · · + λn an 120
vektort az a1 , a2 , . . . , an vektorok λ1 , λ2 , . . . , λn együtthatókkal képzett lineáris kombinációjának nevezzük. Mivel a lineáris kombináció tulajdonképpen vektorok skalárral való szorzása, majd azok összeadása, a lineáris kombináció nem vezet ki az altérből, azaz egy altér tetszőleges vektorainak tetszőleges együtthatókkal vett lineáris kombinációja is eleme az altérnek. A lineáris kombináció segítségével le tudjuk írni L(H) elemeit. 9.2. Tétel. Legyen V vektortér, és H egy nemüres vektorrendszere V -nek. Ekkor L(H) éppen a H-beli vektorok összes lineáris kombinációinak halmaza. Bizonyítás. Jelölje H ∗ a H-beli vektorok összes lineáris kombinációinak halmazát. Mivel H ⊂ L(H), az előző megjegyzés szerint H ∗ ⊂ L(H). Másrészt megmutatjuk, hogy H ∗ altér. Valóban, legyenek a és b tetszőleges lineáris kombinációi H-beli vektoroknak, és tegyük fel, hogy ezen lineáris kombinációkban szereplő összes Hbeli vektorok az a1 , a2 , . . . , an , azaz léteznek olyan αi és βi skalárok, hogy a = α1 a1 + α2 a2 + · · · + αn an
és b = β1 a1 + β2 a2 + · · · + βn an .
Ekkor nyilván a − b = (α1 − β1 )a1 + (α2 − β2 )a2 + · · · + (αn − βn )an és λa = (λα1 )a1 + (λα2 )a2 + · · · + (λαn )an is H-beli vektorok lineáris kombinációi, azaz H ∗ elemei. Tehát H ∗ egy H-t tartalmazó altér V -ben, L(H) pedig az ilyenek metszete, így L(H) ⊆ H ∗ is teljesül. A fenti tétel alapján az L(H) alteret a H vektorrendszer lineáris lezártjának is szokás nevezni. Könnyű belátni, hogy egy vektorrendszer által generált altér nem változik, ha a vektorrendszeren az alábbi átalakításokat végezzük: 1. egy vektort szorzunk egy nemnulla skalárral, 2. egy vektorhoz hozzáadjuk egy másik vektor skalárszorosát, 3. elhagyunk a vektorrendszerből olyan vektort, mely előáll a megmaradók lineáris kombinációjaként,
121
ugyanis ezekben az esetekben a régi és az új vektorrendszer vektorai összes lineáris kombinációinak halmaza megegyezik. A V vektortér egy H vektorrendszerét a vektortér generátorrendszerének nevezzük, ha L(H) = V , azaz V minden eleme előáll H-beli vektorok lineáris kombinációjaként. Egy vektortér végesen generált, ha van véges sok elemből álló generátorrendszere. Az R2 vektortér végesen generált, mivel a H = {(1, 0), (0, 1)} halmaz a vektortér egy véges (kételemű) generátorrendszere, ugyanis tetszőleges (a, b) ∈ R2 vektor előáll H elemeinek lineáris kombinációjaként, nevezetesen (a, b) = a(1, 0) + b(0, 1). Könnyen belátható az is, hogy a polinomok vektorterének nincs véges sok elemből álló generátorrendszere, hiszen véges sok polinom semmilyen lineáris kombinációjának foka sem haladja meg az ezen polinomok közötti legmagasabb fokú polinom fokát.
9.1. Vektorok lineáris függősége Legyenek a1 , a2 , . . . , an adott vektorai a V vektortérnek. Most nézzük meg, hogy milyen λ1 , λ2 , . . . , λn skalárok esetén lesz a λ1 a1 + λ2 a2 + · · · + λn an lineáris kombináció a zérusvektor. A legnyilvánvalóbb válasz erre, hogy például akkor, ha λ1 = λ2 = · · · = λn = 0. Ha ettől különböző esetben ez nem fordulhat elő, akkor azt mondjuk, hogy az a1 , a2 , . . . , an vektorok lineárisan függetlenek, vagy más szóval lineárisan független vektorrendszert alkotnak. Egyébként pedig lineárisan függő vektorokról beszélünk. Egy vektortér adott véges sok vektorát lineárisan függetleneknek mondjuk, ha azok lineáris kombinációjaként a zérusvektor csak úgy állítható elő, hogy minden együttható nulla. Egyébként a vektorokat lineárisan függőeknek mondjuk. Végtelen sok vektort tartalmazó vektorrendszerre akkor mondjuk, hogy lineárisan független, ha annak bármely véges alrendszere lineárisan független, azaz közülük bárhogyan is választunk ki véges sok vektort, azok lineárisan függetlenek lesznek. Könnyen igazolható, hogy ha H lineárisan független vektorrendszer (azaz vektorai lineárisan függetlenek), akkor minden H-ból vektorok elhagyásával nyert nemüres vektorrendszer szintén lineárisan független.
122
9.3. Tétel. A V vektortér a1 , a2 , . . . , an vektorai, ahol n > 2, pontosan akkor lineárisan függőek, ha közülük valamelyik felírható a többi lineáris kombinációjaként. Bizonyítás. Valóban, ha az a1 , a2 , . . . , an vektorok lineárisan függőek, akkor a λ1 a1 + λ2 a2 + · · · + λn an = 0 egyenlőség úgy is teljesül, hogy az együtthatók között van nullától különböző. Legyen ez mondjuk λ1 . A fenti egyenlőséget λ1 -gyel osztva, majd átrendezve kapjuk, hogy a1 = −
λ2 λn a2 − · · · − an , λ1 λ1
vagyis az a1 vektor előáll a többi lineáris kombinációjaként. Fordítva, ha például a1 = λ2 a2 + · · · + λn an , akkor teljesül a 0 = −a1 + λ2 a2 + · · · + λn an egyenlőség, melyben a1 együtthatója nem nulla. Tehát az a1 , a2 , . . . , an vektorok lineárisan függőek. A tételből könnyen következik, hogy 1. ha egy vektorrendszer tartalmazza a zérusvektort, akkor lineárisan függő; 2. ha egy vektorrendszer két azonos vektort tartalmaz, akkor lineárisan függő; 3. két vektor pontosan akkor lineárisan függő, ha egyik a másiknak skalárszorosa. A tér két szabadvektora pontosan akkor lineárisan függő, ha párhuzamosak, három szabadvektor pedig pontosan akkor lineárisan függő, ha komplanárisak (azaz egy síkra illeszkednek). Egy vektortér egy lineárisan független generátorrendszerét a vektortér bázisának nevezzük. Könnyen látható, hogy a bázis tulajdonképpen egy „minimális” generátorrendszer. Hamel tétele szerint minden vektortérnek van bázisa. A V maximális lineárisan független vektorrendszerén olyan lineárisan független vektorrendszert értünk, amely bármely V -beli vektor hozzávétele után már lineárisan függő lesz. 123
9.4. Tétel. Legyen B a V vektortér egy vektorrendszere. Az alábbi állítások ekvivalensek: 1. B bázisa V -nek. 2. B maximális lineárisan független vektorrendszere V -nek. 3. V minden eleme egyértelműen felírható B elemeinek lineáris kombinációjaként. Bizonyítás. 1. ⇒ 2. Mivel B bázis, így generátorrendszer is, és tetszőleges a ∈ ∈ V vektor előáll B-beli vektorok lineáris kombinációjaként. Ekkor a 9.3. tétel értelmében B a-val kiegészítve már lineárisan függő, tehát B maximális lineárisan független vektorrendszer. 2. ⇒ 3. Válasszunk egy tetszőleges a ∈ V vektort! Mivel B maximális lineárisan független vektorrendszer, léteznek olyan a1 , a2 , . . . , an ∈ B vektorok, hogy a λa + λ1 a1 + λ2 a2 + · · · + λn an = 0 egyenlőség teljesül úgy, hogy a λ, λ1 , λ2 , . . . , λn skalárok nem mindegyike nulla. Itt feltehető, hogy λ 6= 0, ugyanis ellenkező esetben B-nek lineárisan függőnek kellene lennie. Kaptuk tehát, hogy a=−
λ1 λ2 λn a1 − a2 + · · · − an , λ λ λ
melyből következik, hogy minden a ∈ V előáll B-beli vektorok lineáris kombinációjaként, azaz B generátorrendszer. Tegyük fel, hogy az a ∈ V vektor kétféleképpen is előáll az a1 , a2 , . . . , an különböző B-beli vektorok lineáris kombinációjaként: a = α1 a1 + α2 a2 + · · · + αn an és a = β1 a1 + β2 a2 + · · · + βn an . Kivonva egymásból a kettőt, kapjuk, hogy 0 = (α1 − β1 )a1 + (α2 − β2 )a2 + · · · + (αn − βn )an .
124
Mivel B lineárisan független, ez csak úgy lehet, ha α1 = β1 , α2 = β2 , . . . , αn = βn , tehát az előállítás egyértelmű. 3. ⇒ 1. Feltéve, hogy V minden eleme egyértelműen előáll B-beli vektorok lineáris kombinációjaként, kapjuk, hogy B generátorrendszer. Nyilván a zérusvektor is csak egyféleképpen áll elő B elemeinek lineáris kombinációjaként, ez nem lehet más, mint a csupa nulla együtthatókkal vett lineáris kombináció, ezért B lineárisan független. Tehát B bázis. Példa: Könnyen látható, hogy a T n vektortérben az e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1) vektorok bázist alkotnak, melyet a vektortér természetes bázisának nevezünk. Továbbá, a polinomok vektorterének egy bázisa 1, x, x2 , . . . Ismert, hogy végesen generált vektortérben minden bázis egyenlő számosságú. Egy végesen generált V vektortér bázisainak közös számosságát a vektortér dimenziójának nevezzük. Jele: dim V . Mint azt az előbb láthattuk, dim T n = n. Ha egy vektortér nem végesen generált, akkor azt mondjuk, hogy a vektortér dimenziója végtelen. Például dim R[x] = ∞. Mi a továbbiakban csak végesen generált vektorterekkel foglalkozunk. Megjegyezzük, hogy ha a V vektortér dimenziója n, akkor belátható, hogy minden n elemű lineárisan független vektorrendszer bázist alkot V -ben, és minden n-nél kisebb elemszámú lineárisan független vektorrendszer bázissá egészíthető ki további vektorok hozzávételével. Legyen a1 , . . . , an a V vektortér egy bázisa. Most szükségünk lesz arra a feltevésre, hogy a bázisvektorok sorrendje rögzített, ezért az n darab bázisvektort egy rendezett elem n-es komponenseinek tekintjük, és a bázist ennek megfelelően (a1 , . . . , an )-nel jelöljük. Ha a ∈ V , akkor azon λ1 , . . . , λn skalárokat, melyekre a = = λ1 a1 +λ2 a2 +· · ·+λn an , az a vektor (a1 , . . . , an ) bázisra vonatkozó koordinátáinak nevezzük. Ha az a vektort az előre rögzített (a1 , . . . , an ) bázisban koordinátáival adjuk meg, akkor azt írjuk, hogy a = (λ1 , . . . , λn ). Ez a jelölés első ránézésre megtévesztő lehet, mert ez így olyan, mintha a egy T n -beli vektor lenne. Könnyen látszik azonban, hogyha az x és y vektorok koordinátái az adott bázisra vonatkozóan rendre α1 , . . . , αn és β1 , . . . , βn , akkor az x + y vektor koordinátái ugyanebben
125
a bázisban α1 + β1 , . . . , αn + βn , továbbá tetszőleges λ skalár esetén a λx vektor koordinátái pedig λα1 , . . . , λαn lesznek. Következésképpen, koordinátákkal adott vektorokkal „ugyanúgy” kell a vektortér alapműveleteit elvégezni, mint a T n elemeivel, ezért nyugodtan kezelhetjük a koordinátákat T n elemeiként. Ezt a koncepciót a Lineáris leképezések című fejezetben tovább pontosítjuk. Definíció szerint T n vektorainak a tér természetes bázisára vonatkozó koordinátái pontosan a vektor komponensei lesznek. Most megmutatjuk, hogy az R2 vektortérben az a1 = (3, 2) és a2 = (−1, −2) vektorok bázist alkotnak, és felírjuk a b = (1, −3) vektor koordinátáit az (a1 , a2 ) bázisban. Lévén dim R2 = 2, ahhoz, hogy az a1 , a2 vektorok bázist alkotnak, elég belátni, hogy lineárisan függetlenek, vagyis azt kell megmutatni, hogy a λ1 a1 + λ2 a2 = 0
(9.1)
egyenlőség csak a λ1 = λ2 = 0 esetben teljesülhet. Az egyenlőség bal oldalán lévő kifejezés λ1 (3, 2) + λ2 (−1, −2) = (3λ1 , 2λ1 ) + (−λ2 , −2λ2 ) = (3λ1 − λ2 , 2λ1 − 2λ2 ), amely nyilván csak úgy lehet egyenlő a 0 = (0, 0) vektorral, ha 3λ1 − λ2 = 0, és 2λ1 − 2λ2 = 0. Ez egy kétismeretlenes lineáris egyenletrendszer, melynek megoldása történhet például úgy, hogy az első egyenletből λ2 -t kifejezzük: λ2 = 3λ1 , majd ezt a második egyenletbe helyettesítjük: 2λ1 − 2 · 3λ1 = 0, ahonnan −4λ1 = 0, azaz λ1 = 0 adódik. Ekkor λ2 = 2λ1 = 0, tehát az a1 , a2 vektorok lineárisan függetlenek, és így egy bázisát alkotják az R2 vektortérnek. Ahhoz, hogy kiszámoljuk a b = (1, −3) vektor koordinátáit az (a1 , a2 ) bázisban, a λ1 a1 + λ2 a2 = b egyenlet megoldására van szükség, melynek bal oldala megegyezik az imént megol-
126
dott (9.1) egyenlet bal oldalával. Ugyanazt az eljárást alkalmazva a 3λ1 − λ2 = 1 2λ1 − 2λ2 = −3 egyenletrendszerhez jutunk, melynek λ1 = 5/4 és λ2 = 11/4 megoldására az olvasó valamely általa ismert módszerrel bizonyára könnyen rábukkan. A b vektor új koordinátái tehát 5/4 és 11/4, melyet úgy jelölünk, hogy (5/4, 11/4). A bázisvektorok sorrendjének fontosságának hangsúlyozása céljából megemlítjük, hogy a b vektor koordinátai az (a2 , a1 ) bázisban nyilván (11/4, 5/4) lennének. Láthatjuk, hogy a lineáris egyenletrendszerek megoldása a feladat megoldásának fontos eszköze. Ha magasabb dimenzióban számolunk, kettőnél több ismeretlent tartalmazó lineáris egyenletrendszerek megoldására lesz szükség. Többek között emiatt szenteljük a következő fejezetet a lineáris egyenletrendszerek elméletének áttekintésére.
9.2. Vektorrendszer rangja Azt mondjuk, hogy egy vektorrendszer rangja r, ha a vektorrendszerből kiválasztható r darab lineárisan független vektor, de r + 1 már nem. Az a1 , a2 , . . . , an vektorrendszer rangját Rank(a1 , a2 , . . . , an ) jelöli. Egy vektorrendszer rangja megegyezik az általa generált altér dimenziójával. 9.5. Tétel. Ha egy vektorrendszer vektoraihoz hozzáveszünk egy olyan vektort, amely előáll a vektorrendszer vektorainak lineáris kombinációjaként, akkor a vektorrendszer rangja nem változik. Bizonyítás. Tegyük fel, hogy az a1 , a2 , . . . , an vektorrendszer rangja r, és legyen b egy olyan vektor, mely előáll ezek lineáris kombinációjaként, azaz b = λ1 a1 + λ2 a2 + · · · + λn an
(9.2)
valamely λ1 , λ2 , . . . , λn skalárokkal. Megmutatjuk, hogy az a1 , a2 , . . . , an , b vektorrendszer rangja nem lehet r + 1. Valóban, ha a rangja r + 1 lenne, akkor kiválaszthatnánk belőle r + 1 lineárisan független vektort, amely nyilván tartalmazná a b vektort, és az általánosság megszorítása nélkül feltehető, hogy a többi vektor az a1 , a2 , . . . , ar . Ekkor az a1 , a2 , . . . , an vektorok mindegyike előáll az a1 , a2 , . . . , ar vektorok lineáris kombinációjaként, ugyanis r darab lineárisan füg127
getlen vektorról van szó. Ezen előállításokat a (9.2) egyenlőségbe helyettesítve láthatjuk, hogy a b vektor előáll az a1 , a2 , . . . , ar vektorok lineáris kombinációjaként, ezért az a1 , a2 , . . . , ar , b vektorrendszer már lineárisan függő, ami ellentmond a feltevésünknek. Ez azt mutatja, hogy az a1 , a2 , . . . , an , b vektorrendszer rangja nem lehet r + 1, tehát marad r. Világos, hogy egy T test feletti m×n típusú mátrix sorait tekinthetjük mint T n beli vektorokat (ezeket a mátrix sorvektorainak nevezzük), oszlopait pedig mint T m vektorait (ezek a mátrix oszlopvektorai). Egy mátrix rangján a sorvektor-rendszere rangját értjük. Az A mátrix rangját Rank A jelöli. Miért pont a sorokat tüntettük ki? A kövekező tétel szerint ennek nincs jelentősége. 9.6. Tétel (Rangszámtétel). A következő állítások ekvivalensek. 1. Az A mátrix rangja r. 2. Az A mátrix oszlopvektor-rendszerének rangja r. 3. Az A mátrixnak van r-ed rendű nemnulla aldeterminánsa, de nincs r + 1-ed rendű nemnulla aldeterminánsa. Tehát a tétel szerint egy mátrix oszlopvektor-rendszerének rangja, sorvektorrendszerének rangja, valamint a mátrix legnagyobb rendű nemnulla aldeterminánsának a rendje mindig megegyezik. 9.2.1. Mátrix rangjának kiszámítása eliminációval Ebben a részben a determinánsok kiszámításánál mutatott eliminációs módszert fejlesztjük tovább. Egy mátrixon végrehajtott elemi sor/oszlop átalakításon a következő műveletek valamelyikét értjük: – a mátrix sorainak vagy oszlopainak felcserélése, – egy sor/oszlop skalárszorosának hozzáadása egy másik sorhoz/oszlophoz, – egy sor/oszlop minden elemének megszorzása egy nullától különböző skalárral.
128
Egy mátrix egy sorának vezető eleme alatt a sor első nullától különböző elemét értjük, feltéve, hogy van ilyen. Egy mátrixot lépcsős alakúnak mondunk, ha teljesülnek rá az alábbi tulajdonságok: 1. A nullától különböző elemet is tartalmazó sorok megelőzik a csupa nulla elemekből álló sorokat. 2. Két egymást követő, nem csupán nulla elemeket tartalmazó sor közül az első vezető elemének oszlopindexe kisebb, mint a másodiké. A 2 0
0
1
−1
0
3
1
0
0
0
0
3 1 0
mártix például lépcsős alakú. Lépcsős alakú továbbá az összes felső háromszögmátrix. Egy lépcsős alakú mátrixot trapéz alakúnak nevezünk, ha az egymást követő, nem csupán nulla elemeket tartalmazó sorok vezető elemei oszlopindexeinek különbsége 1. A fenti lépcsős alakú mátrix nem trapéz alakú; a második és harmadik oszlopok felcserélésével lehetne azzá tenni. Általában is igaz, hogy lépcsős mátrix oszlopcserékkel mindig trapéz alakúra hozható. Az eliminációs módszer főtétele a következő: 9.7. Tétel. Minden mátrix elemi sor/oszlop átalakításokkal lépcsős (és így trapéz) alakúra hozható. Bizonyítás. Tulajdonképpen az itt leírt eljárást nevezzük Gauss-eliminációnak. Válasszuk ki az első olyan oszlopot, melyben van nullától különböző elem. Ha nem eleve úgy van, sorcserével elérhető, hogy ennek az oszlopnak az első eleme nullától különböző legyen. Ekkor az első sor alkalmas konstansszorosait a többi sorhoz hozzáadva elérhető, hogy a szóban forgó oszlop elemei a másodiktól kezdődően mind nullák legyenek. Utána áttérünk a következő oszlopra, melynek a harmadik elemétől kezdődően minden elemét az előbbihez hasonlóan nullázhatjuk ki. Mivel az oszlopok száma véges, így az eljárás véges sok lépésben véget ér, és nyilvánvaló, hogy olyan mátrixot eredményez, melyben két egymást követő, nem csupán nulla elemeket tartalmazó sor közül az első vezető elemének oszlopindexe kisebb, mint a másodiké. Végül arról, hogy nullától különböző elemet is tartalmazó sorok megelőzzék a csupa nulla elemekből álló sorokat, sorcserével gondoskodhatunk.
129
Példaként az
2 1 A= 0 1
0
1
3
1
0 −1
−2
1
5
−3
2
10
−1
1 −3 −5
mátrixot hozzuk trapéz alakra (a ∼ szimbólum azt jelzi, hogy a két oldalán álló mátrix egyikéből a másik elemi sor/oszlop átalakítással kapható meg): 1 2 A∼ 0 1 1 0 ∼ 0 0 1 0 ∼ 0 0
1
0 −1
0
1
3
−2
1
5
−3
2
10
1
0 −1
−2
1
5
0
0
0
0
0
1
1
−1
0
−2
5
1
0 0
1 0
0 0
1 −1 ∼ 0 −3 0 −5 0 1 1 −3 ∼ 0 0 0 0 0 1 −3 . 0 0 1
1
0 −1
−2
1
5
−2
1
5
−4
2
11
1
0 −1
−2
1
5
0
0
1
0
0
0
1
−3 ∼ −3 −6 1 −3 ∼ 0 0
Ez a következő lépéseken keresztül történt: 1. Kényelmi okok miatt felcseréltük az első két sort, ennek köszönhetően az első oszlop első elemének az oszlop összes többi eleme a többszöröse lesz. 2. Kivontuk az első sor kétszeresét a másodikból, majd az első sort a negyedikből. 3. Az eliminációt a második oszloppal folytattuk: a második sort kivontuk a harmadikból, majd a második sor kétszeresét kivontuk a negyedikből. 4. A nullától különböző elemet is tartalmazó sorok meg kell előzzék a csupa nulla elemekből álló sorokat, így a 3. és 4. sorokat felcseréltük. 5. A kapott mátrix már lépcsős alakú, a trapéz alak a 3. és 4. oszlopok felcserélésével érhető el.
130
Az A mátrix lépcsős alakjából egyszerűen leolvasható, hogy a rangja 3, hiszen harmadrendűnél nagyobb nemnulla aldeterminánst nem tartalmazhat, harmadrendűt viszont igen, ilyen például az 1.,2. és a 4. sorok és ugyanezen indexű oszlopok által kimetszett aldetermináns. Ebből az is következik, hogy az A mátrix sorvektorai és oszlopvektorai között az 1., 2. és a 4. lineárisan függetlenek. Általában igaz, hogy egy mátrix rangja a lépcsős alakjában maradó, nem csupa nulla elemeket tartalmazó sorok számával egyenlő.
9.3. Feladatok 9.1. Feladat. Vektorteret alkotnak-e a pontosan n-ed fokú polinomok a polinomok összeadására és konstanssal való szorzására nézve? 9.2. Feladat. Igazolja, hogy V kommutatív voltát nem szükséges a vektortér definíciójában feltenni, hiszen azt a 1. − 4. tulajdonságok teljesülése maga után vonja! (Útmutatás: alkalmazza az említett tulajdonságokat az (1 + 1)(a + b) vektorra!) 9.3. Feladat. Mutassuk meg, hogy T 4 -ben a H1 = {(a, 0, b, 0) : a, b ∈ T } és H2 = = {(a, b, a, c) : a, b, c ∈ T } halmazok alterek! Adjon meg egy-egy bázist ezekben az alterekben! 9.4. Feladat. Mutassuk meg, hogy a 3×2 típusú mátrixok körében alteret alkotnak azon A = [aij ]3×2 mátrixok, melyre a11 = a31 = 0! 9.5. Feladat. Adottak az x és x2 polinomok R[x]-ben. Mely polinomokat kell hozzávennünk (minél kevesebbet), hogy alteret kapjunk? 9.6. Feladat. Mutassa meg, hogy minden altér tartalmazza a vektorainak összes lineáris kombinációját! 9.7. Feladat. Mutassa meg, hogy az a = (1, 2), b = (1, 0) vektorrendszer generátorrendszere R2 -nek! 9.8. Feladat. Mutassa meg, hogy az (1, 3) és (−1, 5) lineárisan független vektorai R2 -nek! 9.9. Feladat. Mutassa meg, hogy a b1 = (−1, 4) és b2 = (2, −3) vektorok bázist alkotnak R2 -ben, és adja meg az x = (2, 3) vektor ezen bázisra vonatkozó koordinátáit!
131
9.10. Feladat. Mutassa meg, hogy egy adott A mátrixon végrehajtott elemi sor/oszlop átalakítások mindegyike megvalósítható az A mátrix egy-egy alkalmas mátrixszal (balról vagy jobbról) való szorzásával! 9.11. Feladat. Adjon alsó és felső korlátot az olyan m × n típusú mátrixok rangjára, melyeknek van legalább egy nullától különböző eleme! 9.12. Feladat. Határozza meg az alábbi vektorok által generált alterek egy bázisát és dimenzióját! a) x1 = (2, 1, 3, 1),
x2 = (1, 2, 0, 1),
x3 = (−1, 1, −3, 0)
b) x1 = (2, 0, 1, 3, −1), x3 = (0, −2, 1, 5, −3),
x2 = (1, 1, 0, −1, 1), x4 = (1, −3, 2, 9, −5)
c) x1 = (2, 1, 3, −1),
x2 = (−1, 1, −3, 1),
x3 = (4, 5, 3, −1),
x4 = (1, 5, −3, 1)
d) x1 = (1, 0, 0, −1), x3 = (1, 1, 1, 1),
x2 = (1, 1, 1, 0), x4 = (1, 2, 3, 4),
x5 = (0, 1, 2, 3)
e) x1 = (−3, 1, 5, 3, 2), x3 = (1, 2, 3, 2, 1),
x2 = (2, 3, 0, 1, 0), x4 = (3, −5, −1, −3, −1),
x5 = (3, 0, 1, 0, 0)
f) x1 = (1, 2, 2, −1),
x2 = (2, 3, 2, 5),
x3 = (−1, 4, 3, 1),
x4 = (2, 9, 3, 5)
132
10. Lineáris egyenletrendszerek A 2x − 3y = 4 x + 5y = −1
egyenletrendszer megoldása vélhetően senki számára nem okoz gondot. Középis-
10.1. ábra. A példánkban szereplő kétismeretlenes lineáris egyenletrendszer grafikusan is megoldható: a megoldást a két egyenes metszéspontjának koordinátái adják kolában legalább két módszert tanultunk a megoldások megkeresésére: valamelyik ismeretlent az egyik egyenletből kifejezzük, majd a másikba helyettesítjük; vagy az egyik egyenlet alkalmas konstansszorosát a másikhoz hozzáadva elérjük, hogy az összeg már csak egy ismeretlent tartalmazzon. Célunk ennek továbbfejlesztése olyan esetekre, amikor az ismeretlenek és az egyenletek száma is tetszőleges, továbbá az együtthatók nem feltétlenül valós számok. Az a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . am1 x1 + am2 x2 + · · · + amn xn = bm
133
objektumot, ahol A = [aij ]m×n és B = [bi ]m×1 adott T test feletti mátrixok, (n változós, m egyenletből álló) lineáris egyenletrendszernek nevezzük. Az A mátrixot az egyenletrendszer alapmátrixának, elemeit az egyenletrendszer együtthatóinak, Bt a szabadtagok vektorának, az
a11
a12
···
a1n
b1
a21 [A | B] = .. .
a22 .. .
···
a2n .. .
b2 .. .
am1
am2
···
amn
bm
m × (n + 1) típusú mátrixot pedig az egyenletrendszer kibővített mátrixának nevezzük. Azt mondjuk, hogy a lineáris egyenletrendszer megoldható, ha létezik olyan (α1 , α2 , . . . , αn ) T n -beli vektor, hogy az x1 = α1 , x2 = α2 , . . . , xn = αn helyettesítéssel az egyenletrendszerben minden egyenlőség fennáll. Egyébként ellentmondásosnak nevezzük. Jelölje ai az egyenletrendszer alapmátrixának i-edik oszlopvektorát, valamint X az ismeretlenek oszlopvektorát. Ekkor a lineáris egyenletrendszer mátrixos alakja AX = B, vektoros alakja x1 a1 + x2 a2 + · · · + xn an = B. Ez utóbbi alakból látszik, hogy ha az egyenletrendszer megoldható, akkor a B vektor felírható az a1 , a2 , . . . , an vektorok lineáris kombinációjaként, így a 9.5. tétel miatt Rank(a1 , a2 , . . . , an ) = Rank(a1 , a2 , . . . , an , B). Fordítva, ha a rangok megegyeznek (mindkettő r), akkor az a1 , a2 , . . . , an vektorok közül kiválasztható r darab vektor úgy, hogy azok lineáris kombinációjaként előállítható a B vektor. Megőrizve az itt fellépő együtthatókat, a többit pedig nullának választva az egyenletrendszer egy megoldását kapjuk. Ezzel beláttuk a következő állítást: 10.1. Tétel (Kronecker-Capelli). Egy lineáris egyenletrendszer pontosan akkor oldható meg, ha alapmátrixának rangja megegyezik a kibővített mátrixának rangjával. Ha az egyenletrendszer megoldható, akkor léteznek olyan α1 , α2 , . . . , αn skalá134
rok, hogy α1 a1 + α2 a2 + · · · + αn an = B. Ha ez az egyenlőség a β1 , β2 , . . . , βn skalárokkal is fennállna, azaz β1 a1 + β2 a2 + · · · + βn an = B is teljesülne, akkor a kettőt egymásból kivonva kapnánk, hogy (α1 − β1 )a1 + (α2 − β2 )a2 + · · · + (αn − βn )an = 0. Világos, hogy az alapmátrix rangja nem lehet nagyobb, mint n, mely az ismeretlenek száma. Ha Rank A = n, akkor az a1 , a2 , . . . , an vektorok lineárisan függetlenek, így az előző egyenlőségben α1 = β1 , α2 = β2 , . . . , αn = βn kell, hogy teljesüljön. Tehát, ha egy megoldható lineáris egyenletrendszer alapmátrixának rangja egyenlő az ismeretlenek számával, akkor pontosan egy megoldása van. Most tegyük fel, hogy az egyenletrendszer megoldható, de alapmátrixának rangja kisebb, mint az ismeretlenek száma. Ekkor az a1 , a2 , . . . , an vektorok lineárisan függőek, azaz vannak olyan β1 , β2 , . . . , βn skalárok, melyek nem mindegyike nulla, hogy β1 a1 + β2 a2 + · · · + βn an = 0. Ha (α1 , α2 , . . . , αn ) az egyenletrendszer egy megoldása, akkor α1 a1 + α2 a2 + · · · + αn an = B, és így (α1 + β1 )a1 + (α2 + β2 )a2 + · · · + (αn + βn )an = B, azaz (α1 + β1 , α2 + β2 , . . . αn + βn ) egy másik, (α1 , α2 , . . . , αn )-től különböző megoldása az egyenletrendszernek. Ebből az következik, hogy ha egy megoldható lineáris egyenletrendszer alapmátrixának rangja kisebb, mint az ismeretlenek száma, akkor végtelen sok megoldása van (feltéve, hogy a test karakterisztikája 0). Most, hogy a lineáris egyenletrendszerek megoldhatóságával és a megoldásainak számával már tisztában vagyunk, nézzük meg, hogyan lehet egy lineáris egyenletrendszert megoldani!
135
10.1. Cramer-szabály 10.2. Tétel. Tegyük fel, hogy egy lineáris egyenletrendszer A alapmátrixa négyzetes, és determinánsa nem nulla. Ekkor a lineáris egyenletrendszer egyértelműen megoldható, és xk =
∆k , det A
ahol ∆k annak a mátrixnak a determinánsa, melyet az A alapmátrixból úgy kapunk, hogy annak k-adik oszlopa helyére a B oszlopvektort írjuk. Bizonyítás. Mivel det A 6= 0, a Kronecker-Capelli tétel értelmében az egyenletrendszer megoldható, és egyetlen megoldása van. Az AX = B mátrixos alak alapján ez a megoldás: X = A−1 B. Ekkor az inverzmátrix konstrukciója és a kifejtési tétel szerint xi =
n X
(A−1 )iu bu =
u=1
n n X 1 X ∆i Aui bu = bu Aui = . det A det A u=1 det A u=1
Példaként a fejezet bevezetőjében felírt lineáris egyenletrendszert oldjuk meg. Abban az egyenletek és az ismeretlenek (reméljük nem okoz gondot, hogy x1 és x2 helyett x és y szerepel) száma is 2, az alapmátrix determinánsa pedig " det
2
# −3
1
5
= 13 6= 0,
tehát a tétel feltételei maradéktalanul teljesülnek. A megoldás pedig: " det x=
4
−3
−1
5
13
# det 17 = , 13
és y =
" 2
4
1
−1
13
# =−
6 . 13
A módszer előnye az egyszerűsége, hátránya, hogy csak speciális esetben működik (lásd a sok feltételt), és ha az alapmártix „nagy”, akkor sok számolással jár.
10.2. Gauss-elimináció lineáris egyenletrendszerekre Két lineáris egyenletrendszert ekvivalensnek mondunk, ha megoldáshalmazaik megegyeznek. Könnyen igazolható, hogy az alábbi átalakítások egy lineáris egyenletrendszert vele ekvivalens lineáris egyenletrendszerbe visznek át: 136
– egyenlet szorzása nullától különböző konstanssal, – egy egyenlethez egy másik egyenlet konstansszorosának hozzáadása, – olyan egyenlet elhagyása, amely a megmaradók lineáris kombinációja, – egyenletek sorrendjének felcserélése, – az ismeretlenek sorrendjének felcserélése együtthatóikkal együtt minden egyenletben. Ebből következően, ha egy lineáris egyenletrendszer kibővített mátrixán elemi sorátalakításokat végzünk, akkor vele ekvivalens lineáris egyenletrendszer kibővített mátrixához jutunk. A következő tételben azt tárgyaljuk, hogyan következtethetünk a kibővített mátrix lépcsős alakjából az egyenletrendszer megoldhatóságára és megoldásaira. 10.3. Tétel. Egy lineáris egyenletrendszer pontosan akkor oldható meg, ha kibővített mátrixának lépcsős alakjában nincs olyan sor, melynek csak az utolsó eleme nem nulla. Bizonyítás. Ha a kibővített mátrix lépcsős alakjában van olyan sor, melyben az utolsó elem a 6= 0, de az összes többi elem 0, akkor ahhoz a 0 = a egyenlet tartozik, ami nyilván ellentmondás. Így tehát a lépcsős alakhoz tartozó lineáris egyenletrendszer nem oldható meg, és nyilván a vele ekvivalens eredeti sem. Ellenkező esetben a csupa nulla sorokat elhagyva, az egyes egyenletekben a tagok átrendezésével, majd az együtthatók és az ismeretlenek indexének ennek megfelelő átírásával elérhető, hogy az egyenletrendszer a következő alakú legyen: a11 x1 + a12 x2 + · · · + a1k xk + a1,k+1 xk+1 + · · · + a1n xn = b1 a22 x2 + · · · + a2k xk + a2,k+1 xk+1 + · · · + a2n xn = b2 .. . akk xk + ak,k+1 xk+1 + · · · + akn xn = bk , ahol a11 , a22 , . . . akk egyike sem nulla. Ebből a megoldás a következőképpen kapható meg: az utolsó egyenletben az xk+1 , . . . , xn ismeretlenek értéke szabadon megválasztható, legyenek ezek rendre a T test uk+1 , . . . un elemei (erre nyilván csak akkor
137
van szükség, ha az utolsó egyenlet több, mint egy ismeretlent tartalmaz), majd fejezzük ki az utolsó egyenletből xk -t: xk = −
ak,k+1 akn xk+1 − · · · − xn . akk akk
Az egyenleteken visszafelé haladva, a következőből hasonlóan fejezhető ki xk−1 , és így tovább, végül az utolsóból x1 . Oldjuk meg az x1 + 2x2 + x3 − x4 = 5 2x1 + x2 − 3x3 + x4 = 4
(10.1)
x1 + x2 + x3 + x4 = 3 lineáris egyenletrendszert a valós számok felett! Ennek kibővített mátrixa 1 2
2
1
−1
1
−3
1
1
1
1
1
5
4 , 3
mely lépcsős alakra hozva 1 2
2
1
−1
1
−3
1
1
1
1
1
5 1 2 4 ∼ 0 −3 3 0 −1 1 2 ∼ 0 −1 0
0
2
1
−1
3
1 −6 ∼ 0
−1
0
2
2
−2
−3
−5
3
1
−1
−5 0 1
−1
0
2
−5
−3
5
5
0
−2 . 0
Az ehhez tartozó x1 + 2x2 + x3 − x4 = 5 −x2 + 2x4 = −2 −5x3 − 3x4 = 0 lineáris egyenletrendszer ekvivalens az eredetivel. Az utolsó egyenlet −5x3 − 3x4 = 0, 138
5
−2 ∼ −6
melyben x4 szabadon megválasztható: legyen x4 = u, és ekkor 3 x3 = − u. 5 Behelyettesítve ezt a második egyenletbe −x2 + 2u = −2 adódik, ahonnan x2 = 2 + 2u. Végül az első egyenletből 3 x1 + 2(2 + 2u) − u − u = 5, 5 majd átrendezés után x1 =
5−12u . 5
Az egyenletrendszernek tehát végtelen sok meg-
oldása van. Az általános megoldás: x1 =
3 5 − 12u , x2 = 2 + 2u, x3 = − u, x4 = u, 5 5
ahol u tetszőleges valós szám. Konkrét megoldásokat úgy kaphatunk, ha u helyébe konkrét valós számot írunk. Például u = 0 esetben a megoldásvektor: (1, 2, 0, 0). Felhívjuk a figyelmet arra, hogy a lépcsős alakra hozás közben a kibővített mátrix utolsó oszlopa nem cserélhető fel a mátrix egyetlen más oszlopával sem. 10.2.1. Szimultán elimináció Tekintsük az R3 vektortér E = (e1 , e2 , e3 ) bázisát, ahol e1 = (1, −1, 1), e2 = (2, 1, −3), e3 = (3, 2, −5), és határozzuk meg az a = (6, 2, − 7) és b = (0, −2, 3) vektorok E bázisra vonatkozó koordinátáit! Kezdjünk az a vektorral: keressük meg azokat a λ1 , λ2 , λ3 valós számokat, melyekre λ1 e1 + λ2 e2 + λ3 e3 = a.
139
Innen λ1 (1, −1, 1) + λ2 (2, 1, −3) + λ3 (3, 2, −5) = (6, 2, −7), a skalárral való szorzás elvégzése után (λ1 , −λ1 , λ1 ) + (2λ2 , λ2 , −3λ2 ) + (3λ3 , 2λ3 , −5λ3 ) = (6, 2, −7), majd összeadás után (λ1 + 2λ2 + 3λ3 , −λ1 + λ2 + 2λ3 , λ1 − 3λ2 − 5λ3 ) = (6, 2, −7) adódik. Az egyenlőséget koordinátánként kifejtve a λ1 + 2λ2 + 3λ3 = 6 −λ1 + λ2 + 2λ3 = 2
(10.2)
λ1 − 3λ2 − 5λ3 = −7 lineáris egyenletrendszert kapjuk, melynek alapmátrixa az az A mátrix, melynek oszlopaiba rendre az e1 , e2 és e3 vektorok koordinátái kerülnek, a szabadtagok vektora pedig az a vektor. Világos, hogy a b vektor koordinátáinak keresésekor kapott
10.2. ábra. A (10.2) háromismeretlenes lineáris egyenletrendszert alkotó egyenletek síkok egyenleteinek is tekinthetők, a megoldás pedig a három sík metszete, amely – mint látható – egyetlen pont. egyenletrendszer alapmátrixa szintén A lesz, szabadtagjainak vektora pedig b. Mi-
140
vel az eliminációnál az alapmátrix dominál, a szabadtagokkal csupán „számolunk”, természetes gondolat, hogy a két egyenletrendszert egyszerre is meg lehetne oldani, ha az alapmátrixot nem csupán egy, hanem most két oszloppal bővítenénk:
1
2
3
6
1
2
2
−3
−5
−7
−1 1
0
−2 , 3
és ezen végezzük el az eliminációt:
1
−1 1
1 −2 ∼ 0
2
3
6
0
1
2
2
−3
−5
−7
3
2
3
6
0
−2 ∼ 0 −5 −8 −13 3 1 2 3 6 0 ∼ 0 3 5 8 −2 . 0 0 1/3 1/3 −1/3 3
5
8
Ezt az eljárást nevezzük szimultán eliminációnak, mely nyilván nem csak két, hanem tetszőleges számú oszloppal elvégezhető. A két egyenletrendszer megoldásához a visszahelyettesítéseket a két utolsó oszloppal külön-külön kell elvégezni: λ1 + 2λ2 + 3λ3 = 6 3λ2 + 5λ3 = 8 1 1 λ3 = 3 3 és λ1 + 2λ2 + 3λ3 = 0 3λ2 + 5λ3 = −2 1 1 λ3 = − , 3 3 ahonnan a megoldások már rögtön adódnak.
141
10.2.2. Gauss-Jordan-elimináció Láthattuk, hogy egy lineáris egyenletrendszer megoldása során az elimináció elvégzése még csak az útnak a fele, annak eredményeképpen csak egy, az eredetinél már sokkal egyszerűbb egyenletrendszert kapunk, melyet még meg kell oldanunk. Sőt, szimultán elimináció esetén nem is csak egy egyenletrendszerről van szó. A lépcsős alak elérése után akkor van a legkönnyebb dolgunk, ha az alapmátrix helyén az egységmátrix jelenik meg, mert akkor a megoldás számolás nélkül leolvasható (a megoldásvektor pontosan a szabadtagok oszlopában foglal helyet). Ilyen szerencsénk azonban ritkán van, de ha nagyon akarjuk, tehetünk érte. A fenti példánkban az eliminációt a következőképpen folytatjuk: – a harmadik sort osztjuk 1/3-dal, annak érdekében, hogy a sor harmadik eleme 1 legyen: 1 0
2
3
6
3
5
8
−2 ;
0
0
1
1
−1
0
– a harmadik sor háromszorosát kivonjuk az elsőből, az ötszörösét pedig a másodikból: 1 0
2
0
3
3
0
3
0
0
1
1
3
3 , −1
így a harmadik oszlop főátló feletti elemei már mind nullák lesznek; – fölfelé haladva most a második sort osztjuk 3-mal: 1 0
2
0
3
1
0
1
0
0
1
1
3
1 ; −1
– majd a kétszeresét kivonjuk az első sorból: 1 0
0
0
1
1
0
1
0
0
1
1
1
1 . −1
Ezt az eljárást nevezzük Gauss-Jordan-eliminációnak, melynek eredményeképpen a megoldások leolvashatók: az a és b vektor koordinátái az E bázisban rendre (1, 1, 1) 142
és (1, 1, −1). Megjegyezzük, hogy a Gauss-Jordan-elimináció alkalmazása csak szimultán elimináció esetén kifizetődő, ha csak egyetlen konstansoszlop van, általában az egységmátrix kialakítása több számolást igényel, mint a lépcsős alakból a megoldás kiszámítása. A Gauss-Jordan-elimináció hatékonyan alkalmazható mátrixok inverzeinek a meghatározására, úgy, hogy azt azon a mátrixon hajtjuk végre, melyet úgy kapunk, hogy az invertálandó mátrix mellé a vele megegyező típusú egységmátrixot írjuk. Ha a Gauss-Jordan-elimináció következtében az invertálandó mátrix helyén az egységmátrix előállt, akkor az egységmátrix mellett pontosan a keresett inverzmátrix szerepel. Ha pedig az elimináció megakad (az invertálandó mátrix valamely sora kinullázódik), akkor a mátrixnak nem létezik inverze. A 8. fejezetben az
1
−2
A= 1
−1
−1
0
1 −3
0
mátrix inverzét már meghatároztuk. Most megtesszük ugyanezt Gauss-Jordaneliminációval. A kiinduló mátrix az
1
1 −1
−2
0
−1
1
0
−3
0 0 1 0 , 0 0 1 1
0
az elimináció lépései pedig (a magyarázatot most mellőzzük) a következők: 1 ∼ 0
−2
0
1
0
1
1
−1
1
0 1 ∼ 0
0
−1
−1
2
0
−2
0
1
0
1
0 −2
0
1
3 −2
1
0 ∼ −1 2 1 .
−1
−1
0
0
1
A keresett inverzmátrix tehát:
A−1
0 1 −2 0 1 0 0 ∼ 0 1 1 −1 1 0 0 1 1 −2 1 1 0 0 3 6 0 ∼ 1 0 1 0 −2 3
−3 = −2 1
6 3 −2
143
2
1 . −1
1
−2
0
A módszer helyessége könnyen látható, ugyanis az A · A−1 = E egyenlőségből a mátrixok szorzásának definíciója alapján látható, hogy ha az A mátrixot az A−1 mátrix j-edik oszlopával (Xj ) mint oszlopmátrixszal szorozzuk, akkor éppen az E egységmátrix j-edik oszlopát (Enj ) kapjuk. Az inverzmátrix oszlopai tehát megkaphatók az AX1 = En1 , AX2 = En2 , . . . , AXn = Enn lineáris egyenletrendszerek megoldásaiként. Az inverzmátrix meghatározására alkalmazott Gauss-Jordan eliminációval pedig pontosan ezeket oldjuk meg egyszerre.
10.3. Homogén lineáris egyenletrendszerek Egy lineáris egyenletrendszert homogénnek nevezünk, ha b1 = b2 = · · · = bm = 0, azaz az összes szabadtag nulla. Egyébként inhomogénnek nevezzük. Világos, hogy homogén egyenletrendszernek mindig van megoldása: mikor az összes ismeretlen 0, ezt triviális megoldásnak nevezzük. Kérdés, hogy vannak-e ettől különböző megoldásai. Mivel az előző részben sehol nem használtuk ki, hogy a szabadtagok nem nullák, így a kérdés eliminációval ugyanúgy megválaszolható. Továbbá az is igaz, hogy egy homogén lineáris egyenletrendszer összes megoldásainak halmaza alteret alkot T n -ben (n az ismeretlenek száma), melynek dimenziója n − Rank(A). A következőkben a lineáris egyenletrendszerek megoldáshalmazának szerkezetét vizsgáljuk. Legyen H altere a V vektortérnek és a ∈ V . Ekkor az a + H = {a + h : h ∈ H} halmazt lineáris sokaságnak nevezzük. Az a elemet az a + H lineáris sokaság reprezentánsának nevezzük. 10.4. Tétel. Legyen V egy vektortér a T test felett, H altere V -nek, a, b ∈ V és α ∈ T . Ekkor 1. a + H = b + H, akkor és csak akkor, ha a − b ∈ H; 2. az {a + H : a ∈ V } lineáris sokaságok halmaza vektortér T felett, ha (a + H) + (b + H) = (a + b) + H
144
és
α(a + H) = (αa) + H
(ez hívjuk a V H altere szerinti faktorterének). 10.5. Tétel. Ha az AX = B inhomogén lineáris egyenletrendszer megoldható, akkor összes megoldásainak halmaza c + H alakú lineáris sokasága T n -nek, ahol c ∈ T n az egyenletrendszer egy tetszőleges megoldása, H pedig az AX = 0 homogén lineáris egyenletrendszer megoldástere. Bizonyítás. Mivel tetszőleges h ∈ H esetén A(c + h) = Ac + Ah = B, így c + H minden eleme valóban megoldás. Fordítva, ha d ∈ T n egy tetszőleges megoldás, akkor Ad = B és A(d − c) = Ad − Ac = B − B = 0 miatt d − c megoldása a homogén egyenletrendszernek. Ekkor d − c ∈ H, azaz d ∈ c + H. Végül megoldjuk az x1 + 2x2 + x3 − x4 = 0 2x1 + x2 − 3x3 + x4 = 0 x1 + x2 + x3 + x4 = 0 homogén lineáris egyenletrendszert a valós számok felett (melynek a (10.1) inhomogén változatát a Gauss-elimináció ismertetése közben már megoldottunk). Ennek alapmátrixa 1 2
2
1
1
−3
1
1
1
−1
1 , 1
melynek lépcsős alakja 1 0 0
2
1
−1
0
0
−5
−1 2 . −3
Az ehhez tartozó, az eredetivel ekvivalens homogén lineáris egyenletrendszer x1 + 2x2 + x3 − x4 = 0 −x2 + 2x4 = 0 −5x3 − 3x4 = 0. Az utolsó egyenlet −5x3 − 3x4 = 0,
145
melyben x4 szabadon megválasztható: legyen x4 = u, és ekkor 3 x3 = − u. 5 Behelyettesítve ezt a második egyenletbe −x2 + 2u = 0 adódik, ahonnan x2 = 2u. Végül az első egyenletből kapjuk, hogy 3 x1 + 2(2u) − u − u = 0, 5 ahonnan x1 = − 12 5 u. Az egyenletrendszer megoldástere tehát H=
3 12 − u, 2u, − u, u : u ∈ R , 5 5
amely egydimenziós altere R4 -nek. A fenti tétel alapján (10.1) megoldásainak halmaza leírható az (1, 2, 0, 0) + H lineáris sokasággal.
10.4. Feladatok 10.1. Feladat. Oldja meg az alábbi lineáris egyenletrendszereket a valós számok halmazán! a) 2x1 + x2 − 5x3 + x4 = 8 x1 − 3x2 − 6x4 = 9 2x2 − x3 + 2x4 = −5 x1 + 4x2 − 7x3 + 6x4 = 0
146
b) 3x1 − 2x2 + x3 + 2x4 = 1 x1 + x2 − x3 − x4 = −2 2x1 − x2 + 3x3 = 4 c) 2x1 + 7x2 + 3x3 + x4 = 6 3x1 + 5x2 + 2x3 + 2x4 = 4 9x1 + 4x2 + x3 + 7x4 = 2 d) 2x1 − 3x2 + 5x3 + 7x4 = 1 4x1 − 6x2 + 2x3 + 3x4 = 2 2x1 − 3x2 − 11x3 − 15x4 = 1 e) x1 − 2x2 + x3 = 2 3x1 + 8x2 − 6x3 = −5 6x1 + 10x2 + 3x3 = 4 f) 3x1 − 5x2 + 2x3 + 2x4 = 3 7x1 − 4x2 + x3 + 5x4 = 7 5x1 + 7x2 − 4x3 + 10x4 = 13 10.2. Feladat. Igazolja, hogy egy n ismeretlenes, T test feletti, homogén lineáris egyenletrendszer megoldástere valóban altere T n -nek! 10.3. Feladat. Oldja meg az alábbi homogén lineáris egyenletrendszereket a valós számok halmazán, majd adja meg a megoldástér dimenzióját és egy bázisát!
147
a) 8x1 + 2x2 + 9x3 + 5x4 = 0 4x1 + x2 + 3x3 + x4 = 0 8x1 + 2x2 + 5x3 + x4 = 0 b) 5x1 + x2 + x3 = 0 x1 + x2 + x3 = 0
148
11. Lineáris leképezések Legyenek V1 és V2 vektorterek ugyanazon T test felett, és tekintsünk egy ϕ : V1 → V2 függvényt. Vegyünk V1 -ben két tetszőleges a és b vektort, ekkor nyilván az a + b vektor is eleme V1 -nek, továbbá ezek ϕ általi ϕ(a), ϕ(b) és ϕ(a + b) képei pedig mind a V2 tér elemei. De ekkor a ϕ(a) + ϕ(b) vektor is V2 eleme, és a kérdés az, hogy ez vajon egybeesik-e a ϕ(a + b) vektorral. Ha igen, az tulajdonképpen úgy is
11.1. ábra. Leképezések additív tulajdonsága értelmezhető, hogy a vektorok összeadása és a ϕ leképezés végrehajtása felcserélhetők egymással. A továbbiakban azt mondjuk, hogy a ϕ : V1 → V2 leképezés additív, ha bármely a, b ∈ V1 esetén ϕ(a + b) = ϕ(a) + ϕ(b). Az a vektorral együtt λa is eleme V1 -nek bármely λ ∈ T esetén, és így azok képei, a ϕ(a) és a ϕ(λa) vektorok V2 elemei. Mivel V2 ugyanazon T test feletti vektortér, mint V1 , így a λϕ(a) vektor is V2 eleme. A ϕ(λa) = λϕ(a) egyenlőség vizsgálata arra
11.2. ábra. Leképezések homogén tulajdonsága a kérdésre keresi a választ, hogy vajon ugyanazt a vektort kapjuk-e eredményül, ha 149
először az a vektort szorozzuk meg a λ skalárral, majd az eredménynek vesszük a ϕ általi képét, mint amikor fordítva cselekszünk: először az a vektorra a ϕ leképezéssel hatunk, majd az a vektor képét szorozzuk meg λ-val. A ϕ : V1 → V2 leképezést homogénnek fogjuk nevezni, ha bármely a ∈ V1 és λ ∈ T esetén ϕ(λa) = λϕ(a). Ha ϕ additív és homogén, akkor lineáris leképezésnek nevezzük. Példák: – Az azonosan nulla leképezés bármely két ugyanazon test feletti vektortér között lineáris leképezés, azaz a ϕ : V1 → V2 , ϕ(x) = 0 leképezés lineáris. – Lineáris leképezés a szabadvektorok úgynevezett λ-nyújtása (ϕ(a) = λa), valamint a vektorok adott szöggel való elforgatása. – Legyen ϕ : R2 → R, ϕ(x1 , x2 ) = x1 , vagyis ϕ az a leképezés, amely a sík minden pontjához hozzárendeli annak első koordinátáját. Ekkor ϕ lineáris leképezés. – Végül megmutatjuk, hogy a ϕ : R2 → R, ϕ(x1 , x2 ) = x1 + x2 leképezés is lineáris. Az additivitás ellenőrzéséhez vegyünk két tetszőleges (a, b) és (c, d) pontot R2 -ből. Ekkor ϕ((a, b) + (c, d)) = ϕ(a + c, b + d) = a + c és ϕ(a, b) + ϕ(c, d) = a + c, tehát ϕ valóban additív. Továbbá tetszőleges λ valós szám esetén ϕ(λ(a, b)) = ϕ(λa, λb) = λa, úgymint λϕ(a, b) = λa, tehát ϕ homogén is. A következő tétel a lineáris leképezések legalapvetőbb tulajdonságait veszi sorra. 11.1. Tétel. A ϕ : V1 → V2 lineáris leképezésre igazak a következő állítások: 1. ϕ(0) = 0. 2. Minden a ∈ V1 esetén ϕ(−a) = −ϕ(a). 150
3. Ha L a V1 altere, akkor a ϕ(L) = {ϕ(l) : l ∈ L} halmaz altere V2 -nek. 4. Ha a ∈ V1 és a = λ1 a1 + λ2 a2 + · · · + λn an , akkor ϕ(a) = λ1 ϕ(a1 ) + λ2 ϕ(a2 ) + · · · + λn ϕ(an ). 5. V1 lineárisan függő vektorrendszerének ϕ általi képe is lineárisan függő. 6. Ha a1 , a2 , . . . , an generátorrendszere a V1 vektortér L alterének, akkor ϕ(a1 ), ϕ(a2 ), . . . , ϕ(an ) generátorrendszere ϕ(L)-nek, és dim ϕ(L) 6 dim L. Bizonyítás. 1. Az állítás a ϕ(0) = ϕ(0 + 0) = ϕ(0) + ϕ(0) egyenlőség átrendezésével adódik. 2. Felhasználva az 1. állítást, tetszőleges a ∈ V1 esetén teljesül, hogy 0 = ϕ(0) = ϕ(a + (−a)) = ϕ(a) + ϕ(−a), ahonnan ϕ(−a) = −ϕ(a) következik. Megjegyezzük, hogy az állítás ϕ homogenitásából is kijön λ = −1 választással. 3. Legyenek a0 és b0 ϕ(L)-beli vektorok. Ekkor vannak olyan a és b vektorok L-ben, hogy a0 = ϕ(a) és b0 = ϕ(b). A ϕ lineáris volta miatt ϕ(a − b) = ϕ(a) − ϕ(b) = a0 − b0 . Mivel ϕ(a − b) ∈ ϕ(L), ezért a0 − b0 ∈ ϕ(L). Továbbá tetszőleges λ skalárral ϕ(λa) = λϕ(a) = λa0 ∈ ϕ(L), tehát az altérkritérium szerint ϕ(L) valóban altér. 4. Indukcióval könnyen belátható, hogy az additivitás tetszőleges n vektorra igaz.
151
5. Ha a1 , a2 , . . . , an lineárisan függő vektorrendszere V1 -nek, akkor λ1 a1 + λ2 a2 + · · · + λn an = 0 teljesül úgy, hogy valamelyik λi 6= 0, és a 4. pont szerint λ1 ϕ(a1 ) + λ2 ϕ(a2 ) + · · · + λn ϕ(an ) = 0, tehát a ϕ(a1 ), ϕ(a2 ), . . . , ϕ(an ) lineárisan függő. 6. Tetszőleges a ∈ L vektor előáll az a1 , a2 , . . . , an vektorok lineáris kombinációjaként. Az előzőek szerint pedig a ϕ(a) ekkor előáll ϕ(a1 ), ϕ(a2 ), . . . , ϕ(an ) lineáris kombinációjaként, tehát ez utóbbi generátorrendszere V2 -nek. Továbbá bázis képe is generátorrendszer, bázis pedig minimális számosságú generátorrendszer, így dim ϕ(L) 6 dim L.
Az első tulajdonság alapján könnyű látni, hogy szabadvektorok körében a d 6= = 0 vektorral való eltolás (ϕ : R2 → R2 , ϕ(x) = x + d) nem lineáris leképezés, ugyanis ott ϕ(0) = 0 + d = d 6= 0. Megjegyezzük továbbá, hogy lineárisan független vektorrendszer képe nem feltétlenül lineárisan független: például az azonosan nulla leképezés minden lineárisan független vektorrendszerhez a csupán a nullvektorból álló „vektorrendszert” rendeli, amely nyilván lineárisan függő. Megemlítendő még a 4. állítás azon következménye, miszerint egy lineáris leképezés értékeit elegendő csak báziselemeken ismerni; valamint ha két lineáris leképezés a vektortér egy bázisán megegyezik, akkor a két lineáris leképezés egyenlő. 11.2. Tétel (Lineáris leképezések alaptétele). Legyen a1 , a2 , . . . , an egy bázisa a V1 , és b1 , b2 , . . . , bn tetszőleges vektorrendszere a V2 vektortérnek. Ekkor pontosan egy olyan ϕ : V1 → V2 lineáris leképezés létezik, melyre ϕ(a1 ) = b1 , ϕ(a2 ) = b2 , . . . , ϕ(an ) = bn . Bizonyítás. Az előző megállapítás szerint elegendő csak a ϕ létezését igazolni. Le-
152
gyen ϕ az a leképezés, amely az a ∈ V1 vektorhoz a λ1 b1 + λ2 b2 + · · · + λn bn vektort rendeli, ahol λ1 , λ2 , . . . , λn az a vektor {a1 , a2 , . . . , an } bázisra vonatkozó koordinátái. Megmutatjuk, hogy ϕ lineáris leképezés. Valóban, ha a, b ∈ V1 és a = Pn Pn = i=1 λi ai és b = i=1 µi ai , akkor ϕ(a + b) = ϕ
n X
! (λi + µi )ai
=
n n n X X X µi bi λi bi + (λi + µi )bi = i=1
i=1
i=1
i=1
= ϕ(a) + ϕ(b). Hasonlóan győződhetünk meg ϕ homogenitásáról is. A ϕ : V1 → V2 lineáris leképezés magjának a ker ϕ = {a ∈ V1 : ϕ(a) = 0} halmazt, míg képterének a ϕ(V1 ) halmazt nevezzük. A fentebb már vizsgált
11.3. ábra. A ϕ : V1 → V2 lineáris leképezés magja V1 vektorainak azon részhalmaza, mely elemeinek képe V2 nullvektora
ϕ1 : R2 → R, ϕ1 (x1 , x2 ) = x1
és
ϕ2 : R2 → R, ϕ1 (x1 , x2 ) = x1 + x2
lineáris leképezések magjai a ker ϕ1 = {(0, b) : b ∈ R}
és
halmazok.
153
ker ϕ2 = {(b, −b) : b ∈ R}
11.4. ábra. A ϕ : V1 → V2 lineáris leképezés képtere a ϕ(V1 ) = {ϕ(x) : x ∈ V1 } halmaz
A képtér a 11.1. tétel 3. pontja értelmében altér V2 -ben, és most megmutatjuk, hogy a mag is az. 11.3. Tétel. A ϕ : V1 → V2 lineáris leképezés magja altere V1 -nek. Bizonyítás. Legyen a, b ∈ ker ϕ. Ekkor nyilván ϕ(a) = ϕ(b) = 0 és ϕ linearitása miatt ϕ(a − b) = ϕ(a) − ϕ(b) = 0 − 0 = 0, továbbá tetszőleges λ skalárra ϕ(λa) = λϕ(a) = λ0 = 0. Az altérkritérium szerint ker ϕ valóban altér V1 -ben. 11.4. Tétel. A ϕ : V1 → V2 lineáris leképezés pontosan akkor injektív, ha ker ϕ = = {0}. Bizonyítás. Világos, hogy ha ϕ injektív, akkor a 0 nem lehet több vektornak is a képe, tehát ker ϕ = {0}. Most tegyük fel, hogy ker ϕ = {0}, és ϕ(a) = ϕ(b). Ekkor ϕ(a − b) = 0, azaz a − b ∈ ker ϕ. Innen adódik, hogy ker ϕ = {0} esetben ϕ(a) = ϕ(b) csak a = b esetén lehetséges, tehát ϕ injektív. 11.5. Tétel. Injektív lineáris leképezés lineárisan független vektorrendszerhez lineárisan független vektorrendszert rendel. Bizonyítás. Legyen a1 , a2 , . . . , an lineárisan független vektorrendszere V1 -nek, és tegyük fel, hogy λ1 ϕ(a1 ) + λ2 ϕ(a2 ) + · · · + λn ϕ(an ) = 0, ahol ϕ : V1 → V2 egy injektív lineáris leképezés. Mivel ϕ lineáris, így ϕ(λ1 a1 + λ2 a2 + · · · + λn an ) = 0 154
következik, vagyis λ1 a1 + λ2 a2 + · · · + λn an ∈ ker ϕ. De az előbb igazolt tétel miatt ker ϕ = {0}, tehát λ1 a1 + λ2 a2 + · · · + λn an = 0. Mivel a1 , a2 , . . . , an lineárisan független vektorrendszere V1 -nek, így λ1 = λ2 = · · · = λn = 0, azaz ϕ(a1 ), ϕ(a2 ), . . . , ϕ(an ) lineárisan független vektorrendszere V2 -nek. Bizonyítás nélkül közöljük a következő tételt: 11.6. Tétel (Dimenziótétel). Legyenek V1 és V2 végesen generált vektorterek, és ϕ : V1 → V2 egy lineáris leképezés. Ekkor dim V1 = dim ker ϕ + dim ϕ(V1 ). A ϕ(V1 ) dimenzióját a ϕ leképezés rangjának, míg a ker ϕ dimenzióját a leképezés defektusának is szokás nevezni.
11.1. Izomorfizmus A bijektív lineáris leképezéseket izomorfizmusoknak nevezzük. Azt mondjuk, hogy a V1 és V2 vektorterek izomorfak, ha létezik ϕ : V1 → V2 izomorfizmus. Könnyen igazolható, hogy a vektorterek közötti izomorfia ekvivalencia reláció. 11.7. Tétel. Két végesen generált vektortér pontosan akkor izomorf, ha dimenziójuk megegyezik. Bizonyítás. Tegyük fel, hogy ϕ egy izomorfizmus a V1 és V2 vektorterek között, és legyen B egy bázisa V1 -nek. A 11.1. tétel 4. pontja szerint ϕ(B) generátorrendszere V2 -nek, amely a 11.5. tétel szerint lineárisan független is, így bázis. Mivel a B és ϕ(B) bázisok számossága megegyezik, így a dimenziók is. A fordított állítás bizonyításához azt mutatjuk meg, hogy egy tetszőleges n dimenziós T test feletti vektortér izomorf T n -nel. Ehhez rögzítsünk egy bázist V1 -ben és ϕ rendelje minden V1 -beli vektorhoz a vektor adott bázisra vonatkozó koordinátáiból képzett rendezett elem n-est. Ez a hozzárendelés nyilván injektív és lineáris. 155
Mivel tetszőleges koordinátasorhoz tartozik valamely vektor, ezért a hozzárendelés szürjektivitása is fennáll. Az izomorfizmus tehát két ugyanazon test feletti vektortér vektorainak olyan kölcsönösen egyértelmű megfeleltetése, amely „megőrzi” mind a vektorok összeadását, mind a skalárral való szorzást. Ha visszagondolunk arra, mit is tanultunk eddig a vektorokról, láthatjuk, hogy minden ebből a két műveletből és tulajdonságaikból ered, így elmondható, hogy izomorf vektorterek között algebrai szempontból (vagyis a mi szempontunkból) nincs lényegi különbség. Az előző tétel állítása szerint két n dimenziós vektortér mindig izomorf, hiszen mindkettő izomorf a T n vektortérrel, ahol T a közös skalártartomány. Tehát aki az n dimenziós vektorterekről mindent szeretne tudni, annak elegendő a T n vektorteret alaposan megismerni.
11.2. Lineáris transzformációk Legyen V egy vektortér. A ϕ : V → V lineáris leképezést (V -n ható) lineáris transzformációnak nevezzük. Ha ϕ bijektív, akkor automorfizmusnak is nevezzük. Például az identikus leképezés, az azonosan nulla leképezés, illetve a ϕ : V → V , ϕ(a) = λa, ahol λ adott skalár, lineáris transzformációk. Ez utóbbit neveztük λnyújtásnak. Legyen A adott T test feletti n × n típusú mátrix. Ekkor ϕ : T n → T n , ϕ(x) = = Ax is lineáris transzformáció, ahol a szorzás alatt mátrixszorzást értünk úgy, hogy T n elemeit n × 1 típusú mátrixnak tekintjük. 11.8. Tétel. Egy végesen generált vektortéren ható lineáris transzformáció pontosan akkor injektív, ha szürjektív. Bizonyítás. Legyen ϕ : V → V egy lineáris transzformáció. A 11.4. tétel szerint ha ϕ injektív, akkor ker ϕ = {0}. Továbbá, dim V = dim ker ϕ+dim ϕ(V ) = dim ϕ(V ), így ϕ szürjektív is. A fordított állítás bizonyítása hasonló. Az állítás végtelen dimenzióban már nem igaz. Például a valós együtthatós polinomok vektorterén ható ϕ(f (x)) = xf (x) leképezés egy olyan lineáris transzformáció, amely injektív, de nem szürjektív. Legyen E = (e1 , e2 , . . . , en ) bázisa a T test feletti V vektortérnek, és legyen ϕ egy V -n ható lineáris transzformáció. A ϕ lineáris transzformáció E bázisra vonatkozó mátrixa alatt azt az n×n típusú mátrixot értjük, melynek i-edik oszlopában a ϕ(ei ) vektor E bázisra vonatkozó koordinátaoszlopa áll. Mint azt a következő tétel
156
mutatja, hogy egy bázis rögzítése után egy koordinátákkal adott vektor lineáris transzformáció általi képének koordinátái megkaphatók a lineáris transzformáció mátrixának a vektor koordinátáit tartalmazó oszlopmátrixszal való szorzásával. 11.9. Tétel. Legyen E = (e1 , e2 , . . . , en ) bázisa a V vektortérnek és ϕ egy V -n ható lineáris transzformáció, melynek E bázisra vonatkozó mátrixa A. Ha a = x1 e1 + + x2 e2 + · · · + xn en és ϕ(a) = y1 e1 + y2 e2 + · · · + yn en , akkor h
y1
y2
···
yn
iT
h = A x1
x2
···
xn
iT
.
Bizonyítás. Legyen A = [aij ]n×n . Mivel n X
yk ek = ϕ(a) = ϕ
k=1
n X
akl xl ek =
=
xl ϕ(el ) =
n n X X
n X
xl
l=1
l=1
k=1
l=1 k=1 n P
xl el
n X
l=1 n n X X
így
!
n X
! akl ek
=
k=1
! akl xl
ek ,
l=1
akl xl = yk következik, azaz
l=1
h y1
y2
···
yn
iT
h = A x1
x2
···
xn
iT
.
Példaként tekintsük a sík szabadvektorainak vektorterét, amely az R2 vektortérrel izomorf, és legyen ϕ az origó körüli α szöggel való elforgatás, pozitív irányba. Ez – mint tudjuk – lineáris transzformáció. Most felírjuk ϕ mátrixát R2 természetes
11.5. ábra. Az e01 koordinátáinak kiszámítása bázisára vonatkozóan. Ehhez meg kell határoznunk a bázisvektorok képeinek koor157
dinátáit. Az e1 = (1, 0) vektor forgatás utáni képét jelölje e01 . Az ábrát követve, e01 koordinátái a és b, melyek éppen egy egységnyi átfogójú derékszögű háromszög befogóinak hosszai, ezért a = cos α és b = sin α. Hasonlóan kapjuk, hogy az e2 = (0, 1) vektor képének koordinátái rendre − sin α és cos α. A ϕ természetes bázisra vonatkozó mátrixa ekkor úgy állítható elő, hogy első oszlopába beírjuk az e01 , második oszlopába pedig az e02 koordinátáit: A=
" cos α
− sin α
sin α
cos α
# .
Jóllehet a levezetésünk csak 0◦ és 90◦ közötti α esetén korrekt, az olvasó könnyen meggyőződhet róla, hogy ugyanez a mátrix adódik tetszőleges α-ra. Mint azt a fenti tétel is mutatja, a lineáris transzformációk mátrixának ismerete azért hasznos, mert ha ismerjük egy vektor koordinátáit, akkor a vektor képének koordinátái megkaphatók mátrixszorzás segítségével. Minthogy a sík pontjainak origó körüli 60◦ -kal való elforgatásának mátrixa "
0,5 A= √ 3/2
# √ − 3/2 0,5
,
bármely pont elforgatás utáni képének koordinátái megkaphatók úgy, hogy az A mátrixot szorozzuk a pont koordinátáit tartalmazó 2 × 1 típusú mátrixszal. Például az (1, 3) pont képe a "
0,5 √ 3/2
# √ 0,5 − 3 3/2 √ = 3 1,5 + 3/2
#" # √ − 3/2 1 0,5
"
√ √ alapján a (0,5 − 3 3/2, 1,5 + 3/2) pont. A definíció alapján nyilvánvaló, hogy egy lineáris transzformáció rangja megegyezik a mátrixának a rangjával. Jelölje a T test feletti V vektortér összes lineáris transzformációinak halmazát End(V, T ). Definiáljuk ezen a halmazon az összeadást és skalárral való szorzást a következőképpen: ha ϕ, ψ ∈ End(V, T ) és λ ∈ T , akkor legyen (ϕ + ψ)(x) = ϕ(x) + ψ(x) és (λϕ)(x) = λϕ(x). 158
Könnyen bizonyítható, hogy End(V, T ) vektortér a T test felett, továbbá, ha a ϕ, ψ V -n ható lineáris transzformációk E bázisra vonatkozó mátrixai A és B, akkor a ϕ + ψ és λϕ lineáris transzformációk mátrixai A + B és λA. Ebből következik, hogy ha V egy n dimenziós vektortér a T test felett, melynek E egy adott bázisa, akkor az a Φ : End(V, T ) → Mn×n (T ) leképezés, amely minden V -n ható lineáris transzformációhoz hozzárendeli az E bázisra vonatkozó mátrixát, egy egyszerre injektív és szürjektív lineáris leképezés, vagyis izomorfizmus. Tehát az End(V, T ) és az Mn×n (T ) vektorterek izomorfak. Sőt, ennél még egy kicsivel több is igaz. Könnyű belátni, hogy bármely ϕ és ψ V -n ható lineáris transzformációk esetén a ϕ◦ψ kompozíció is V -n ható lineáris transzformáció. Továbbá ha ϕ és ψ mátrixai az E = (e1 , e2 , . . . , en ) bázisra vonatkozóan A és B, akkor ϕ ◦ ψ mátrixa AB, ugyanis (ϕ ◦ ψ)(ej ) = ϕ(ψ(ej )) = ϕ
n X
! βkj ek
=
=
=
n X
βkj
k=1 n X n X
! αlk el
=
l=1
(αlk βkj el ) =
l=1 k=1
βkj ϕ(ek ) =
k=1
k=1 n X
n X
n n X X
k=1 l=1 n n X X
(βkj αlk el ) =
αlk βkj
l=1
k=1
! el =
n X
(AB)lj el ,
l=1
tehát az AB mátrix j-edik oszlopa valóban a (ϕ ◦ ψ)(ej ) vektor E bázisra vonatkozó koordináta-oszlopát tartalmazza. Mindezek alapján elmondható, hogy ha az End(V, T ) vektortérben a vektorok szorzatán a leképezések kompozícióját értjük, akkor a fent tárgyalt Φ leképezés a szorzást is megőrzi. Ennek néhány következménye: – ha a ϕ V -n ható lineáris transzformáció invertálható (injektív), akkor annak bármely bázisra vonatkozó mátrixának létezik inverze, és az inverzmátrix éppen az inverzleképezés mátrixa lesz, természetesen ugyanarra a bázisra vonatkozóan; – mint tudjuk, a mátrixok szorzása nem kommutatív, így lineáris transzformációk kompozíciója sem az. Most a szorzás műveletének megőrzését kihasználva megmutatjuk, hogy a véges dimenziós V vektortéren ható λ-nyújtás felcserélhető bármely V -n ható lineáris transzformációval. Legyen E = (e1 , e2 , . . . , en ) egy bázisa V -nek, λ adott skalár, és legyen ϕ : V → V , ϕ(a) = λa. Ekkor ϕ(ej ) = λej minden j ∈ {1, 2, . . . , n}
159
esetén, a λej vektor koordinátái pedig az E bázisban (0, 0, . . . , λ, . . . ,0), ahol λ a rendezett elem n-es j-edik komponense. Tehát ϕ mátrixa az E bázisra vonatkozóan az az n × n típusú A mátrix, melynek főátlóján minden eleme λ, és minden más eleme 0, azaz A = λEn . Az n × n típusú mátrixok körében A felcserélhető bármely mátrixszal, így ugyanez mondható el a neki megfelelő ϕ lineáris transzformációról a V -n ható lineáris transzformációk körében.
11.3. Bázis és koordináta transzformáció Legyenek E = (e1 , e2 , . . . , en ) és F = (f1 , f2 , . . . , fn ) bázisok a V vektortérben. Ekkor a Lineáris leképezések alaptétele (11.2. tétel) szerint pontosan egy olyan ϕ : V → V lineáris transzformáció létezik, melyre ϕ(e1 ) = f1 , ϕ(e2 ) = f2 , . . . , ϕ(en ) = fn . Jelölje ϕ mátrixát az E bázisra vonatkozóan S. Ekkor S olyan n × n típusú T test feletti mátrix, melynek j-edik oszlopában az ϕ(ej ) = fj vektor E bázisra vonatkozó koordináta-oszlopa szerepel. Ezt az S mátrixot nevezzük az E-ről F -re történő bázisátmenet mátrixának. Mivel ϕ kölcsönösen egyértelmű leképezés, így S invertálható, és az inverze nyilván a fordított, F -ről E-re történő bázisátmenet mátrixa. Például ha e1 = (1, 2, 1),
f1 = (3, 1, 4),
e2 = (2, 3, 3),
f2 = (5, 2, 3),
e3 = (3, 7, 1),
f3 = (1, 1, 6),
akkor az E = (e1 , e2 , e3 )-ról az F = (f1 , f2 , f3 )-ra való bázisátmenet mátrixának felírásához meg kell határoznunk az f1 , f2 , f3 vektorok E bázisra vonatkozó koordinátáit. Ezeket egyszerre is megkereshetjük szimultán eliminációval, melynek kiinduló mátrixa: 1 2
2
3
3
5
1
3
7
1
2
1 .
1
3
1
4
3
6
Gauss-Jordan-elimináció végrehajtása esetén a kapott mátrix utolsó 3 oszlopa éppen a keresett báziscsere mátrix oszlopai lesznek. Itt csak az elimináció végered-
160
ményét közöljük: 1 0 0 0 1 0 0
0
−27 −61
1
9
18
4
10
19
−3 , −4
a keresett báziscsere-mátrix tehát −27 S= 9
−61
4
19
18
−3 .
10
−4
Most pedig megnézzük, miért jó nekünk ennek az S mátrixnak az ismerete. 11.10. Tétel. Legyenek E = (e1 , e2 , . . . , en ) és F = (f1 , f2 , . . . , fn ) bázisok V ben, és legyen S az E-ről F -re történő bázisátmenet mátrixa. Ha b ∈ V , valamint x1 , x2 , . . . , xn és y1 , y2 , . . . , yn a b vektor E, illetve F bázisra vonatkozó koordinátái, akkor h
y1
···
y2
yn
iT
h = S −1 x1
···
x2
xn
iT
.
Bizonyítás. Legyen S = [aij ]n×n . Mivel n X
xk ek = b =
k=1
=
így
n P
n X
yl fl =
n X
l=1 n X
k=1
l=1
n X
yl
l=1
n X
akl ek =
k=1
n X n X
yl akl ek =
l=1 k=1
! akl yl
ek ,
akl yl = xk következik, azaz
l=1
h S y1
y2
···
yn
iT
h = x1
x2
···
xn
iT
.
A fenti tétel alapján az S −1 mátrixot az E-ről F -re történő bázisátmenethez tartozó koordináta-transzformáció mátrixának nevezzük. Az utolsó tételünk arra ad választ, hogy báziscsere után hogyan változik egy lineáris transzformáció mátrixa. 11.11. Tétel. Legyenek E = (e1 , e2 , . . . , en ) és F = (f1 , f2 , . . . , fn ) bázisok V -ben, és legyen S az E-ről F -re történő bázisátmenet mátrixa. Legyenek továbbá a ϕ V -n 161
ható lineáris transzformáció E és F bázisra vonatkozó mátrixai rendre A és B. Ekkor B = S −1 AS. Bizonyítás. Legyen A = [aij ], B = [bij ] és S = [cij ]. Ekkor n X
ϕ(fj ) = ϕ =
! ckj ek
k=1 n n X X l=1
=
n X
ckj ϕ(ek ) =
k=1
! alk ckj
el =
n X
n X
ckj
k=1
! alk el
l=1
=
n X n X
ckj alk el =
k=1 l=1
n X (AS)lj el , l=1
k=1
másrészt ϕ(fj ) = =
n X
bkj fk =
n X
n X
bkj
n X
l=1
k=1
! clk bkj
clk el
l=1 n X
k=1
k=1 n X
!
el =
=
n n X X
bkj clk el =
k=1 l=1
(SB)lj el ,
l=1
ahonnan AS = SB, azaz B = S −1 AS következik.
11.4. Feladatok 11.1. Feladat. Határozzuk meg, hogy az alábbi leképezések közül melyek lineárisak! 1. ϕ : R2 → R2 ,
ϕ((a, b)) = (a, −b)
2. ϕ : R3 → R2 ,
ϕ((a, b, c)) = (a, c)
3. ϕ : R3 → R3 ,
ϕ((a, b, c)) = (a, b, c) + (1,1,1)
4. ϕ : R2 → R2 ,
ϕ((a, b)) = (a − b, a + b)
5. ϕ : R2 → R2 ,
ϕ((a, b)) = ab
11.2. Feladat. Adja meg az {e1 , e2 , e3 , e4 } bázisról az {f1 , f2 , f3 , f4 } bázisra történő átmenet mátrixát!
a)
e1 = (1, 0, 0, 0)
f1 = (1, 1, 0, 0)
e2 = (0, 1, 0, 0)
f2 = (1, 0, 1, 0)
e3 = (0, 0, 1, 0)
f3 = (1, 0, 0, 1)
e4 = (0, 0, 0, 1)
f4 = (1, 1, 1, 1) 162
e1 = (1, 2, −1, 0) b)
c)
f1 = (2, 1, 0, 1)
e2 = (1, −1, 1, 1)
f2 = (0, 1, 2, 2)
e3 = (−1, 2, 1, 1)
f3 = (−2, 1, 1, 2)
e4 = (−1, −1, 0, 1)
f4 = (1, 3, 1, 2)
e1 = (1, 1, 1, 1)
f1 = (1, 0, 3, 3)
e2 = (1, 2, 1, 1)
f2 = (−2, −3, −5, −4)
e3 = (1, 1, 2, 1)
f3 = (2, 2, 5, 4)
e4 = (1, 3, 2, 3)
f4 = (−2, −3, −4, −4)
11.3. Feladat. Ha V egy n dimenziós vektortér, akkor mennyi az End(V, T ) vektortér dimenziója?
163
Irodalomjegyzék [1] Freud Róbert: Lineáris algebra. ELTE Eötvös Kiadó, Budapest, 1996. [2] Gaál István, Kozma László: Lineáris algebra. Kossuth Egyetemi Kiadó, Debrecen, 2009. [3] Kiss Emil: Bevezetés az algebrába. Typotex, 2007. [4] Kovács Zoltán: Feladatgyűjtemény lineáris algebra gyakorlatokhoz. Kossuth Egyetemi Kiadó, Debrecen, 2002. [5] Kiss Péter, Mátyás Ferenc: A számelmélet elemei. EKTF Líceum Kiadó, 1997. [6] Lovász László, Pelikán József, Vesztergombi Katalin: Diszkrét matematika. Typotex, 2010. [7] Székelyhidi László: Halmazok és függvények. Palotadoktor Bt., 2009.
164