Véletlen permutá iók statisztikai vizsgálata Doktori értekezés
Csiszár Vill® Tusnády Gábor
Készítette: Témavezet®:
tudományos taná sadó, az MTA rendes tagja
Matematika Doktori Iskola Iskolavezet® :
La zkovi h Miklós
Alkalmazott Matematika Doktori Program Programvezet® :
Mi haletzky György
Eötvös Loránd Tudományegyetem Természettudományi Kar 2008
Tartalomjegyzék
I. El®készületek
1
1. Az értekezés témája és felépítése : : : : : : : : : : : : : : : :
1
2. Felhasznált eszközök : : : : : : : : : : : : : : : : : : : : : : : :
7
2.1.
Algebrai statisztika . . . . . . . . . . . . . . . . . . . . . . . .
2.2.
Exponen iális saládok, hierar hikus modellek
2.3.
EM- és MM-algoritmusok
7
. . . . . . . . .
11
. . . . . . . . . . . . . . . . . . . .
13
II. Különféle modellek
15
3. Statisztikák és modellek áttekintése : : : : : : : : : : : : : :
15
4. M Cullagh inverziós modellje : : : : : : : : : : : : : : : : : :
21
5. Részbenrendezések : : : : : : : : : : : : : : : : : : : : : : : :
29
6. Pla kett-Lu e-féle modellek : : : : : : : : : : : : : : : : : : :
33
6.1.
Pla kett-Lu e
. . . . . . . . . . . . . . . . . . . . . . . . . . .
36
6.2.
Hazai pálya
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
6.3.
Rao-Kupper . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
6.4.
Csapatmérk®zés . . . . . . . . . . . . . . . . . . . . . . . . . .
38
7. Rendezett minta modell : : : : : : : : : : : : : : : : : : : : :
39
III. Feltételes függetlenség és hierar hikus modellek
42
8. L-felbonthatóság : : : : : : : : : : : : : : : : : : : : : : : : : :
42
8.1.
Markov bázis
. . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2.
Paraméterbe slés
8.3.
Illeszkedésvizsgálat
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
i
45 53 57
9. Duplán L-felbonthatóság : : : : : : : : : : : : : : : : : : : : :
61
9.1.
Hierar hikus modellek permutá iókra . . . . . . . . . . . . . .
62
9.2.
A salád paraméterezése
. . . . . . . . . . . . . . . . . . . . .
66
9.3.
Két szemléltetési mód
. . . . . . . . . . . . . . . . . . . . . .
77
9.4.
Markov bázis
n = 4-re
. . . . . . . . . . . . . . . . . . . . . .
78
9.5.
Maximum likelihood be slés
9.6.
A modell lezártja
. . . . . . . . . . . . . . . . . . .
81
. . . . . . . . . . . . . . . . . . . . . . . . .
83
10.Egyéb felbonthatóságok : : : : : : : : : : : : : : : : : : : : : 10.1. S-felbonthatóság
89
. . . . . . . . . . . . . . . . . . . . . . . . .
89
10.2. Bal-jobb szorzások hatása a modellekre . . . . . . . . . . . . .
94
10.3. Teljesen L-felbontható eloszlások
98
10.4. Hierar hikus modellek metszete
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . 103
10.5. Ismert eloszlás saládok felbonthatósága . . . . . . . . . . . . . 106
11.APA adatsor elemzése : : : : : : : : : : : : : : : : : : : : : : 109
ii
Ábrák jegyzéke
4.
GH gráf váza n = 4 és n = 5 esetén. . . . . . . . . . Az S5 egy 16 elem¶ részhalmazának gráfja (8.5. Példa) L-felbonthatóság a sakktáblán, n = 6. . . . . . . . . . . L-felbonthatóság a páros gráfon, n = 6. . . . . . . . . .
5.
Duplán L-felbonthatóság a sakktáblán (9.17. Tétel)
6.
Az L-felbontható ML be slés kanonikus paraméterei az APA
1. 2. 3.
A
adatra
. . . .
27
. . . .
49
. . . .
78
. . . .
79
. . . . . .
88
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Táblázatok jegyzéke 1.
Néhány fontos távolság dení iója . . . . . . . . . . . . . . . .
2.
Az
19
u és v gyakoriságvektorok összekötése a Markov bázis ele-
meivel (8.5. Példa)
. . . . . . . . . . . . . . . . . . . . . . . .
3.
Monte Carlo illeszkedésvizsgálat : egyenletes eloszlás
4.
Monte Carlo illeszkedésvizsgálat : Pla kett-Lu e eloszlás
5.
Monte Carlo illeszkedésvizsgálat : nem L-felbontható eloszlás
6.
A
7.
Egy TL-felbontható eloszlás
j(k`)j statisztika lehetséges értékeinek kódolása
függések
q
. . . . . . . .
50 59 59
.
60
. . . . .
71
logaritmusára teljesül® össze-
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.
APA elnökválasztás : az egyes sorrendek gyakorisága . . . . . . 110
9.
Felbontható eloszlások illeszkedése az APA adatokra . . . . . . 113
iii
Jelölések
[n℄ : [n℄ = f1;2; : : : ; ng Sn : az n-edfokú szimmetrikus soport U: [n℄ n U , az U halmaz komplementere (U ), fU g: lásd (1) (i::j ), fi::j g: lásd (15) U ? U j ;: (U ) és (U ) feltételesen függetlenek fU g-ra nézve F(M ): az M mátrix szerint faktorizálódó eloszlások, lásd (2) E(M ): az M -hez tartozó exponen iális salád, lásd (3) Supp(v ): a v vektor tartója
l(): lezárás az euklideszi térben XM : az M -hez tartozó nemnegatív torikus varietás, lásd (4) IM : az M -hez tartozó torikus ideál fAg: indikátorfüggvény: 1, ha A teljesül, különben 0 L ill. L0 : LK :
ML ill. ML0 : B:
F ill. F 0 : U ?\ V :
P rU : j ( D R) j : UP : L(P1; : : : ; Ps):
D0 D:
MB : r : (12) : Æ ill. Æ :
az L- ill. invertálva L-felbontható eloszlások saládja a
K -beli k-knál felbontható eloszlások saládja
az
L ill. L0
torikus modellhez tartozó mátrix
a duplán L-felbontható eloszlások saládja
ML> ill. ML>0 operátor képtere, F \ F 0 = G az U és V altér mer®legesen metszi egymást az U altérre való mer®leges vetítés a durvítása a szorzatpartí ióra, lásd (24)
az
a
P partí ióhoz rendelt altér, lásd (25)
hierar hikus modell, lásd 9.2. Dení ió a
D0 partí ió nomabb D-nél
k` aq sorokból alkotott mátrix, lásd (32) r = (n(n 1) : : : 21) az id identitás megfordítása (12) = (213 : : : n) a -val való jobbról- ill. balról szorzás
a
iv
1
I. rész
El®készületek 1. Az értekezés témája és felépítése Értekezésem a véletlen permutá iók statisztikai vizsgálatához kap solódó eredményeimet összegzi. Tegyük fel, hogy valamilyen véletlen kísérlet ered-
n hosszúságú permutá iókat kapunk adatként. Legalább esetet különböztethetünk meg aszerint, hogy a adat-
ményeként rögzített három alapvet®
permutá iók mit fejeznek ki. A permutá ió tömör leírása lehet két azonos elemszámú halmaz össze-
1-t®l n-ig számozzuk, akkor (i) = j fejezheti ki azt, hogy az A halmaz i: eleme a B halmaz j: elemével áll párban (vagy fordítva). Ha egy tán os rendezvényen párosításának. Ha az
A
és
B
halmaz elemeit
ugyanannyi fér és n® vesz részt, és mindenki mindig tán ol, feljegyezhetjük az egyes tán ok során a párosításokat. Ha nem mindig tán ol mindenki, akkor sak részleges párosításaink lesznek. A permutá ió kifejezheti egy halmaz elemeinek sorbarendezését is. Ismét jelöljük a halmaz elemeit az
1; : : : ; n
számokkal. Ekkor beszél-
sorrend-permutá ióról, amikor (i) = j azt jelenti, hogy a sorrend i: pozí iójában a halmaz j -vel jelölt eleme áll, vagy ennek 1 helyezés-permutá ióról. Azaz 1 (i) = j jelentése : az inverzér®l, a i-vel jelölt elem a j: helyen szerepel a sorrendben. Ilyen adatokat kahetünk a
punk például akkor, amikor bírálók pályázatokat rangsorolnak. Ebben az esetben is el®fordulhat, hogy nem teljes permutá iót kapunk, ha például a holtverseny is megengedett, vagy a bírálók sak az általuk legjobbnak tartott néhány pályázatot rangsorolják. Az irodalomban a legtöbbet ezzel az esettel foglalkoztak. A harmadik esetben a permutá ió egy rendezett halmaz átrendezését fejezi ki.
(i) = j jelentheti azt, hogy az eredeti sorrend szerinti i: elem
1. AZ ÉRTEKEZÉS TÉMÁJA ÉS FELÉPíTÉSE
2
az új sorrendben a
j:
helyen áll (vagy fordítva). Gondoljunk például
arra, hogy egy irodában halomban áll
n
dosszié. A titkárn® mindig
kikeresi az éppen szükségeset, majd a halom legtetejére teszi vissza. Kérdezhetjük, hogy a nap végére hogyan változik meg a dossziék eredeti sorrendje. Az adatelemzés els® lépése minden esetben az adatokkal való ismerkedés : az adatok grakus megjelenítése, alapstatisztikák kiszámítása. Az adatmegjelenítés permutá iók esetében a magas dimenzionalitás miatt nem rutinfeladat. Ha az
n
hosszú permutá iókat, mint
R n -beli vektorokat tekintjük,
akkor konvex burkuk az úgynevezett permutá ió-politóp (Yemeli hev et al. [62℄). A politóp sú sai egy
n 1 dimenziós gömb felszínén helyezkednek el.
Egy permutá iókból álló adatsort úgy ábrázolhatunk, hogy a politóp sú saiba gömböket helyezünk el, melyek sugara a meggyelt gyakoriság monoton növ® függvénye (Thompson [58℄ például azt javasolja, hogy a sugár a
5=7-edik hatványával módszer sak n 4 esetén
gyakoriság
legyen arányos). A dimenzionalitás miatt
ez a
igazán hasznos. Magasabb dimenzióban a
fenti ábrázolás helyett annak érdekes ala sony dimenziós vetületeit jeleníthetjük meg, az érdekes vetületek meghatározása hasonlóan történhet, mint általában a sokdimenziós adatok esetében. Az adatmegjelenítés kérdésével ebben az értekezésben a továbbiakban nem foglalkozom. Az adatokkal való els® ismerkedés után a meggyelésekre elfogadható modellt keresünk.
Paraméteres modell illesztésekor el®ször megkeressük
az adott modellen belül a mintához leginkább megfelel® paramétereket (paraméterbe slés), majd vizsgáljuk a modell illeszkedésének jóságát (hipotézisvizsgálat). Értekezésemben egyrészt az irodalomban jelen lév® modellekkel kap solatban vezetek le új eredményeket, másrészt új modelleket vezetek be, és azok tulajdonságait vizsgálom. A 2. fejezetben foglalom össze azokat az eszközöket, melyekre a kés®bbiekben szükség lesz. Az algebrai statisztika alapészrevétele az, hogy számos paraméteres eloszlás salád algebrai varietást alkot, azaz a salád elemei polinomiális egyenleteket elégítenek ki. Ezek a polinomiális egyenletek algoritmikusan megtalálhatók, és felhasználhatók például Monte Carlo algoritmusok futtatásához. A második eszköz a véges eseménytéren deniált eloszlások
3
exponen iális saládjainak, illetve hierar hikus modelljeinek elmélete. Exponen iális saládokban átalános tételek szólnak a maximum likelihood be slés létezésér®l és aszimptotikus tulajdonságairól. A ML be slés kiszámítására a hierar hikus modellek esetében egyszer¶en programozható iteratív eljárás az iteratív arányos illesztés. Végül bemutatom az EM- és az MM-algoritmust, melyek sok esetben használhatók a likelihood numerikus maximalizálására. A II. részben a véletlen permutá iókra illeszthet® ismert modelleket tárgyalom, illetve ezekkel kap solatos néhány új eredményt mutatok be. El®ször a 3. fejezetben áttekintem a modelleket, illetve ezzel párhuzamosan szót ejtek néhány fontos alapstatisztikáról, hiszen ezek szerepet játszanak egyes modellek paramétereinek be slésénél. Természetesen nem élom a létez® összes modell felsorolása (ez nem is lenne lehetséges), a legfontosabbakat, illetve a disszertá ió további részéhez leginkább kap solódókat igyekeztem összegy¶jteni. A 4. fejezetben M Cullagh egy sejtését bizonyítom. A fejezet eredményeit a [21℄ dolgozatban írtam le. M Cullagh [49℄ egy új modell saládot vezetett be véletlen permutá iókra, de azt sak sejtésként mondta ki, hogy a modellek általa megadott paraméterei identikálhatók (azaz különböz® paraméterekhez kölönböz® eloszlások tartoznak). A sejtés bizonyítása a következ® állításon
-b®l -ba, ha egy elemét helyre rakva (a többi elemet odébb súsztatva) -t kapjuk. Például a = (24531) permutá ióból a 4-et helyre rakva a = (25341)
múlik. Deniáljunk
Sn -en
egy irányított gráfot. Akkor vezet él
permutá iót kapjuk. Az állítás az, hogy ebben a gráfban nin s irányított kör. Ezt a gráfot, illetve az általa deniált részbenrendezést (amennyiben ez a részbenrendezés valóban új) úgy érzem, érdemes lenne tovább vizsgálni, bár ezek a vizsgálatok már messze vezetnének a statisztika témakörét®l. Az 5. fejezet kis kitér®t tesz a szimmetrikus soporton megadható, statisztikai szempontból is érdekes részbenrendezések világába. A 6. fejezetben bemutatok néhány EM algoritmust általánosított BradleyTerry modellekre, illetve a rendezett minta modellre. Ezekre az eredményekre a [22℄ dolgozatban történik utalás. A Bradley-Terry modellben két vagy több versenyz® sorrendjét a versenyz®khöz tartozó, független, különböz® paraméter¶ exponen iális eloszlású változók sorrendje határozza meg. Ezt
1. AZ ÉRTEKEZÉS TÉMÁJA ÉS FELÉPíTÉSE
4
általánosítani lehet például úgy, hogy sapatok versenyeznek egymással. Ezekben a modellekben a paraméterek maximum likelihood be slésének kiszámítására Hunter [40℄ MM algoritmusokat javasolt. Megmutatom, hogy ezekre a feladatokra EM algoritmusok is megadhatók, bár ezek szimulá iós vizsgálatok szerint az MM algoritmusoknál lassabban konvergálnak. Az EM algoritmus viszont arra az esetre is alkalmazható, amikor a Bradley-Terry modell exponen iális változóit tetsz®leges eloszlásokkal helyettesítjük, err®l szól a 7. fejezet. A III. rész az értekezés leghosszabb és legfontosabb része. Központi gondolata a feltételes függetlenség és a hierar hikus modell véletlen permutá-
n dimenziós diszkrét valószín¶ségi változó, minden koordinátája az [n℄ = f1; : : : ; ng halmaz eleme.
iókra való alkalmazása. Egy véletlen permutá ió
A koordinátáknak azonban különböz®knek kell lenniük. Eszünkbe juthat itt a kontingen iatáblák elemzése, amikor olyan valószín¶ségi változókat vizsgálunk, melyek egy
[m1 ℄ : : : [mn ℄ szorzathalmazban veszik fel értékeiket.
Ezekre szokás úgynevezett hierar hikus modelleket illeszteni, melyekben egy
ella valószín¶sége bizonyos marginálisaihoz tartozó paraméterek szorzata. Ha ezeket a modelleket közvetlenül szeretnénk a permutá iókra alkalmazni, akkor az összes olyan
(i1 ; : : : ; in) ellát strukturális nullának kellene vennünk,
melynek nem minden koordinátája különböz®.
1.1. Példa.
2
[n℄n )
Legyen
X
olyan diszkrét valószín¶ségi változó, melyre
= 1. X -re a teljes függetlenség (hierar hikus) modellje :
P (X = (i1 ; : : : ; in )) = valamilyen
k (i)
n Y k=1
P (X
2
k-ra.
A
k (ik ); 1 ik n;
paraméterekre, melyekre
Pn i=1 k (i)
fenti strukturális nullák bevezetésével kapjuk a
= 1
minden
véletlen permutá ióra a
kvázi-függetlenség modelljét :
P ( = ) = K ahol
n Y k=1
k ( (k)); 2 Sn ;
Sn az n-edfokú szimmetrikus soport, K
pedig normáló tényez®.
5
Alkalmazhatjuk azonban a hierar hikus modelleket nem közvetlenül a permutá ió koordinátáira. Lehet®ségünk van arra, hogy
Sn elemeit köl sönösen
egyértelm¶en megfeleltessük olyan vektoroknak, melyek már egy szorzat-
permutá ió leírható például az r 2 [1℄ [2℄ : : : [n℄ vektorral, ahol r (i) azt mutatja meg, hogy (i) hányadik legnagyobb eleme a f (1); : : : ; (i)g halmaznak. Hasonló megfeleltetés érhet®
halmazban veszik fel értékeiket. A
el ortogonális kontrasztok segítségével (Marden [46℄, illetve a 3. fejezet). Ennek a módszernek az lehet a hátránya, hogy a kapott modellek kevésbé jól értelmezhet®k. Az értekezésben egy másik lehetséges módszert vizsgálok. El®ször is, minden
U
[n℄-re és 2 Sn-re legyen
(U ) = ( (u) : u 2 U ); fU g = f (u) : u 2 U g:
(1)
U; V; W [n℄ diszjunkt részhalmazok, és jelölje U ? V j W azt az állítást, hogy (U ) és (V ) feltételesen függetlenek, ha ismerjük (W )-t, valamint a fU g és fV g halmazokat. Az általunk vizsgált modellek mindegyikében elegend® az U ? U j ; alakú relá iókat használni, ahol U = [n℄ n U az U halmaz komplementere. Legyenek
n = 4. Az f1;2g ? f3;4g j ; relá ió azt fejezi ki, hogy ( (1); (2)) és ( (3); (4)) feltételesen független, ha ismerjük a f (1); (2)g 1.2. Példa.
Legyen
halmazt. A 8. fejezetben azokat az eloszlásokat vizsgálom, amelyek eleget tesznek
a
[k℄ ? [k℄ j ; relá iónak minden k-ra.
Ezek az L-felbontható eloszlások. Az
L-felbonthatóságot, mint tulajdonságot Crit hlow, Fligner és Verdu
i [15℄ vezette be. Ebben a fejezetben az összes L-felbontható eloszlást, mint modellt vizsgálom. Az L-felbontható saládban könny¶ megadni a paraméterek expli it maximum likelihood be slését, melyeknek nem sak az aszimptotikus, hanem a pontos eloszlása is kiszámítható. Megmutatom, hogyan lehet a rögzített elégséges statisztikával rendelkez® mintákból egyenletes eloszlás szerint generálni közvetlenül, illetve Monte Carlo módszerrel egy egyszer¶ Markov bázis segítségével. Ezen másodlagosan generált minták használhatók
1. AZ ÉRTEKEZÉS TÉMÁJA ÉS FELÉPíTÉSE
6
az illeszkedés jóságának mérésére. Az eredmények egy ki sit általánosabb eloszlás saládra, a korlátozottan L-felbontható eloszlásokra is átvihet®k. A fejezet eredményei a [18℄ és a [19℄ dolgozatokban találhatók meg. A 9. fejezetben azt vizsgálom, hogy mikor lesz
és
1
eloszlása
is L-felbontható. Az ilyen eloszlásokat duplán L-felbonthatónak nevezve, meghatározom a szigorúan pozitív duplán L-felbontható eloszlás salád szabad paramétereinek számát, megadom két paraméterezését, és egy algoritmust a maximum likelihood be slés meghatározására. Megvizsgálom, mit mondhatunk abban az esetben, ha nem sak szigorúan pozitív eloszlásokat engedünk meg : ebben segít a salád Markov bázisának meghatározása az
n=4
esetben. Ez a fejezet szintén a [18℄ és a [19℄ dolgozatokra, valamint
a [22℄ publiká ióra épül. A 10. fejezet néhány további, a felbonthatósággal kap solatos kérdést vizsgál. Ilyen például a 9. fejezet f® eredményének bizonyításában fontos szerepet játszó S-felbonthatóság, mely az L-felbonthatóságnál er®sebb tulajdonság. Foglalkozom továbbá azokkal az eloszlásokkal, amelyek eleget tesznek a
U
? U j ; relá iónak minden U -ra, ezeket teljesen L-felbontható, vagy TL-
felbontható eloszlásoknak hívom. Megmutatom, hogy a szigorúan pozitív TLfelbontható eloszlások éppen a kvázi független alakúak (lásd az 1.1. Példát). Ez az eredmény a [21℄ dolgozatból való. Végül a 11. fejezetben egy, az irodalomban állatorvosi lónak tekintett adatsorra, az Amerikai Pszi hológiai Társaság 1980-as elnökválasztásának adataira (röviden APA adatokra) illesztem az összes felbontható modellt. Itt szeretném megköszönni témavezet®mnek, Tusnády Gábornak a közel nyol évnyi közös munkát, a t®le kapott ismereteket, de még inkább azt a matematikai szemléletmódot és emberi hozzáállást, amit folyamatosan sugároz. Köszönöm saládom és kollégáim segítségét, támogatását, és nem utolsó sorban azt a sok nógatást, ami nélkül ez a disszertá ió nem jött volna létre.
7
2. Felhasznált eszközök 2.1. Algebrai statisztika Algebrai módszereket a statisztikában els®ként Dia onis és Sturmfels [32℄ használt, és éppen kontingen iatáblák elemzésére. Geiger, Meek és Sturmfels [37℄ diszkrét tereken deniált torikus modelleket vizsgált, különös tekintettel a grakus modellekre, Dia onis és Eriksson [30℄ pedig Markov lán Monte Carlo te hnikával generálta a minta feltételes eloszlását az elégséges statisztikára nézve. Érdekes evolú iós alkalmazások találhatók például Seth Sullivant PhD disszertá iójában [56℄. Az alábbiakban összefoglaljuk azokat az eredményeket, melyeket kés®bb felhasználunk. További olvasmányként ajánljuk a [13, 55℄ könyveket. Legyen
X = fx1 ; : : : ; xsg véges halmaz, M = (mij ) pedig egy t s méret¶,
p = (p(x1 ); : : : ; p(xs )) valószín¶ség-eloszlás az M modellhez tartozik, vagy p az M szerint faktorizálódik, ha léteznek olyan nemnegatív 1 ; : : : ; t paraméterek, melyekre
nemnegatív egész elem¶ mátrix. Azt mondjuk, hogy a
t Y p(xi ) = () mj ji ; j =1 Az összes
M
1 i s:
szerint faktorizálódó eloszlás halmazára az
(2)
F(M )
jelölést
F(M ) alakúak valamilyen Az E(M ) diszkrét exponen-
használjuk. Azokat az eloszlás saládokat, melyek alkalmas
M -mel,
torikus modelleknek hívjuk.
iális salád pedig álljon azokból a
p = (p(x1 ); : : : ; p(xs))
eloszlásokból,
melyekre
p(xi ) = () exp
t X j =1
mjij ; 1 i s;
ahol
A továbbiakban mindig feltesszük, hogy az
M
= (1 ; : : : ; t ) 2 (
1; 1)t:
(3)
sorvektorainak tere tartalmazza
1 = (1; : : : ;1)> vektort, így a normáló konstansok el is hagyhatók. F(M ) szigorúan pozitív elemei éppen E(M )-et alkotják, és általában E(M ) F(M ) l(E(M ));
2. FELHASZNÁLT ESZKÖZÖK
8
() a lezárást jelöli (az euklideszi topológiában). A második tartalmazás akkor és sak akkor szigorú, ha F(M ) nem zárt. Vegyük észre, hogy E(M )
sak az M sorai által kifeszített altért®l függ, de mint látni fogjuk, ugyanez nem igaz F(M )-re. A t hosszú v = (v1 ; : : : ; vt ) vektor tartójára vezessük be ahol l
a Supp jelölést, és az
M
mátrix
(v ) = f1 k t : vk 6= 0g
i: oszlopvektorát jelölje mi .
2.1. Dení ió. Legyen M t s méret¶, nemnegatív egész elem¶ mátrix. A T f1; : : : ; sg halmaz M -megvalósítható (M-feasible), ha minden i 62 T -re Supp(mi ) 6 [j 2T Supp(mj ): Vezessük be a szintén
x1 ; : : : ; xs -sel
jelölt változókat, a továbbiakban
R[x℄ = R[x1 ; : : : ; xs ℄ valós együtthatós polinomgy¶r¶ben dolgozunk. u Az u = (u1 ; : : : ; us ) nemnegatív egész elem¶ vektorra deniáljuk az x = = xu1 xu2 xus s s változós monomot (egy tagú polinomot). Az M mátrixhoz rendeljük hozzá az XM nemnegatív torikus varietást : az
1
2
XM = fx 2 R s0 : xu
xv = 0
8u; v 2 N s melyre Mu = Mvg:
(4)
XM -et azért nevezik torikus varietásnak, mert az ®t deniáló polinomok mindegyike kéttagú. Az X -en adott p eloszlást írjuk vektor alakba, azaz legyen pi = p(xi ). Érvényes a következ® tétel. 2.2. Tétel. (Geiger et al. [37℄) l(F(M )) = XM . Továbbá p p 2 F(M ) akkor és sak akkor, ha p tartója M -megvalósítható.
(F(M )) is sak az M sorai által kifeszített altért®l függ, hiszen az Mu = Mv megoldásai sak ett®l függnek. Az M megvalósítható hamazok, és így F(M ) azonban már nem sak ett®l az altért®l Nyilván
XM
2 XM -re
és ezzel együtt l
függ. Rapallo [52℄ bizonyítja a következ® tételt.
2.3. Tétel. (Rapallo [52℄) Minden M -hez van olyan Mmax maximális reprezentá ió, melyre l(F(M )) = F(Mmax ).
2.1. Algebrai statisztika
9
p esetén könny¶ eldönteni, hogy tartója M -megvalósítható-e. Azt, hogy eleme-e az XM varietásnak, már nehezebb. A (4)-ben szerepl® kéttagú polinomok egy IM torikus ideált generálnak. Hilbert bázis-tétele azt mondja Adott
ki, hogy minden ideál végesen generált, s®t, algoritmikusan kiszámítható az ideált generáló bázis. Ezeknek az algoritmusoknak is kiterjedt az elmélete, a mi szempontunkból elég annyi, hogy a világhálón elérhet®k ezeket az algoritmusokat implementáló ingyen használható program somagok. Ezután már
sak azt kell ellen®rizni, hogy nak. Megemlítjük, hogy az
p
Mmax
gyöke-e ennek a véges sok bázispolinommaximális reprezentá ió is algoritmikusan
számolható. Adott modellb®l származó minta esetén a minta feltételes eloszlása az elégséges statisztikára nézve már nem függ az ismeretlen paraméterekt®l. Ez a feltételes eloszlás használható például illeszkedésvizsgálatra, ezért lényeges kérdés, hogy tudunk-e bel®le mintát generálni. Legyen adva a (2) által
X = (X1 ; : : : ; Xm ) pedig legyen a modellb®l származó iid minta. Jelölje fX a gyakoriságvektort, azaz x 2 X -re fX (x) = = jf1 i m : Xi = xgj. Ezzel a jelöléssel az MfX statisztika elégséges -ra. Továbbá X eloszlása az MfX = u feltétel mellett egyenletes az
deniált
F (M )
torikus modell,
Yu = fy 2 X m : Mfy = ug halmazon. A gyakoriságvektorra átfogalmazva,
fX
eloszlása az
MfX = u
feltétel mellett hipergeometrikus az
Fu = ff : X ! N : Mf = ug halmazon, azaz
P (fX = f jMfX = u) =
m!
jYuj
Y x
(f (x)!) 1 ; f
2 Fu:
Ezekb®l a feltételes eloszlásokból általában nem tudunk közvetlenül generálni, de Markov lán Monte Carlo te hnikák alkalmazhatók, ha a feladatra találunk egy Markov bázist.
2. FELHASZNÁLT ESZKÖZÖK
10
2.4. Dení ió. Az f1 ; : : : ; fL : X ! Z függvények az F(M ) modell Markov bázisát alkotják, ha Mfi = 0 minden i-re, továbbá minden u-ra és f; f 0 2 2 Fu-ra található olyan (1 ; fi1 ); : : : ; (A; fiA ) sorozat, ahol i = 1, valamint A
a
X X f 0 = f + j fij ; és f + j fij j =1 j =1
0 minden 1 a A-ra:
Fu állapottéren. Minden lépésben válasszunk egy I -t egyenletesen f1; : : : ; Lgb®l, és legyen = 1, 1=2 1=2 valószín¶séggel. A jelenlegi f állapotból
A Markov bázis segítségével irredu ibilis Markov lán ot deniálhatunk az
próbáljunk az
f 0 = f + fI -be lépni. Ha f 0 nemnegatív, tegyük meg a lépést,
ellenkez® esetben helyben maradunk. A Metropolis algoritmus segítségével módosíthatjuk a lán ot, hogy a kívánt sta ionárius eloszláshoz konvergáljon. Dia onis és Sturmfels [32℄ megmutatja, hogyan lehet az ideálbázisokat megkeres® algebrai algoritmusokat Markov bázisok keresésére használni.
f + (f ), + foka pedig legyen deg f = max( x f (x); x f (x)).
Jelölje az
f
függvény pozitív (negatív) részét
P
P
azaz
f = f+
f
,
2.5. Tétel. (Dia onis és Sturmfels [32℄) Az f1 ; : : : ; fL függvények akkor + x fi és sak akkor alkotják az F(M ) modell Markov bázisát, ha az xfi polinomok generálják az IM ideált. Megjegyezzük, hogy [32℄ arra az esetre is ad algoritmust, ha a Markov bázis kiszámítása méretproblémák miatt nem kivitelezhet®. Tegyük fel, hogy tudjuk, hogy a feladatra van olyan
f1 ; : : : ; fL
Markov bázis, melyre
maxi (deg fi ) d, bár magát a Markov bázist nem tudjuk kiszámolni. Az Yu
állapottéren dolgozva, minden lépésben válasszunk ki egyenletes eloszlás szerint
d különböz® koordinátát. Számoljuk ki a kiválasztott koordináták gyako-
riságvektorának elégséges statisztikáját, majd helyettesítsük a kiválasztott
d-esek közül egyenletesen lehetséges új d-esekb®l elég
koordinátákat az ugyanilyen elégséges statisztikájú választott társasággal. Ha
d
elég ki si, akkor a
kevés van, így a módszer alkalmazható.
2.2. Exponen iális saládok, hierar hikus modellek
11
2.2. Exponen iális saládok, hierar hikus modellek A jelen disszertá ió szempontjából az el®z® szakasz (3) alakú diszkrét exponen iális saládjai lesznek érdekesek. Szorzatalakú állapottér esetén ezek spe iális esetei a hierar hikus, illetve grakus modellek.
X = (X (1); : : : ; X (n)) diszkrét valószín¶ségi változó, lehetséges értékeinek halmaza az I = I1 In véges szorzathalmaz. Minden x = = (x(1); : : : ; x(n)) vektorra és A [n℄-re legyen x(A) = (x(i) : i 2 A) az x [n℄ az [n℄ részhalmazainak egy saládja. vektor A-marginálisa. Legyen A 2 Legyen
Az
A generátorokkal deniált hierar hikus modell a p(x) =
alakú hogy
Y A2A
A (x(A))
8x 2 I
(5)
p eloszlásokból áll, ahol A alkalmas paraméterek. Nyilván feltehetjük,
A-nak
nin s két egymást tartalmazó eleme. A hierar hikus modell
grakus, ha megadható az 1; : : : ; n sú spontokon olyan G gráf, hogy A éppen
G klikkjeinek (maximális teljes részgráfjainak) halmaza. A hierar hikus modellek torikus modellek, mivel F(MA ) alakúak egy alkalmas MA 0 1 mátrixra. A grakus modellek elméletének egyik szép eredménye a HammersleyCliord tétel. Eszerint (5) (ahol A most a G klikkjeinek halmaza) akkor és sak akkor teljesül a p szigorúan pozitív eloszlásra, ha p rendelkezik a globális Markov tulajdonsággal, azaz bármely U; V; S [n℄ diszjunkt részhalmazokra, X (U ) és X (V ) feltételesen függetlenek X (S )-re nézve, valahányszor S elválasztja U -t és V -t a G gráfban. A Markov tulajdonság átírható polinomiális egyenletekké, ezért a 2.2. Tétel a Hammersley Cliord tétel általánosításának tekinthet® a torikus modellek esetére. A 2.2.
p eloszlás akkor és sak akkor eleha p kielégíti az IM ideált generáló
Tétel szerint ugyanis a szigorúan pozitív me az
E(M )
exponen iális saládnak,
polinomokat. Ehhez kap solódó további eredmények találhatók a [37, 52, 56℄ munkákban. A grakus modelleken belül különösen szépen viselkednek a felbontható (de omposable) modellek, melyekhez tartozó gráfokban nin s húr nélküli legalább négy hosszúságú kör. Érvényes a következ® tétel.
2. FELHASZNÁLT ESZKÖZÖK
12
2.6. Tétel. (Geiger et al. [37℄) Legyen adott a G gráfhoz tartozó (diszkrét) grakus modell. A következ® állítások ekvivalensek: (i) A grakus modell felbontható. (ii) A G szerint faktorizálódó eloszlások saládja zárt. (iii) A ellagyakoriságok maximum likelihood be slései tetsz®leges minta esetén ra ionális számok. (iv) A modellhez tartozó torikus ideálnak van másodfokú polinomokból álló Gröbner bázisa (és ezek a polinomok a globális Markov tulajdonság átírásából adódnak). A hierar hikus és grakus modellekhez kap solódó további irodalom [10, 14, 38, 42, 60℄. Legyen
A generátorhalmazzal deniált hierarjelölje r (x) az x 2 I érték mintabeli relatív gyako-
X1 ; : : : ; Xm
hikus modellb®l, és
iid minta az
riságát. A valódi eloszlás, illetve paramétereinek maximum likelihood be slése általában nem expli it. Fontos kivételt képez a felbontható grakus modellek osztálya (lásd a 2.6. Tételt). Az általános esetben egyik leggyakrabban használt numerikus módszer az iteratív arányos illesztés (iterative proportional s aling (IPS) vagy DemingStephan algoritmus) [24, 26℄. Ez az algoritmus garantáltan konvergál a modell lezártjában egyértelm¶en létez®
p^-hoz. Ez az eloszlás azzal a tulajdonsággal P karakterizálható, hogy a p ^(x(A)) = y2I : y(A)=x(A) p^(y ) valószín¶ségek megegyeznek a megfelel® r (x(A)) tapasztalati valószín¶ségekkel, minden A 2 A-ra és x(A) vektorra. Ha a p ^ eloszlás tartója nem teljes, akkor azt mondjuk, hogy
maximum likelihood be sléshez,
a minta tartalmaz strukturális nullát (a strukturális nullának ez a fogalma különbözik a modellbeli strukturális nulla fogalmától). Az IPS algoritmus során iklikusan illesztjük az lását. Legyen
p(0)
A-beli marginálisok elosz-
a hierar hikus modell tetsz®leges szigorúan pozitív eleme
(pl. az egyenletes eloszlás). A
(t + 1): iterá iós lépésben legyen
r(x(A)) (t) p (x); x 2 I p(t+1) (x) = (t) p (x(A)) ahol
A iklikusan befutja A elemeit.
A kés®bbiekben olyan exponen iális saládokkal fogunk foglalkozni, ahol,
2.3. EM- és MM-algoritmusok
13
t s méret¶ M mátrix minden eleme 0 vagy 1. Tegyük még fel, hogy M sorai lineárisan függetlenek, azaz az E(M ) modell reguláris, minimális exponen iális salád kanonikus paraméterekkel, és a Tj (xi ) = mji = fxi 2 Aj g statisztikákkal, ahol Aj X alkalmas
a hierar hikus modellekhez hasonlóan, a
halmazok. A következ® tétel az exponen iális saládokra vonatkozó sokkal általánosabb tétel (pl. [7℄, 2.28.6. Tétel) spe iális esete.
2.7. Tétel. Legyen adott a (3) diszkrét exponen iális salád, ahol az M mátrix teljes rangú, és minden eleme 0 vagy 1. Legyen X1 ; : : : ; Xm a saládbeli p eloszlásból származó iid minta. Ekkor, amint m ! 1, a ^(m) maximum likelihood be slés 1-hez tartó valószín¶séggel egyértelm¶en létezik, és
pm(^(m) ) ! N (0; I ()
1 ) eloszlásban;
ahol I () a Fisher informá iós mátrix, N (; ) pedig a várható érték¶, kovarian ia-mátrixú normális eloszlás. Továbbá
(I ())ij = P (Ai \ Aj )
P (Ai )P (Aj ):
2.3. EM- és MM-algoritmusok Az EM algoritmusok szerteágazó elméletéb®l itt sak annyit ismertetünk, amennyit a kés®bbiekben fel fogunk használni. Az algoritmust hiányos meggyelések esetén fogjuk alkalmazni : tegyük fel, hogy a teljes meggyelés melynek eloszlását a valamilyen
Z,
paramétervektor írja le. Azonban Z helyett annak sak
X függvényét gyeljük meg, ez a hiányos meggyelés. A feladat a
paramétervektor maximum likelihood be slése. Az algoritmus valamilyen (0) kezd®értékb®l indul, a (t +1). iterá ióban pedig az alábbi két lépést végzi el : 1. E-lépés (E = expe tation) : Az
X
hiányos meggyelés és a
(t)
aktuális
paraméterek mellett számítsuk ki a teljes meggyelés log-likelihoodjának várható értékét :
Q( ; (t) ) = E (log L(Z; )jX; (t) ):
2. FELHASZNÁLT ESZKÖZÖK
14
2. M-lépés (M = maximization) : A kapjuk az új
(t+1)
Q( ; (t) ) függvényt -ban maximalizálva
paramétervektort.
Az algoritmust ebben az általánosságban Dempster et al. [27℄ vezette be. Megmutatta, hogy az algoritmus során az
L(X; (t) )
likelihood monoton
L(X; (t) ) egy L értékhez konvergál. Általánosságban azonban nem garantált, hogy L (t) értékek akár a likelihood függvény egy nyeregglobális maximum, s®t a növekszik. Ezért, ha a likelihood függvény felülr®l korlátos, akkor
pontjához is konvergálhatnak. Az EM algoritmus konvergen iáját vizsgálata például Csiszár és Tusnády [17℄ és Wu [61℄. Az EM algoritmusról és annak általánosításairól szól M La hlan és Krishnan [50℄ könyve. Az EM algoritmus, amennyiben konvergál, akkor is lassú : konvergen iája lineáris, sebessége pedig a hiányzó informá ió hányadától függ. Ennek ellenére népszer¶, mivel általában könnyen programozható és kevés memóriát igényel. Az MM (minorization-maximization) algoritmusok egy b®vebb halmazt alkotnak, azaz az EM algoritmusok spe iális MM algoritmusok. Bár ilyen típusú algoritmusokat már jóval korábban is vizsgáltak, az elnevezést Hunter és Lange [41℄ vezette be. A feladat a
paramétervektor maximum likelihood
X mintából (most nin s teljes és hiányos minta). Az algoritmus (0) kezd®értékb®l indul, a (t + 1). iterá ióban pedig az alábbi két valamilyen be slése az
lépést végzi el : 1. M(inorization)-lépés : El®állítunk egy olyan
Qt ( ) log L(X; ) 8 ; 2. M(aximization) lépés : A új
(t+1)
és
Qt ( ) függvényt, melyre
Qt ( (t) ) = log L(X; (t) ):
Qt ( ) függvényt -ban maximalizálva kapjuk az
paramétervektort.
Ez az algoritmus is rendelkezik azzal a tulajdonsággal, hogy az lihood monoton növekszik. Természetesen a áll vagy bukik minden : a
Qt -t
L(X; (t) ) like-
Qt függvények jó megválasztásán
sokszor úgy választják, hogy szétválassza
paramétervektor koordinátáit, azaz a
-ban
vett maximalizálás ko-
ordinátánként legyen elvégezhet®. A konvergen ia itt is sak bizonyos feltételek mellett igazolható.
15
II. rész
Különféle modellek 3. Statisztikák és modellek áttekintése Elöljáróban három olyan munkát említünk, melyek együttesen átfogó képet adnak a véletlen permutá iók elemzésér®l. Marden [48℄ könyve a grakai megjelenítést®l kezdve, a modellalkotáson át, a be slésig és hipotézisvizsgálatig végigvezeti az olvasót a véletlen permutá iók statisztikai eszköztárán. A Fligner és Verdu
i által szerkesztett [36℄ kötet az 1990-ben Amherstben rendezett Probability Models and Statisti al Analyses for Ranking Data ím¶ konferen ia fontosabb el®adásainak anyagát tartalmazza. A kötet érdekességét egyrészt sokszín¶sége adja, másrészt az, hogy a terület 1990-beli aktuális állapotát tükrözi. Végül Crit hlow, Fligner és Verdu
i [15℄ ikke a különböz® modellek olyan tulajdonságait vizsgálja, mint a megfordíthatóság,
ímke-invarian ia, L-felbonthatóság, unimodalitás, és teljes konszenzus. Valós (vagy vektor) érték¶ adatoknál a két leggyakrabban használt statisztika az átlag és a szórás. Permutá iók esetében is számolható átlag, de az általában nem lesz maga is permutá ió. Jelölje
Sn
n
hosszú
Sn -en egy d távolságfüggvény. Ekkor a Pm i=1 d(; i ) összeget minimalizáló Sn
permutá iók halmazát, és legyen adva
1 ; : : : ; m minta d-középértéke a
az
2
lesz, a szóródást pedig maga az összeg (megfelel®en normalizált) értéke méri.
Sn -en számos olyan d távolság deniálható, melyek a statisztikai alkalmazások szempontjából érdekesek és fontosak, ezeket hamarosan ismertetjük (lásd még pl. [28℄, 6. fejezet). Egy középérték helyett kereshetünk többet is, azaz klaszterosíthatjuk az adatokat néhány klaszterközéppont körül. Röviden ismertetjük a permutá ió-adatok spektrális analízisét (Dia onis
Sn beli 1 ; : : : ; m mintából számítsuk legyen f ( ) = jfi : i = gj. Az f vek-
[29℄ és az ottani hivatkozások). Adott ki az
f
gyakoriságvektort, azaz
tort, mint az
R n! euklideszi tér elemét tekintjük. A soportok reprezentá ió-
elméletének egyik eredménye szerint ez a tér egymásra mer®leges
alterekre
bomlik, ahol
V izotipikus
az [n℄ halmaz partí ióit futja be. Az izotipikusság
3. STATISZTIKÁK ÉS MODELLEK ÁTTEKINTÉSE
16
V alterek invariánsak az Sn elemeivel való balról illetve jobbról szorzásra nézve. Pontosabban ez azt jelenti, hogy f 2 V és 2 Sn itt azt jelenti, hogy a
esetén az
fÆ ( ) = f ( ) és fÆ ( ) = f ( ) ( 2 Sn )
balról illetve jobbról szorzott vektorok is
V -beliek,
ahol a permutá iók
egymás után írása a soportszorzást jelöli. Továbbá minden
V izotipikus al-
k() darab egymásra mer®leges invariáns altérre, melyek mind izomorfak, és k () dimenziósak. Az invariáns kifejezés jelentése, hogy a balról szorzásokra invariánsak. A k () értékek például a hook-length képlettér felbomlik
b®l számolhatók, további részletek a [28, 29, 30℄ hivatkozásokban találhatók. Az
f
gyakoriságvektornak az izotipikus alterekre vett vetületeinek hossza (-
gyelembe véve az egyes alterek dimenzióját is), érdekes informá iót tartalmaz az adat struktúrájáról. Térjünk most rá a leggyakrabban használt modellek ismertetésére ! A modellek els® soportja a
rendezett minta modellek (order statisti s mod-
els). Képzeljük el, hogy valakinek hangokat kell er®sség szerint sorrendbe állítania (leghalkabbtól leghangosabbig). Tegyük fel, hogy az er®sségét egy folytonos
sorrend valószín¶sége
Fi
eloszlású
Xi
i:
hang észlelt
valószín¶ségi változó írja le. Ekkor a
p( ) = P (X(1) < < X(n) ): Ezt a példát el®ször Thurstone [59℄, majd kés®bb Daniels [23℄ tanulmányoz-
Xi -k függetlenek (de nem mindig, például azt az esetet is sokat vizsgálták, amikor az Xi -k együttes eloszlása normális). Ha az eloszlások sak eltolásparaméterben különböznek, azaz Fi (x) = F (x i ) (ahol F ismert), akkor Thurstone modellr®l beszélünk. A Gumbel eloszlás esetében, azaz mikor F (x) = 1 exp( exp x), a modell neve Lu e vagy ta. Fel szokás tenni, hogy
Pla kettLu e modell. Lu e [44℄ ezt a modellt egy másik alakban vezette
le. Els®nek felállította a sorbarendezési posztulátumot (ranking postulate). Tegyük fel, hogy
n elemet akarunk sorbarendezni, a legjobbtól a legrosszabb-
ig. A posztulátum azt mondja ki, hogy a sorrend úgy keletkezik, hogy minden lépésben kiválasztjuk a legjobbat a még fennmaradó elemek közül. Azaz az
17
C részhalmazára, és minden x 2 C elemre adott annak pC (x) valószín¶sége, hogy C -b®l x-et választjuk legjobbnak. Ezen kiválasztási valószín¶ségek alapján a sorrend esélye elemek minden
p( ) = ahol
Ck = f (k); : : : ; (n)g
a
n Y k=1
k:
pCk ( (k));
(6)
lépésben még választható elemek hal-
maza. Ezután Lu e a kiválasztási axiómát ( hoi e axiom) alkalmazta a
p C ( x)
értékekre : az axióma azt mondja ki, hogy két elem kiválasztásának
egymáshoz viszonyított valószín¶sége nem függ attól, hogy a többi elem kiválasztható-e vagy sem, azaz a
x; y -t tartalmazó C -re
pC (x)=pC (y ) hányados ugyanannyi minden
(IIA : independen e from irrelevant alternatives). Ez
pedig sak úgy lehetséges, ha
pC (x) = x =
hogy
p( ) =
P y2C y
n Y
(k) Pn : ( j ) j = k k=1
alakú. Kaptuk tehát,
(7)
Könny¶ ellen®rizni, hogy a Gumbel eloszlású Thurstone model ugyanezeket a valószín¶ségeket adja. A
Babington Smith modellt
Babington Smith [3℄ javasolta, ez páros
összehasonlításokból építi fel a sorrendet. A páros összehasonlításoknak külön elmélete van, ezt lehetett összeházasítani a teljes sorrendek elméletével : ve-
n elemb®l alkotható összes párt, és mindegyik párból válasszuk ki a nekünk szimpatikusabb elemet. Az n pontú teljes gráf éleit irányítsuk a gyük sorra az
választásainknak megfelel®en. Ha ebben a gráfban nin s irányított kör, akkor választásaink konzisztensek egy egyértelm¶en meghatározott sorbarendezéssel. A körmentességre feltételt véve kapjuk, hogy
p( ) = ()
Y i<j
(i)(j ) ;
xy annak a valószín¶sége, hogy x és y páros összehasonlításában x gy®z. A modellb®l vett m elem¶ 1 ; : : : ; m minta esetén a paraméterekre elégséges ahol
3. STATISZTIKÁK ÉS MODELLEK ÁTTEKINTÉSE
18
statisztika a
Kb
pármátrix, melynek
Kb ij =
(i; j ): eleme
1 k : (k ) 1 (i) < (k ) 1 (j ) m
azt fejezi ki, hogy a minta hányad részében kapott az helyezést, mint a
j
sorszámú.
A Babington Smith modell spe iális esete a
modell,
melyben
i sorszámú elem jobb
xy =
x x +y .
MallowsBradleyTerry
A valószín¶ségek ilyen alakját Bradley és
Terry [9℄ vetette fel, a páros összehasonlítás modellben való használatát pedig Mallows [45℄ javasolta. A
sorrend esélye ebben a modellben tehát
p( ) = ()
n Y i=1
n(i)i
=
n Y 1
() jn (j ) : j =1
m elem¶ 1 ; : : : ; m minta esetén a paraméterekre elégséges = (Vb (1); : : : ; Vb (n)) átlaghelyezés vektor, ahol
A modellb®l vett statisztika a
Vb
Vb (j ) a
j
m 1X ( ) 1 (j ) = m k=1 k
sorszámú elem helyezésének mintabeli átlaga. A következ® soportot a
models) alkotják. Legyen
d
távolság-alapú modellek
ismét egy
Sn -en
adott távolságfüggvény, ennek
segítségével az alábbi egyszer¶ modellt deniálhatjuk a
p( ) = K ( ) e ahol
0
2 Sn
(distan e-based
helyezésekre :
d(;0 ) ;
az eloszlás (ismert vagy ismeretlen) módusza,
0
pedig
paraméter. Fontos megjegyezni, hogy a távolság dení iójába nem feltétlenül értjük bele a háromszög-egyenl®tlenség teljesülését. Ha azt szeretnénk, hogy a modell ne függjön az elemek számozásától, akkor fel kell tenni, hogy a
d
távolság jobbról invariáns, és ezt mindig fel is szokták tenni. Az 1. táblázatban a legfontosabb távolságokat gy¶jtöttük össze ( Megjegyezzük, hogy a Kendall
,
fg
az indikátor függvény).
Cayley, és Ulam távolságoknak mind van
olyan típusú dení iója, hogy hány megengedett lépéssel lehet egyik per-
19
1. táblázat. Néhány fontos távolság dení iója
Hamming
dH (; ) =
p-távolság dp (; ) = Maximum Kendall
dM (; ) =
dK (; ) =
Pn k=1 (k ) Pn k=1 (k ) maxnk=1 (k) P i<j ( (i)
j
f
j f
6= (k)g (k)jp (k)j
(j ))((i) (j )) < 0g ( 1 )-ben
Cayley
dC (; ) = n
Ciklusok száma
Ulam
dU (; ) = n
Max. mon. növ® rész hossza
( 1 )-ben
mutá iót a másikba transzformálni, ahol a megengedett lépések halmaza a három távolságnál természetesen más és más. A statisztikai alkalmazások szempontjából érdekes, hogy mely távolságok invariánsak balról, melyek invariánsak a megfordításra vagy az invertálásra. Ezeket a tulajdonságokat részletesen tárgyalja pl. [28, 48℄. A
kvázi független modellr®l már beszéltünk, itt sak azt tesszük hozzá,
m elem¶ 1 ; : : : ; m minta esetén a paraméterekre
marginális mátrix, melynek (i; j ): eleme elégséges statisztika az M hogy a modellb®l vett
ij = M
1 jfk : k (i) = j gj m
annak tapasztalati valószín¶ségét adja meg, hogy a
j
sorszámú elem az
i:
b , Vb , M
statisztikák a modellekt®l helyezést kapja. Itt jegyezzük meg, hogy a K függetlenül is sokat segítenek az adatokkal való ismerkedésben. A következ® modell a
többlép s®s helyezési modell (multistage rank-
ing model), melyet Fligner és Verdu
i [35℄ vezetett be. Itt a halmaz elemei (ezeket gyakran jelölteknek hívjuk) helyezéseket egyesével osztjuk ki. A kiosztottuk, és most választjuk ki
1-t®l n-ig
vannak számozva. A
k: lépésben a legjobb k 1 helyezést már a k: helyezett jelöltet, de a kiválasztás-
nál sak a maradék jelöltek relatív számozását vesszük gyelembe. Ha tehát a
j1 <
< jn
k+1
jelöltek maradtak, akkor
ji -t (i; k)
valószín¶-
3. STATISZTIKÁK ÉS MODELLEK ÁTTEKINTÉSE
20
séggel választjuk, ahol
(i; k)
a
Pn k+1 i=1 (i; k )
= 1
összefüggést kielégít®
paraméterek. Doignon, Peke£ és Regenwetter [33℄ egy hasonló modelljében a jelölteket számozásuk szerint vesszük sorba, és az új jelöltet az eddigiek sorrendjébe
k-ra adottak tehát a (i; k), i = 1; : : : ; k beszúrási valószín¶ségek, melyek összege 1. A k: jelöltet k helyre illeszthetjük be : szúrjuk az eddigi sorrend (i 1): és i: helye közé (i; k) valószín¶séggel. Az így adódó
szúrjuk be. Minden
ismételt beszúrások modellje
(repeated insertion model) a többlép s®s
helyezési modell duálisa abban az értelemben, hogy a helyezések és a jelöltek szerepét fel seréltük. Végül ismertetjük a Chung és Marden [11℄ által bevezetett
kontrasztok modelljét. Egy C
ortogonális
kontraszt nem más, mint a jelöltek néhány
C = (I1 ; : : : ; IK ), ahol Ij nemüres diszjunkt részhalmazai az [n℄ jelölthalmaznak. A C kontraszt értéke a helyezésvektoron megadja az egyes Ij soportokba es® jelöltek relatív helyezéseit a C U = [j Ij halmazhoz képest. Formálisan,
soportjának összehasonlítása, pl.
C ( ) = (f (i) : i 2 I1 g; : : : ; f (i) : i 2 IK g); (i) azt mutatja meg, hogy (i) hányadik legkisebb a f (j ) : j 2 C U g halmazban. Legyen például n = 5, a helyezésvektor pedig = (24513). A C = (f1;2g; f3;4g) kontraszt az els® kett® és a második kett® jelöltet hasonlítja össze. C értéke -n C ( ) = (f2;3g; f1;4g), azaz mindkét els® jelölt ahol
a két következ® közé van rangsorolva. Két kontrasztot akkor nevezünk ortogonálisnak, ha az általuk deniált
C = (Ii ) és D = U J vagy (ii) C k
összehasonlítások nem keverednek egymással. Formálisan,
= (Jj )
akkor ortogonálisak, ha vagy (i)
valamilyen
k-ra,
vagy (iii)
DU
CU
\ DU
=
;,
Ik valamilyen k-ra. Ortogonális kontrasz-
tok esetén a lehetséges kontraszt-értékek akárhogy kombinálhatók egymással, ezért javasolta Marden [47℄ a kontraszt-értékek modellezésére a kontingen iatáblák esetére használt modelleket. Ennek spe iális esete a ben a
C1 ; : : : ; Cs
-modell, mely-
ortogonális kontrasztok értékei függetlenek, s®t, az egyes
21
permutá iók valószín¶ségei
s X
p( ) = K () expf alakúak, ahol
= (i )
i=1
paramétervektor,
= (I1 ; : : : ; IK ), akkor
d(C ( )) =
X
i d(Ci ( ))g
K ( )
XX
1i<j K r2Ii s2Ij
normáló tényez®, és ha
C=
f (r) > (s)g
a Jon kheere-Terpstra statisztika.
4. M Cullagh inverziós modellje Peter M Cullagh [49℄ vezette be a páros összehasonlítások (Babington Smith) modelljének következ® általánosítását. Minden álljon
IC
a
C
C
[n℄
halmaz elemeinek olyan permutá ióiból, melyek
C
halmazra
egy elemét
sem teszik a nagyság szerint növekv® sorrendben elfoglalt helyére. Ha például
C = f2; 4; 5g, akkor IC az (524) és a (452) permutá iókból áll. M Cullagh ezeket (k 1)-ed rend¶ inverzióknak nevezi, ha jC j = k. A továbbiakban C -t az IC -beli inverziók alaphalmazának nevezzük. Az IC halmaz
n = 5,
és
elemszámát könny¶ felírni a szita formula segítségével, és az is egyszer¶en adódik, hogy az összes (tetsz®leges rend¶) inverzió száma hogy egy
2 Sn
permutá ió tartalmazza az
IC -beli C
n! 1. Azt mondjuk, inverziót (jelölésben
C ), hogyha elemeib®l sak a C -belieket megtartva éppen C -t kapjuk. Ismét n = 5-tel, az (15324) permutá ió az (524), (534), (32), (52), (53), (54) inverziókat tartalmazza. Az inverziók segítségével deniálhatunk torikus modelleket. Válasszunk
s darabot, legyenek ezek C1 ; : : : ; Cs s . Konstruáljuk meg hozzájuk azt az s n! méret¶ M in iden ia-mátrixot, melynek (j; )j dik eleme 1, ha tartalmazza C -t, egyébként pedig 0. Tekintsük az ehhez j tartozó F(M ) modellt.
ki az inverziók közül
1
M Cullagh olyan eseteket vizsgált, amikor az inverziók közül az összes
4. MCCULLAGH INVERZIÓS MODELLJE
22
k rend¶t vesszük be a modellbe, valamilyen k-ra. A modell szabad paramétereinek száma (szigorúan pozitív esetben) attól függ, hogy az M
legfeljebb
mátrix sorai között vannak-e lineáris összefüggések. M Cullagh azt a sejtést fogalmazta meg, hogy ilyen összefüggések nin senek. Pontosabban, vegyük be a modellbe az összes inverziót, és még az
1 sort is. Így egy n! méret¶ Mn négy-
zetes mátrixot kapunk, melyr®l M Cullagh azt sejtette, hogy determinánsa
1 (attól függ®en, hogy milyen sorrendben soroljuk fel a sorokat/oszlopokat). Sejtését n 4-re ellen®rizte, és azt is észrevette, hogy a sorok és oszlopok megfelel® átrendezésével háromszögmátrix kapható, melynek f®átlójában supa
1-es áll. Marden [48℄ minden n 7-re ellen®rizte a sejtést.
Ha a fenti torikus modellbe sak az els®rend¶ inverziókat vesszük bele, akkor visszakapjuk a Babington Smith modellt. Az ennél bonyolultabb modellek felépítése analógiát mutat a kontingen iatáblákra alkalmazott hierar hikus modellekkel, ahol egyre magasabb rend¶ köl sönhatásokat építünk be a jobb illeszkedés kedvéért. A
k-adrend¶
inverziók a
k-adrend¶
interak iók
analógjai. Tegyük fel, hogy egy els®rend¶ inverziós modellben (azaz amely
(kj ) (j < k) inverzió. Ekkor, feltéve hogy egy permutá ióban a j és a k szomszédos, annak esélye, hogy k
sak els®rend¶ inverziókat tartalmaz), szerepel a
jön el®bb, a permutá ió többi elemét®l független :
p(1 kj 2 ) = ; p(1 jk 2 ) kj ahol
1; 2 a számlálóban és nevez®ben azonos elem-sorozatok.
Hasonlóan, ha egy másodrend¶ modellben szerepel az
(ljk) (j < k < l)
inverzió, akkor
p(1 kjl 2 ) log p(1 jkl 2 )
p(1 lkj 2 ) log = ljk : p(1 ljk 2 )
A paraméterek interpretá ióját nehezíti, hogy a fenti egyenletek sak akkor igazak, ha a vizsgált elemek szomszédosak a permutá ióban.
n 4-re M Cullagh felsorolta az összes
olyan modellt, melyek bizonyos
peremfeltételeknek eleget tesznek. Ezek a peremfeltételek biztosítják, hogy a fenti paraméterek jobban interpretálhatóak legyenek.
n = 3-ra
kilen ilyen
23
modell van, azonban
n növekedésével egyre nehezebbnek t¶nik az ilyen típusú
modellek áttekintése. A továbbiakban bebizonyítjuk M Cullagh sejtését, elemi meggondolásokkal. Mondjuk ki el®ször az állítást !
4.1. Tétel. Legyen Mn az az n! méret¶ négyzetes mátrix, melynek els® n! 1 sora a C inverziókhoz tartozó fC g indikátorvektorokat tartalmazza, utolsó sora pedig 1. Ekkor Mn sorai és oszlopai minden n-re átrendezhet®k úgy, hogy alsó háromszögmátrixot kapjunk, melynek f®átlójában supa 1-es áll. A tételt bizonyítás el®tt fogalmazzuk át ! Ehhez azonosítsuk az inverziókat és a permutá iókat. A
C
alaphalmazú
C
inverziót azonosítsuk azzal a
permutá ióval, mely a C elemeit C szerint rakja sorba, míg [n℄ n C elemeit xen hagyja. Például n = 5-re az (524) inverziót az (15324) permutá ióval identikáljuk. Ahhoz, hogy Sn minden elemét megkapjuk, vezessük be az üres inverziót (melynek alaphalmaza
;) úgy, hogy ezt az inverziót minden
id identitással azonosítjuk. Ha a permutá ió tartalmazza a C inverziót, és a C -vel azonosított permutá ió , akkor ezt a relá ióval jelöljük. Így a 4.1. Tételben szerepl® Mn permutá ió tartalmazza. Az üres inverziót az
mátrix megegyezik (a sorok és oszlopok sorrendjét®l eltekintve) a
M
g. Megmutatjuk, hogy van f1 ; : : : ; n!g felsorolás, hogy minden 1 i < j n! esetén
indikátormátrixával :
M (; ) = f
relá ió
Sn = j 6i . Ha Mn sorait és oszlopait is ebben a sorrendben soroljuk fel, akkor Mn alsó háromszög lesz, a f®átlóban pedig 1-esek állnak, mivel minden 2 Sn -re. Könny¶ látni, hogy ilyen felsorolás akkor és sak akkor létezik, ha a relá iót leíró G irányított gráfban nin s irányított kör (a hurokéleken kívül). Ennek a gráfnak Sn elemei a sú sai, és akkor vezet -b®l -ba irányított él, ha . A szokásos módon bevezethetjük a relá iót : akkor és sak akkor, ha és 6= . A hozzá tartozó G gráf sak annyiban kölönbözik G -t®l, hogy nin senek benne hurokélek. Mivel a relá ió nem tranzitív, a olyan
következ®, 4.1. Tétellel ekvivalens állítás nem triviális.
4.2. Tétel. A G gráfban nin s irányított kör.
4. MCCULLAGH INVERZIÓS MODELLJE
24
A 4.2. Tétel bizonyítása el®tt egy másik tételt fogunk belátni. Deniálunk az
Sn halmazon egy másik, GH
permutá ióból vezessen irányímelyet -b®l úgy kapunk, hogy egy
gráfot. Egy
tott él minden olyan permutá ióba,
elemet a helyére rakunk, a többit pedig odébb toljuk, ha szükséges. Néz-
n = 5-re : a = (24351) permutá ióból az (12435), (42351), (23541), (24315) permutá iókba vezet él, rendre az 1;2;4;5 elemeket tettük helyre ( -ben 3 a helyén van, ezért ®t nem akarjuk már helyre tenni : zünk megint egy példát
így ebben a gráfban nem lesz hurokél).
4.3. Tétel. A GH gráfban nin s irányított kör. Bizonyítás. n
szerinti teljes induk ióval bizonyítunk.
triviálisan teljesül. Tegyük fel, hogy minden állítást, bizonyítsuk be
n-re !
h
(n
n = 2-re az állítás 1)-re már tudjuk az
Tegyük fel indirekt, hogy van a gráfban egy
1 ! : : : ! k ! 1 irányított kör.
Vegyük el®ször észre, hogy egy helyrerakó lépés (H-lépés) nem növelheti a
v ( ) =
Pn i=1
j 1(i) ij értéket. Itt j 1(i) ij azt mutatja meg, hogy az i
permutá ióban. v ( ) azért nem 1 n®het, mert ha a j elemet rakjuk helyre, akkor az összeg j: tagja j (j ) j j-vel sökken. A helyrerakás közben összesen j 1 (j ) j j elemet kellett elem milyen messze van a saját helyét®l a
eggyel odébb tolni, és az összeg eltolt elemekhez tartozó tagjai legfeljebb eggyel n®nek. Az összeg többi tagja pedig nem változik. Ha van egy irányított körünk, akkor a fentiek szerint a
v ( ) értékek kons-
tansok a körben. Ez sak úgy lehet, ha minden H-lépésben az összes eltolt elem
távolodik
a saját helyét®l. Nézzük meg el®ször, hogy mi történik
n-nel
n-et a helyére rakjuk, akkor ott is marad, mert nin s senki, aki ki tudná tolni a helyér®l. Emiatt két eset lehetséges : (i) n a saját helyén van az egész kör alatt, (ii) n sosin s a saját helyén a kör alatt. Az (ii) esetben tegyük fel, hogy a kör elején és végén n a k < n helyen van. Mivel már beláttuk, hogy n a kör során sak balra tolódhat, a helyére ugrani pedig nem fog, így sak az lehetséges, hogy n a kör alatt végig a k: helyen marad. a kör során. Ha egyszer
Tehát mindkét esetben van a permutá iónak legalább egy olyan eleme (maga
n), mely végig egy helyben marad a kör során.
25
Jelölje
x1 < : : : < xf , n > f
1, azokat a helyeket, ahol az elemek az
egész kör alatt xen maradnak, azaz
i (xj ) = j minden i; j -re. Minden elem,
amely nem ezeken a helyeken áll, legalább egyszer a helyére kerül, és legalább egyszer eltolódik. Ha ugyanis sak tolódna, akkor folyamatosan távolodna a saját helyét®l, és a kör nem zárulna be. Ha pedig sak annyi történne vele, hogy egyszer a helyére raknánk, akkor szintén nem záródna a kör. Vegyünk most egy
[xg + 1; : : : ; xg+1
1℄
intervallumot, és nézzük meg, hogy ezeken
a helyeken mi történik. Az ezen helyeken álló elemeket legalább egyszer a helyükre tesszük, azonban ezzel nem hagyhatják el a vizsgált intervallumot,
xg , vagy az xg+1 helyen álló elem odébb tolódna. Belát[xg + 1; : : : ; xg+1 1℄ intervallumot a kör mindegyik i
hiszen akkor vagy az tuk tehát, hogy az
permutá iója önmagára képezi. Az ilyen intervallumok között van legalább egy nem-üres, melynek hossza
2 h n 1. Ha az egész kört megszorítjuk
erre az intervallumra (és átszámozzuk az elemeket), irányított kört kapunk az
Sh-hoz tartozó GH gráfban, ami az induk iós feltevés szerint ellentmondás. Most már bebizonyíthatjuk a 4.2. Tételt.
Bizonyítás. (4.2. Tételé) élét, és G összes többi
Azt látjuk be, hogy
G
tartalmazza a
GH
összes
! éléhez van GH -ban ! 1 ! ! k !
irányított út. Ebb®l a tétel már következik, hiszen minden
G -beli
kör
GH -beli körré, amir®l már beláttuk, hogy nin s. Egyrészt világos, hogy ha -b®l egy H-lépéssel kapható, akkor nemxpontjai ugyanolyan sorrendben vannak -ban és -ben, azaz . Másrészt meg kell mutatnunk, hogy ha nem-xpontjai ugyanolyan sorrendben vannak -ban és -ben, akkor -b®l megkapható véges sok H-lépéssel. Ehhez sak annyit kell tenni, hogy azon elemeit, melyek -ban xpontok, a nomítható lenne
helyükre rakosgatjuk, egész addig, míg mindegyik a helyére nem kerül. El®fordulhat, hogy egy elemet többször is mozgatni kell, mert az els® helyrerakás után eltolódik, de mivel megkapjuk
-t.
GH -ban
nin s kör, véges sok lépésben garantáltan
Beláttuk M Cullagh sejtését, és közben találtunk két olyan gráfot
Sn -en,
G gráf deniál egy G részbenrendezést Sn -en : G akkor és sak akkor, ha = , vagy -b®l el lehet
melyben nin s irányított kör. Minden ilyen
4. MCCULLAGH INVERZIÓS MODELLJE
26
jutni
-ba G-beli irányított úton. A 4.2. Tétel bizonyítása szerint a G és a
GH gráf ugyanazt a részbenrendezést deniálja, jelölje ezt H . Ezt a részbenrendezést tehát a H-lépés deniálja. Az Sn halmazon természetesen sok más (körmentes) lépés deniálható, és vizsgálhatók a hozzájuk tartozó részbenrendezések. A következ® szakaszban röviden bemutatunk majd néhány olyat, melyeknek statisztikai alkalmazása is van. Egy körmentes irányított gráf sú sait szintekre oszthatjuk. A nulladik szint álljon azokból a sú sokból, melyekb®l nem vezet ki él. Ha az els®
k
k: szint álljon a maradék sú sok közül azokból, melyekb®l sak az els® k 1 szintre vezetnek ki élek. Ezzel a felbontással a k: szintre azok a sú sok kerülnek, melyekb®l a nulladik szintre vezet® leghosszabb út éppen k hosszúságú. A legmagasabb szint sorszáma 1
szintet már deniáltuk, akkor a
pedig a gráf leghosszabb irányított útjának hossza. A
GH
gráfban a nulladik szint sak az identitásból áll. Az els® szinten
azok a permutá iók foglalnak helyet, melyek az identitástól sak két szomszédos elem fel serélésével térnek el. A magasabb szintek leírása már sokkal bonyolultabbnak t¶nik : nem találtunk olyan módszert, mellyel egy
permu-
tá ióról könnyen eldönthet® lenne, hogy hányadik szinten van. Azt is tudjuk, hogy a
GH
gráfban van
hosszabb nin s.
2n 1
2n 1
1 hosszú
1
hosszúságú út, és azt sejtjük, hogy ennél
utat például úgy kapunk, ha a
(234 : : : n1)
permutá ióból indulva, mindig a legels® helyen álló elemet tesszük a helyére.
(k +1). tagját, k+1 -et úgy kapjuk (0 k 2n 1 1), hogy a k számot kettes számrendszerbe írjuk (az elejét nullákkal feltöltve, hogy n 1 hosszú sorozat keletkezzék), jelölje ezt v k . k+1 -ben pontosan akkor lesz k a j > 1 xpont, ha v -nak az (n + 1 j ). koordinátája 1-es. Az 1 sak akkor n 1 lesz xpont, ha k = 2 1, azaz az út legvégén, hiszen az út az idenn 1 titásban végz®dik. A k < 2 1 esetben pedig a xpontok rögzítése után írjuk az utolsó szabad helyre az 1-et, a többi szabad helyet pedig töltsük fel Ennek az útnak a
a maradék elemekkel növekv® sorrendben. Elemi meggondolással belátható, hogy az így megkonstruált konstruk ió szerinti
legels® elemének helyrerakásával valóban a
k+1 -et kapjuk.
n = 7, ekkor a fenti út hossza 63. Keressük meg ennek 23. tagját ! A 22-t kettes számrendszerbe írjuk : 010110. Ezért a
4.4. Példa. az útnak
k
Legyen
0
0
1
2
5
3
4
10
5
6
7
15
27
1. ábra. A
GH
gráf váza
3;4;6 szerint kitöltve, 23 = (2534761). keresett permutá ió xpontjai
Ha a
n = 4 és n = 5 esetén.
lesznek. A maradék helyeket a leírás
GH gráfnak sak a szintjeire, illetve a sú sok közötti leghosszabb utakra
vagyunk kíván siak, akkor elég, ha a gráf vázát vizsgáljuk. Ezt úgy kapjuk, hogy az éleken egyesével sorbamenve, minden olyan melyre a gráfban van
! élt elhagyunk,
-b®l -ba vezet® egynél hosszabb út. Az, hogy mely
éleket fogjuk így elhagyni, nyilván nem függ attól, hogy milyen sorrendben vesszük ®ket végig. A
= 5-re.
GH
gráf vázát szemlélteti az 1. ábra
n = 4-re és n =
Helyhiány miatt a sú sok mellé nem írtuk oda a hozzájuk tartozó
permutá iókat. A függ®leges tengelyen a szint sorszáma látható, egy szinten belül a sú sok elrendezése viszont nem követ különösebb logikát.
n = 4-re
úgy kaphattunk szimmetrikus ábrát, hogy a negyedik szinten található két
sú sot egymás fölé rajzoltuk, kis eltolással. Az éleket aszerint szineztük, hogy milyen távoli szintek között futnak. A leghosszabb út mellett a legrövidebbre is kíván siak lehetünk. Jelölje
`( ) a legrövidebb, -b®l az identitásba vezet® út hosszát. Erre a mennyiségre
sak alsó és fels® be slést tudunk adni, pontos értékére nem tudunk könny¶ kiszámítási módot. Jelölje
s 1 ( ) a
leghosszabb monoton növ® részsoroza-
tának hosszát :
s1 ( ) = maxfsj 9i1 < : : : < is : (i1 ) < : : : < (is )g:
4. MCCULLAGH INVERZIÓS MODELLJE
28
Hasonlóan, jelölje
s2 ( ) a leghosszabb, egyesével növeked® részsorozatának
hosszát :
s2 ( ) = maxfsj 9i1 < : : : < is : (ik ) = (ik 1 ) + 1 8kg: A következ® egyenl®tlenségek teljesülnek.
4.5. Tétel.
n s1 ( ) `( ) n s2 ( )
Bizonyítás.
8 2 Sn:
Az els® egyenl®tlenség azért igaz, mert minden H-lépés legfel-
s1 ( )-t A másodikhoz legyen k; k + 1; : : : ; k + s2 ( ) 1 egy leghosszabb eggyel növekv® részsorozat -ben. Rakjuk el®ször helyre az 1;2; : : : ; k 1 elemeket, azután pedig az n; n 1; : : : ; k + s2 ( ) elemeket. Így az identitást kapjuk legfeljebb n s2 ( ) H-lépésben.
jebb eggyel növelheti
A szakasz befejezéseként megemlítünk egy általánosítást. Legyen
T
egy
n sú sú fa, a sú sok legyenek 1-t®l n-ig számozva. Legyen még n objektumunk is, szintén 1-t®l n ig számozva. Ha a fa minden sú sába pontosan egy objektumot rakunk, akkor az objektumok elhelyezkedését egy 2 Sn permutá ió írja le. Deniálhatjuk a fa szerinti H-lépést : válasszunk egy olyan objektumot, mely nem a saját helyén van, és tegyük át a saját helyére úgy, hogy az eddigi helyét és a saját helyét összeköt® fa-beli út mentén a többi objektumot eggyel el súsztatjuk. Ez a H-lépés is körmentes, a 4.3. Tétel bizonyítása (ami az a spe iális eset, amikor a fa egyetlen út) most is m¶ködik. Annyi a módosítás, hogy veszi át, az
n
[xg + 1; : : : ; xg+1
szerepét a fa egy tetsz®legesen választott levele
1℄ intervallumok helyett pedig azok a részfák
szerepelnek, melyek a kör során változatlan objektumú sú sok elhagyásával keletkeznek. A tetsz®leges fához tartozó H-lépésre is feltehet®k az eddigi kérdések a szintek számáról, a legrövidebb utakról, stb. Ezek azonban már végképp nem vágnak a jelen értekezés témájába. Ehhez kap solódó valószín¶ségszámítási feladat a következ®. Induljunk ki valamilyen kongurá ióból, és minden lépésben véletlenül válasszuk ki a helyrerakandó objektumot, mondjuk az
i.
objektumot
p( i )
valószín¶séggel.
29
X azt, hogy hány lépés múlva lesz minden objektum a helyén. Keresend® X eloszlása. Jelölje
5. Részbenrendezések
Sn -en
Ebben a szakaszban áttekintünk néhány ismert eredményt az
megadható statisztikai szempontból is érdekes részbenrendezések, és a velük szorosan összefügg® távolságok témaköréb®l. A távolságokhoz hasonlóan, az
Sn
bizonyos részbenrendezéseinek is van
fontos statisztikai alkalmazása. Az alapkérdés itt az, hogy a
H1
és
H2
kétváltozós eloszlások közül melyikben er®sebb a két változó közötti pozitív összefügg®ség. Itt most nem azt a megközelítést használjuk, hogy minden kétváltozós eloszláshoz hozzárendelünk egy, a pozitív összefügg®ség er®sségét mér® számot, hanem a kétváltozós eloszlások halmazán egy részbenrendezést deniálunk. Pontosabban, az
M (F; G)
halmozon deniáljuk a részbenren-
H -kból áll, melyek X -marginálisa F , Y -marginálisa pedig G. Ha a H1 és H2 eloszlású (X1 ; Y1 ) és (X2 ; Y2 ) változók marginálisai dezést, mely mindazon
különböznek, összehasonlításuk még mindig lehetséges, amennyiben
F1 (X1 ) F2 (X2 ) és G1 (Y1 ) G2 (Y2 ); ahol
(8)
azt jelenti, hogy a két változó eloszlása megegyezik. Ekkor az eredeti
eloszlások helyett az
(F1 (X1 ); G1 (Y1) és az (F2 (X2 ); G2 (Y2 )) párok H1 és H2
eloszlásait hasonlíthatjuk össze. Az irodalomban többféle ilyen részbenrendezés is használatos (lásd pl. S hriever [53℄ vagy Lehmann [43℄) :
H1
lehet
H2 -nél jobban konkordáns ( on ordant, ), asszo iált (asso iated, a ), sor regresszió összefügg® (row regression dependent, összefügg® ( olumn regression dependent,
rr ) vagy oszlop regresszió
r ). Ezek pontos dení iójára itt
nem térünk ki, mivel az értekezés központi témájához sak lazán kap solódnak. Tegyük most fel, hogy a
H1 és a H2 kétváltozós eloszlásokból meggyelünk
n elem¶ mintát, és a mintaelemek mindkét mintában különböz®ek. ^ 1 és H^ 2 tapasztalati eloszlásfüggvényekre teljesül a (8) feltétel, és a Ekkor a H egy-egy
5. RÉSZBENRENDEZÉSEK
30
H^ 1 , H^ 2 transzformált tapasztalati eloszlásfüggvények marginálisai egyenletesek lesznek az f1=n; 2=n; : : : ; 1g halmazon. Így az eloszlásfüggvények közötti, pozitív összefügg®séget mér®
részbenrendezések természetes módon
Sn -en részbenrendezéseket : ha a H^ i eloszlás a (k=n; i (k)=n) pontokhoz rendel 1=n súlyokat, ahol k = 1; : : : ; n, és i = 1;2, i pedig Sn -beli ^ 1 H^ 2 . permutá ió, akkor legyen például 1 2 akkor és sak akkor, ha H A [4, 5℄ ikkekben Blo k, Chhetry, Fang és Sampson az Sn így keletkez® deniálnak
négy részbenrendezését
vizsgálják. Ekvivalens megfogalmazásokat adnak
ezekre a részbenrendezésekre, illetve módszereket adnak arra, hogyan dönthet® el, hogy két permutá ió relá ióban áll-e. Ehhez kap solódik Blo k et al. [6℄ valamint Dia onis és Graham [31℄ munkája, melyekben a szerz®k a részbenrendezések és a távolságok kap solatát elemzik. Ki sit részletesebben, jelöljön
i
négy részbenrendezést
Sn -en,
ahol
i = 1; : : : ;4.
A
i
relá iók inverzió-megsz¶ntet® transzpozí iókkal vannak deniálva. Akkor mondjuk, hogy
i , ha -ból elérhet® olyan (i-t®l függ® típusú) transz-
pozí iósorozattal, mely az inverziók számát minden lépésben sökkenti. Az
i = 1 esetben minden transzpozí ió megengedett. A többi i-re sak bizonyos transzpozí iók megengedettek. i = 2-re sak szomszédos sorszámú (azaz k , k + 1 alakú) elemeket serélhetünk fel, míg i = 3-ra sak szomszédos helyen álló elemeket. Az i = 4 esetben az i = 2, 3 esetekhez tartozó transzpozí iók vannak megengedve. A következ® eredményt Blo k et al. [5℄ tartalmazza :
H^ 1 H^ 2 H^ 1 r H^ 2 Az
() 1 1 2 ; H^ 1 rr H^ 2 () 1 2 2 ; () 1 3 2 ; H^ 1 a H^ 2 () 1 4 2 :
i 3 esetekben a szerz®k egyszer¶en ellen®rizhet® feltételeket adnak arra,
hogy két permutá ió mikor van relá ióban.
Sn -en, melyeket rendre inverzióinak számát.
A [6℄ ikkben a szerz®k négy távolságot vizsgálnak
di (; )
jelöl (
i = 1; : : : ;4).
Jelölje továbbá
I ( )
a
Megmutatják, hogy
i Az
() di(; ) = I () I ():
i > 1 esetekben di (; ) a -t és -t összeköt® legrövidebb, i-típusú transz-
31
pozí iókat használó út hossza (most nem kötjük ki, hogy az inverziók száma
sökkenjen). Ezek közül
d2 és d3 könnyen számolható :
d2 (; ) = I ( 1 ); d3 (; ) = I ( 1 ); -távolság, illetve annak inverze. A d4 távolságra egyszer¶ kiszámítási módot. Végül az i = 1 esetben
ezek éppen a Kendall-féle azonban nem adnak
d1 (; ) a -t és -t összeköt® legrövidebb olyan transzpozí ió-sorozat hossza, melyben az inverziók száma minden lépésben pontosan eggyel változik.
Fogalmazzuk meg az eddig látottakat kissé általánosabban ! El®ször is,
G = (Sn ; E ) irányítatlan, összefügg® gráf deniál Sn -en egy dG távolságot : dG (; ) a -t és -t összeköt® legrövidebb út hossza. Ezen kívül legyen M : Sn ! N egy függvény, ennek segítségével részbenrendezés is deniálható : G;M , ha -ból vezet olyan G-beli út -be, amely mentén M minden
szigorúan monoton sökken. Tegyük még fel, hogy
valamint hogy
jM () M ()j 1 8(; ) 2 E;
(9)
8; 2 Sn:
(10)
dG(; ) = M ( 1 )
A (9) teljesülése esetén (10) teljesüléséhez például elegend®, hogy
dG
balról
dG (; ) = dG (; )), M ( ) = 0 sak = hogy minden -nek legyen nála eggyel kisebb
(vagy jobbról) invariáns (azaz
= id-re teljesüljön, valamint M -értékkel rendelkez® szomszédja. 5.1. Tétel. Teljesüljön (9) és M ( 1 ) = M () M ( ). Bizonyítás.
(10)
. Ekkor G;M akkor és sak akkor, ha
Az egyik irányban, ha
G;M , akkor -ból vezet olyan út
-be, mely mentén M értéke szigorúan monoton sökken. (9) miatt ennek az útnak a hossza M () M ( ), másrészt, szintén (9) miatt ennél rövidebb út nin s. (10) szerint tehát
M () M ( ) = dG (; ) = M ( 1 ):
5. RÉSZBENRENDEZÉSEK
32
A másik irányban viszont tegyük fel, hogy
dG (; ) = M ( 1 ) = M () M ( ): -ból -be vezet® M () M ( ) hosszú út. (9) miatt azonban egy ilyen út mentén M szükségképpen szigorúan monoton sökken. Ez azt jelenti, hogy van
Ebben az esetben tehát az
M
függvény megadja két permutá ió távol-
ságát, és az is eldönthet® általa, hogy két permutá ió relá ióban áll-e. Ez az állítás alkalmazható a fenti
2 és 3 részbenrendezésekre. Az i = 1;4 eset en-
nél bonyolultabb : itt sak a (9) feltétel teljesül, ennek megfelel®en az állítás is más, és a bizonyításhoz is plusz meggondolások kellenek. Nézzük meg, hogy a H-lépéshez milyen távolság tartozik. Sajnos a Hlépés nem megfordítható, azaz a hozzá tartozó gráf irányított lesz. Az egyik lehet®ség az, hogy elhagyjuk az irányítást, azaz olyan lépéseket is megengedünk, amikor a permutá ió egy xpontját tetsz®leges másik helyre elmozdítjuk. Ekkor összefügg®, irányítatlan gráfot kapunk, és vizsgálhatjuk az így keletkez® távolságot
Sn -en.
A másik lehet®ség, hogy minden olyan lépést megengedünk, amikor egy tetsz®leges elemet más helyre rakunk át, a közbens® elemeket el súsztatva. Ez az áthelyez®-lépés (Á-lépés) megfordítható, és éppen a deniálja :
ahol
s1
dU
Ulam távolságot
dU (; ) = MU ( 1 ) = n s1 ( 1 );
most is egy permutá ió leghosszabb monoton növ® részsorozatának
hosszát jelöli. Ez éppen a (10) egyenlet megfelel®je, igazolásához például könny¶ ellen®rizni, hogy a (10) után megfogalmazott feltételek teljesülnek. Az Ulam távolsághoz tartozó részbenrendezés szerint
U , ha -ból
elérhet® olyan Á-lépések sorozatával, melyek mindegyike növeli a leghosszabb növekv® részsorozat hosszát. Az 5.1. Tételt alkalmazva kapjuk, hogy
U
() s1( 1 ) = n + s1 () s1():
Végül megjegyezzük, hogy ahogy
3 a 2 inverze, úgy a H részbenren-
dezésnek is deniálható az inverze. Ehhez a H-lépés inverzét kell deniálni,
33
2 2 Sn permutá ió. Akkor hajtunk végre rajta H'-lépést, ha egy k =6 (k) nem-xpontot kiválasztva, ezt xponttá tesszük, azaz a k: helyre k -t írunk. Ezután, ha (k ) > k , akkor a permutá ió k; : : : ; (k ) 1 elemeihez egyet hozzáadunk, ha pedig (k ) < k , akkor a (k ) + 1; : : : ; k elemekb®l egyet kivonunk. Ha például = (251364), akkor k = 2-t választva a H'-lépés eredménye (321465), ha pedig k = 3, akkor az eredmény (153264).
azaz megnézni, hogy a
-n
ható H-lépés hogyan hat
1 -en.
Legyen
6. Pla kett-Lu e-féle modellek Ebben a szakaszban a Pla kett-Lu e modell, illetve vele rokon modellek paramétereinek maximum likelihood be slésével foglalkozunk. A Pla kettLu e modell megfelel®je páros összehasonlítások esetére a Bradley-Terry modell [9℄ : tegyük fel, hogy
n
objektumunk van, és egy meggyelés két
objektum összehasonlításából áll. Feltesszük, hogy minden
i
objektumhoz
i paraméter, mely az objektum értékét méri. Modellünk szerint annak valószín¶sége, hogy az i és j objektumok összehasonlításakor i nyer,
tartozik egy
P (i legy®zi j -t) =
i : i + j
Általában Pla kett-Lu e modellnek nevezhetjük azt az esetet, amikor minden meggyelés az
n
objektum valamely részhalmazának sorbarendezéséb®l áll,
és a sorrendek valószín¶ségei (7) alakúak. A Bradley-Terry modellnek számos egyéb általánosítása született. Agresti [2℄ modellje annyiban tér el az eredeti modellt®l, hogy a páros összehasonlítások kimenetele függ attól, hogy a két objektum közül melyik az els®, és melyik a második (pl. sportmérk®zéseknél az eredmény függ attól, hogy melyik sapat játszik otthon). Rao és Kupper [51℄ modelljében az összehasonlítások kimenetele döntetlen is lehet. Ezekben a modellekben a paraméterek maximum likelihood be slésére különböz® algoritmusokat adtak a szerz®k. Hunter [40℄ egységesen tárgyalja ezen modellek maximum likelihood be slését az MM algoritmus segítségével, és megadja, hogy milyen feltételek mellett konvergálnak az algoritmusok.
6. PLACKETT-LUCE-FÉLE MODELLEK
34
Huang et al. [39℄ további általánosítása az, hogy az objektumok két (vagy több) részhalmazát (pl. sapatok) hasonlítjuk össze. Ebbe a modellbe is beleférhet a döntetlen kimenetel, illetve a hazai pálya hatása. A szerz®k ebben a ikkben is MM algoritmusokat javasolnak a maximum likelihood be slés megtalálására, és bizonyos feltételek mellett konvergen iát bizonyítanak. A következ®kben azt mutatjuk meg, hogy ugyanezekre a modellekre az EM algoritmus is használható, mivel beleférnek a hiányos meggyelések keretébe. S®t, egyes esetekben kétféle természetes módon is deniálhatjuk a teljes meggyelést, így két különböz® EM algoritmust kapunk. Mi itt sak az algoritmusok kiszámítására szorítkozunk, konvergen iájukkal, konvergen ia sebességükkel nem foglalkozunk. Ennek részben az az oka, hogy a kapott algoritmusok formálisan nagyon hasonlítanak a már említett MM algoritmusokhoz, azaz implementá iójuk ugyanolyan bonyolultságú, viszont szimulá iós tapasztalataink szerint az EM algoritmusok az MM algoritmusoknál lassabban konvergálnak. Ezért az EM algoritmusoknak mindössze elméleti érdekessége van. Összesen tehát négy modellt vizsgálunk. Minden esetben
n objektumunk
van, a továbbiakban ezeket játékosoknak nevezzük. Mindegyik modellben ugyanazok a
i , i = 1; : : : ; n
paraméterek szerepelnek, ahol
i
az
i
játékos
képességét méri (jobb képességhez nagyobb paraméterérték tartozik), jelölje
= (1 ; : : : ; n )
ezt a paramétervektort. Feltesszük még, hogy
Két modellben ezeken kívül egy pozitív
P
i = 1.
paraméter is lesz. A meggyelések
minden esetben kett® vagy több játékos vagy sapat sorbarendezéseib®l állnak.
Pla kett-Lu e : halmaz
Egy
I
[n℄ halmazba es® játékosokat rakjuk sorba. Az I
sorrendjének valószín¶sége p( ) =
ahol
jI j Y
(k) ; PjI j k=1 j =k (j )
(1) az els® helyezett, (jI j) az utolsó helyezett.
(11)
35
Hazai pálya : Az i és j
játékosokat hasonlítjuk össze. A modell szerint
(
i =(i + j ) i =(i + j )
P (i legy®zi j -t) = ahol a
i van otthon, ha j van otthon, ha
> 0 paraméter a hazai pálya nyújtotta el®ny vagy hátrány er®sségét
fejezi ki.
Rao-Kupper : Itt az i és j
játékosok mérk®znek egymással, de a végeredmény
döntetlen is lehet. A valószín¶ségek :
P (i legy®zi j -t) = i =(i + j ); P (j legy®zi i-t) = j =(j + i ); P (i és j döntetlent játszik) = (2
1)i j =[(i + j )(j + i )℄;
> 1 az úgynevezett küszöb paraméter. Csapatmérk®zés : Az I és J sapatok mérk®znek egymással, ahol I; J és I \ J = ;. Ekkor ahol
P (I
legy®zi
P
i i2IP
J -t) = P
i2I i +
j 2J j
;
[n℄, (12)
azaz a valószín¶ségek olyan alakúak, mint a Bradley-Terry modellnél, ha egy
sapat képességét a játékosok képességeinek összege méri. A modelleket a következ®képpen fogalmazhatjuk meg exponen iális eloszlású valószín¶ségi változókkal.
6.1. Lemma. Legyenek a Zi (i = 1; : : : ; n) valószín¶ségi változók függetlenek, i paraméter¶ exponen iális eloszlásúak. Ekkor Q j P (Z(1) < : : : < Z(jI j) ) = jkI=1 PjIj k j j k ( )
=
( )
Pla kett-Lu e
i P (Zi < Zj =) = i + Hazai pálya, Rao-Kupper j P (Zj = < Zi < Zj ) = (i +(j )(1)ji+ji ) Rao-Kupper Pi2I i P (mini2I Zi < minj 2J Zj ) = Pi2I i +Pj2J j Csapatmérk®zés 2
A lemma egyszer¶en igazolható az exponen iális eloszlás örökifjúságából, illetve abból, hogy független exponen iális változók minimuma is exponen-
6. PLACKETT-LUCE-FÉLE MODELLEK
36
iális eloszlású. Látjuk tehát, hogy ha minden meggyelésre ismernénk a meggyelésben résztvev® játékosokhoz tartozó
Zi
változókat, és ezek értékei
alapján állítanánk fel a sorrendet, akkor a kívánt alakú valószín¶ségeket kapnánk. A hazai pálya és a Rao-Kupper esetben ez persze sak akkor igaz, ha
ismert. Ha ismeretlen, akkor a hazai pálya esetben könnyen megoldható a probléma, míg a Kupper-Rao modellben nem látszik ilyen egyszer¶en a megoldás. A Pla kett-Lu e és a sapatmérk®zés modellben más változókat is használhatunk teljes meggyelésként.
6.2. Lemma. Tegyük fel, hogy egy urnában az i = 1; : : : ; n egészekkel megszámozott golyók vannak. Visszatevéssel húzunk, egy húzásnál az igolyót i valószín¶séggel húzzuk ki. Pla kett-Lu e : Legyen I a sorbarendezend® játékosok halmaza. Addig húzunk, amíg mindegyik i 2 I golyó legalább egyszer kijött, és jelölje , hogy az I elemei milyen sorrendben jöttek ki. Ekkor valószín¶ségét éppen (11) adja meg. Csapatmérk®zés : Legyen I és J a két sapat. Addig húzunk, amíg el®ször I [ J -beli golyót húzunk. Ekkor annak valószín¶ségét, hogy I -beli golyó jön el®bb, éppen (12) jobb oldala adja meg. A bizonyítást, egyszer¶sége miatt, most sem részletezzük. Ha tehát minden meggyelésre ismernénk az urnából való húzások sorozatát, és a golyók megjelenési sorrendje alapján állítanánk fel a sorrendet, akkor a kívánt alakú valószín¶ségeket kapnánk. Miután deniáltuk a teljes és a hiányos meggyeléseket, kiszámíthatjuk az EM algoritmus egy iterá ióját. A számolást itt nem részletezzük, sak az eredményeket mondjuk ki.
6.1. Pla kett-Lu e
m meggyelésünk van, az r-edikben az Ir halmazba es® játékosok r sorrendjét gyeljük meg. Jelölje minden i 2 Ir -re r (i), hogy az i hányadik helyen áll a r sorrendben. Jelölje továbbá mi azon meggyelések számát, melyben az i játékos szerepel. Tegyük fel, hogy
6.2. Hazai pálya
37
Ekkor az exponen iális teljes meggyeléshez tartozó EM algoritmus paraméterfrissítésének képlete :
2
(it+1) = mi 4
r (i) X X
3 1
1
1 i n:
PjIr j (t) 5 r:i2Ir k=1 j =k r (j )
Hunter [40℄ MM algoritmusa hasonló, sak a számlálóból le kell vonni t, ahol
ui
azt mutatja, hogy hány sorrendben lett
pedig le kell vonni
u =(t) -t. i
i
i
ui -
az utolsó, a nevez®b®l
A húzássorozat teljes meggyeléshez tartozó
EM algoritmus paraméterfrissítésének képlete pedig :
2 m jIr j 1 ( t+1) ( t) 4X X i = mi + i PjIr j (t) r=1 k=1 j =k r (j )
r (i) X X
3
1
PjIr j (t) 5 ; r:i2Ir k=1 j =k r (j )
1 i n:
Ez a második EM algoritmus már kevésbé hasonlít Hunter algoritmusára, és tapasztalatunk szerint lassabb az el®z® EM algoritmusnál.
6.2. Hazai pálya
m meggyelésünk, jelölje most is mi az i játékos mérk®zéseinek számát. Jelölje mik , hogy hány mérk®zést játszott i és k úgy, hogy i volt otthon. Legyen még HVi az i által hazai pályán elvesztett me
sek száma, IVi pedig az i által idegenben elszenvedett vereségek száma. Az EM algoritLegyen most is
mus M lépése nem oldható meg expli it, de helyette használható a következ® kétlép s®s iterá ió (mellyel úgynevezett GEM algoritmust kapunk) :
(t+1) = P (it+1) = P
k6=i
m
(t)
mik i i6=k (t) (t) +(t) i k
+
mi mik (t+1) ( t +1) (it) +(kt)
+
mki (t+1) (kt) +(it)
P
n HV i i=1 (t)
+
;
HVi +IVi (it)
(13)
; 1 i n:
(14)
A Hunter által megadott MM algoritmus most is hasonló. Az ® algoritmusát úgy kapjuk, ha (13)-ban kivonjuk a számlálóból a
Pn i=1 HVi
mennyiséget,
6. PLACKETT-LUCE-FÉLE MODELLEK
38
a nevez®b®l pedig a
P
n i=1 HVi (t)
tagot, és (14)-ban kivonjuk a számlálóból a
HVi +IVi (it)
HVi + IVi mennyiséget, a nevez®b®l pedig a
tagot.
6.3. Rao-Kupper Ennél a modellnél feltesszük, hogy gyelésünk van, és
mi
az
i
ismert. Még mindig
m
meg-
által játszott mérk®zések száma. Jelölje még
Nik ; Vik ; Dik azt, hogy i hányszor nyert, veszített, illetve játszott döntetlent k ellen. Ekkor az EM algoritmus egy iterá iója : (it+1) = P Legyen
Vi -t,
Vi =
P
k6=i Vik
nevez®jéb®l
k6=i az
Nik +Dik (it) +(kt)
+
(Vik +Dik ) (kt) +(it)
+
Vik (it)
;
1 i n:
i vereségeinek száma. Ha a fenti képlet számlálójából
V =(t) -t i
mi
i
kivonunk, akkor megkapjuk Hunter MM algorit-
musát.
6.4. Csapatmérk®zés
Ir játékoshalmaz az Ir1 ; Ir2 disz1 2 junkt sapatokra bomlik (r = 1; : : : ; m). Tegyük fel, hogy Ir és Ir dr darab Pm mérk®zést játszik egymással, tehát összesen r=1 dr meggyelésünk van. Minden i 2 Ir -re jelölje Nr (i) (Vr (i)) azt, hogy az Ir -beli sapatfelállásban P hányszor nyer (veszít) az i játékos sapata. Legyen még qr (i) = j 2Ir j , ahol Ir az Ir1 ; Ir2 sapatok közül azt jelöli, amelyikben i benne van. qr (i) tehát az Ir P
sapatfelállásban i sapatának összképessége. Továbbá legyen qr = j 2Ir j . Ismét mi jelöli az i által játszott mérk®zések számát. Ekkor az exponen iális Most ki sit más jelöléseket használunk : az
teljes meggyeléseken alapuló EM algoritmus egy iterá iója :
(it+1) = P
dr r: i2Ir qr(t)
+
mi (t) (t) Vr (i) + Nr (i) qr q((it)) (i) i r
1
; 1 i n:
(it)
A húzássorozatok teljes meggyelésen alapuló EM algoritmus paraméter-
39
frissítése pedig
(
)
Nr (i) X dr (t) + (it+1) = ( t) ( t) i ; 1 i n: r: i2Ir qr (i) r: i62Ir qr X
Érdekes, hogy ebben az esetben ez az EM algoritmus hasonlít inkább a Huang, Weng és Lin által adott MM algoritmushoz, melyben az iterá ió
i(t+1) =
Nr (i) (t) r: i2Ir qr (i) X
!
dr (t) r: i2Ir qr X
! 1
(it) ; 1 i n
alakú.
7. Rendezett minta modell Ebben a szakaszban azt a kérdést vizsgáljuk, hogy ha a rendezett minta
Xi (1 i n) valószín¶ségi változók akkor hogyan lehet az Fi eloszlásfügg-
modellben sak azt tesszük fel, hogy az
Fi
eloszlásai függetlenek egymástól,
vényeket a
1 ; : : : ; m
mintából be sülni. Erre a kérdésre egyáltalán nin s
kielégít® válaszunk, mindössze egy próbálkozást szeretnénk itt bemutatni. Az ötlet az, hogy megint az EM algoritmust használjuk. Az egyszer¶ség kedvéért tegyük fel, hogy az
Xi
valószín¶ségi változók mindegyike sak véges
sok értéket vehet fel. Ha azt akarjuk, hogy mindig permutá ió keletkezzék, fel kell tennünk, hogy a tartók diszjunktak. Ha
Xi
tartója
Ti , akkor mindig
feltehet®, hogy
Ti = fsij = j + i=n : j = 1; : : : ; J g; i = 1; : : : ; n; azzal a plusz feltétellel, hogy a tartók egyes pontjai nulla valószín¶ség¶ek is lehetnek. Legyen tehát
p(i; j ) = P (Xi = sij ),
feladatunk ezen paraméterek
maximum likelihood be slése. Legyen a teljes minta
r mg. Ekkor
fXi;r : 1 i n; 1
7. RENDEZETT MINTA MODELL
40
Q(p; p ) = Ezt a kifejezést
J n X X i=1 j =1
log p(i; j )
m X r=1
P (Xi;r = sij jr ; p ):
p-ben maximalizálva kapjuk az iterá iós lépést : p(t+1) (i; j ) =
m 1X P (Xi;r = sij jr ; p(t) ): m r=1
P (Xi = sij j ) feltételes valószín¶ség, adott p paraméterek mellett. Ehhez nyilván elég a P (Xi = sij ; ) valószín¶Nézzük meg, hogyan számítható ki a
ségeket kiszámolni.
P (Xi = sij ; ) = A ( 1 (i); j )p(i; j )B ( 1 (i); j ); ahol
A (k; j ) = annak valószín¶sége, hogy
X
k 1 Y
(j1 ;:::;jk 1 )2J (k;;j ) `=1
p( (`); j` )
X(1) < : : : < X(k 1) < s(k)j . Ennek megfelel®en
J (k; ; j ) = f(j1 ; : : : ; jk
1 ) : s(1)j1 < : : : < s(k 1)jk
1
< s(k)j g:
B (k; j ), ami annak valószín¶sége, hogy s(k)j < < X(k+1) < : : : < X(n) : Adott mellett az A ; B mátrixok rekurzíHasonlóan írható fel
van kitölthet®k (lásd a következ® oldalt). Így az EM algoritmus könnyen programozható és gyorsan fut. Azonban nem várható, hogy globális maximumhoz konvergáljon, mivel számos lokális széls®értékhely lehet. Érdemes lenne az elkövetkez®kben ezzel a feladattal alaposabban foglalkozni.
41
Algoritmus A kitöltésére : Ini ializá ió : legyen
A (1; j ) = 1 (1 j J ) és A (k;0) = 0 (1 k n).
Rekurzió :
` = 3 to J + n for k = max(2; ` J ) to min(n; ` 1) if (k ) < (k 1) : A (k; ` k) = A (k; ` k 1)+ A (k 1; ` k 1)p( (k 1); ` k 1) for
else :
A (k; ` k) = A (k; ` k
1) + A (k
1; ` k ) p( ( k
1); ` k).
Algoritmus B kitöltésére : Ini ializá ió : legyen
B (n; j ) = 1 (1 j J ) és B (k; J + 1) = 0 (1 k n).
Rekurzió :
` = J + n 1 downto 2 for k = max(1; ` J ) to min(n 1; ` 1) if (k ) > (k + 1) : B (k; ` k) = B (k; ` k +1)+ B(k +1; ` k +1)p( (k +1); ` k +1) for
else :
B (k; ` k) = B (k; ` k + 1) + B (k + 1; ` k)p( (k + 1); ` k).
8. L-FELBONTHATÓSÁG
42
III. rész
Feltételes függetlenség és hierar hikus modellek 8. L-felbonthatóság Legyen
v = (v (1); : : : ; v (s))
egy vektor, melynek koordinátáit az olvas-
hatóság kedvéért most nem alsó indexekkel jelöljük. Az
i:-t®l a j:-ig terjed®
koordináták halmazát illetve vektorát jelölje
v fi::j g = fv (i); : : : ; v (j )g; v (i::j ) = (v (i); : : : ; v (j )); 1 i j s:
(15)
Sn (n 1) az n-edfokú szimmetrikus soportot, ennek elemei a = ( (1); : : : ; (n)) permutá iók. Egy Sn -en adott valószín¶ségeloszlást jelöljön p = fp( ) : 2 Sn g, és legyen = ((1); : : : ; (n)) p eloszlású valószín¶ségi változó, azaz P ( = ) = p( ). Jelölje
Mint a bevezetésben már említettük, az L-felbonthatóságot, mint tulajdonságot, Crit hlow et al. [15℄ vezette be. Az L Lu e nevére utal, hiszen látni fogjuk, hogy pontosan azok az eloszlások L-felbonthatóak, melyek eleget tesznek Lu e sorbarendezési posztulátumának, azaz (6) alakúak. Deniáljuk tehát az L-felbonthatóságot ! Rögtön négy különböz® ekvivalens dení iót is adunk.
8.1. Dení ió. (Crit hlow et al. [15℄) Legyen véletlen permutá ió, eloszlása pedig p. vagy p L-felbontható, ha a következ® négy ekvivalens feltétel teljesül. 1. Minden 1 k n 1 és fx1 ; : : : ; xk ; y g [n℄ mellett az
f (y jx1; : : : ; xk ) = P ((k + 1) = y j (1) = x1 ; : : : ; (k) = xk ) (esetleg nem deniált) függvény szimmetrikus az x1 ; : : : ; xk argumentumokban.
43
2. Minden 1 k n
1 és fx1 ; : : : ; xk ; y g [n℄ mellett a fenti f -re
f (y jx1 ; : : : ; xk ) = P ((k + 1) = y j f1::kg = fx1 ; : : : ; xk g) : 3. A Zk = f1::kg, k = 1; : : : ; n véletlen halmazok (mint diszkrét valószín¶ségi változók) Markov lán ot alkotnak. 4. Megadható olyan nemnegatív függvény az
(x; C ) : C f1; : : : ; ng; x 62 C
(16)
párokon, mellyel
p( ) = Bizonyítás.
nY1 k=0
( (k + 1); f1::kg)
8 2 Sn:
(17)
Azt bizonyítjuk, hogy a fenti négy dení ió valóban ekvi-
valens. 2. és 3. nyilvánvalóan sak egymás átfogalmazása. Legyen ugya-
zi = fx1 ; : : : ; xi g, ha 1 i k, és zk+1 = fx1 ; : : : ; xk ; y g. Ekkor f (y jx1; : : : ; xk ) = P (Zk+1 = zk+1 jZ1 = z1 ; : : : ; Zk = zk ), míg P ((k + 1) = = y j f1::kg = fx1 ; : : : ; xk g) = P (Zk+1 = zk+1 jZk = zk ). Azaz 2. éppen a nis
Markov tulajdonságot fejezi ki. Az is nyilvánvaló, hogy 2.-b®l következik 1. Fordítva pedig azt használjuk,
[i Bi diszjunkt felbontás, és egy A eseményre P (AjBi) i-t®l független konstans, akkor P (AjB ) = P (AjBi ).
hogy ha
B =
1.-b®l triviálisan következik 4. Nevezzük ugyanis a 4.-ben szerepl® vényt
p
függ-
L-felbontásának. Ha 1. teljesül, akkor egy kitüntetett, úgynevezett
kanonikus L-felbontást kapunk a
(x; C ) = P ((jC j + 1) = x j f1::jC jg = C ); ha a feltétel valószín¶sége pozitív, egyébként pedig
(x; C ) = 0
(18)
függvény
formájában. Végül belátjuk, hogy 4.-b®l következik 1. Megjegyezzük, hogy ez szerepel Crit hlow et al. [15℄ ikkében. Legyen megint
zi = fx1 ; : : : ; xi g, zk+1 = zk [
8. L-FELBONTHATÓSÁG
44
[ y, valamint [n℄ n zk+1 elemeinek egy tetsz®leges felsorolása l1 ; : : : ; ln
ln
k
= y . Ekkor 4. felhasználásával P
k 1,
és
Qn 1 :(1::k)=x(1::k) ;(k+1)=y t=0 ( (t + 1); 1::t ) f (y x1 ; : : : ; xk ) = = Qn 1 P :(1::k)=x(1::k) t=0 ( (t + 1); 1::t ) Qk 1 P Qn k 2 t=0 (xt+1 ; zt )(y; zk )(k + 1)! 2Sn k 1 t=0 (l(t+1) ; zk+1 lf1::tg ) = P Qk 1 Qn k 1 t=0 (xt+1 ; zt )k ! 2Sn k t=0 (l(t+1) ; zk lf1::tg ) P Qn k 2 2Sn k 1 t=0 (l(t+1) ; zk+1 lf1::tg ) (k + 1)(y; zk ) P ; Qn k 1 2Sn k t=0 (l(t+1) ; zk lf1::tg )
j
[
f g f g [ [
ez pedig valóban sak a
zk
halmaztól függ,
x1 ; : : : ; xk
[
sorrendjét®l nem.
Ahogy már említettük, az L-felbonthatóság ekvivalens Lu e sorbarendezési posztulátumával, hiszen a (6) és a (17) egyenletek ugyanazt fejezik ki. Másrészt, a
Zk = f1::kg
halmazok markovitása szerint, ha ismerjük a
f1::kg jelenlegi állapotot, akkor a múltbeli állapotokat deniáló (1::k) és a jöv®beli állapotokat deniáló (k + 1::n) értékek már függetlenek egymástól, azaz a korábban használt jelöléssel [k ℄ ? [k ℄ j ;. Világos, hogy az L-felbonthatóságot gyengíthetjük úgy, hogy a [k ℄ ? [k ℄ j ; relá iót sak bizonyos k -kra követeljük meg. 8.2. Dení ió. Legyen véletlen permutá ió, eloszlása p. vagy p felbontható k-nál, ha [k℄ ? [k℄ j ;.
p akkor és sak akkor L-felbontható, ha minden k-nál felbontható. Minden K [n℄ esetén tekinthetjük a K -beli k -knál felbonthaEzzel a dení ióval
tó eloszlások
LK
saládját. Az ilyen saládokat korlátozottan L-felbontható
modelleknek hívjuk. Ha
K = fk1 < : : : < kj g, akkor a modellt a
P ((ki + 1::ki+1 ) = xjf1::ki g = C ) valószín¶ségek paraméterezik, ahol
x; C; i
x
most megfelel® hosszúságú vektor, és
minden lehetséges értéket befut (
i = 0-t
is megengedve). Az egyes
permutá iók valószín¶ségei ilyen feltételes valószín¶ségek szorzataként állnak el®.
8.1. Markov bázis
45
Még ennél is általánosabb felbonthatóságokat is deniálhatnánk, például
U halmazrendszerre tekinthetnénk azt az LU saládot, melynek elemeire U ? U j ; minden U 2 U -ra. Mivel ilyen bonyolult modellek alkal-
valamilyen
mazását a gyakorlati megfontolások úgysem támogatnák, ezzel a kérdéssel nem foglalkozunk. (Illetve valamilyen formában kés®bb felbukkannak majd ilyen modellek.)
8.1. Markov bázis
L
Jelölje a továbbiakban
saládját. Itt
n
az összes
Sn -en
mindig egy tetsz®leges rögzített pozitív egész szám. A 8.1.
Dení ióból látszik, hogy igazából sak az
n
3 esetén minden eloszlás L-felbontható, így
n 4 esetek érdekesek.
A (17) felírásból könnyen látszik, hogy ható olyan
ML
mátrix, mellyel
(x; C ) párok számát, azaz
an = Az
ML
adott L-felbontható eloszlás
L
L = F( M L ) .
n 1 X n
k k=0
(n
egy torikus modell, azaz találJelölje
an
a (16)-ban szerepl®
k) = n2n 1 :
an n! lesz, oszlopait indexeljük a 2 Sn permutáindexeljük az (x; C ) párokkal, és legyen az (x; C ): sor és :
mátrix mérete
iókkal, sorait
oszlop találkozásában álló elem
ML ((x; C ); ) = f f1::jC jg = C; (jC j + 1) = xg; ahol
az indikátor függvény.
Mivel az L-felbonthatóságot bizonyos feltételes valószín¶ségek egyenl®ségével deniáltuk, az
L salád zárt. Azaz a 2.2. Tétel szerint egy p eloszlás
IML ideált generáló polinomokat. Ezeket fogjuk most megkeresni. Legyen 2 k n 2, és a 11 és 22 permutá iókra teljesüljön 11 f1::k g = 22 f1::k g, 11 (1::k ) 6= 22 (1::k ),
akkor és sak akkor L-felbontható, ha zérussá teszi az
8. L-FELBONTHATÓSÁG
46
és
11 (k + 1::n) 6= 22 (k + 1::n). Deniáljuk a keresztezett (
12 (i) =
(
21 (i) =
11 (i) 22 (i) 22 (i) 11 (i)
ha ha ha ha
permutá iókat :
ik i>k ik i>k
Minden ilyen választásra készítsünk el egy polinomot :
x x 11
22
Ezek a polinomok nyilvánvalóan
x x : 12
(19)
21
IML -hez
tartoznak. Érvényes továbbá a
következ®.
8.3. Lemma. A p eloszlás akkor és sak akkor L-felbontható, ha p zérushelye minden (19)-beli polinomnak. Bizonyítás.
Csak az egyik irányt kell bizonyítani : tegyük fel, hogy
p
p kielégíti az x1 ; : : : ; xk
zérushelye minden (19)-beli polinomnak. Megmutatjuk, hogy
x; x0
a 8.1. Dení ió els® feltételét. Legyen
két permutá iója
elemeknek. A feltételben szerepl® feltételes valószín¶ségeket kiírva, azt kell megmutatni, hogy
X ahol
p(x; y; )
X
p(x0 ; ) =
X
p(x0 ; y; )
X
p(x; );
(20)
fx1 ; : : : ; xk ; yg halmaz komplementerének permutá ióit futja be, az fx1 ; : : : ; xk g halmaz komplementerének permutá ióit futja be.
az
pedig
Feltettük azonban, hogy minden
; -ra
p(x; y; )p(x0; ) p(x0 ; y; )p(x; ) = 0; így (20) teljesül.
Azt is megmutatjuk, hogy a (19)-beli polinomok generálják az
IML ideált. Ez
egyébként nem következik minden további nélkül a 8.3. Lemmából, mivel az
8.1. Markov bázis
XM nemnegatív
47
torikus varietás esetleg az
IM
bázisánál sz¶kebb egyenlet-
rendszerrel is jellemezhet®.
8.4. Tétel. A (19) polinomok generálják az IML ideált. Bizonyítás.
A 2.5. Tételt fogjuk használni, azaz megmutatjuk, hogy a (19)-
beli polinomokhoz tartozó
fi
függvények Markov bázist alkotnak. Legyen
indexhalmazunk
I = fi = i(C; 1; 2; 1 ; 2) : C [n℄; 2 jC j n 2; 1 ; 2 2 SC ; 1 = 6 2 ; 1 ; 2 2 S[n℄nC ; 1 =6 2g; SC a C -beli elemek permutá ióinak legyen fi : Sn ! Z a következ® függvény : ahol
halmazát jelöli. Ha
i
2 I , akkor
fi (1 ; 1 ) = fi (2 ; 2 ) = 1; fi (1 ; 2 ) = fi (2 ; 1 ) = 1; fi ( ) = 0 egyébként:
(21)
ML fi = 0 minden i-re, tehát sak a lán irredu ibilitását kell n! két gyakoriságvektor, melyekre M u = M v . igazolni. Legyen u; v 2 N L L Megkonstruálunk egy u-ból v -be vezet®, fi lépéseket használó utat. Ha a j = (j1 ; : : : ; jk ) vektor elemei [n℄-beliek és mind különböznek, akkor jelölje Bj Sn a j-vel kezd®d® Sn -beli permutá iók halmazát, azaz azokat a -ket, P melyekre (s) = js ha 1 s k . Vezessük be az u(Bj ) = 2B u( ) egyszer¶sít® jelölést. Vegyük észre, hogy u(Bj ) = v (Bj ) minden j -re, hiszen u(Bj ) = (ML u)(j; ;), és err®l feltettük, hogy u-ra és v -re megegyezik. Tegyük fel induk ióval, hogy az fi lépések segítségével u-ból már eljutottunk egy k k olyan u gyakoriságvektorhoz, melyre u (Bj ) = v (Bj ) minden legfeljebb k
Világos, hogy
j
hosszúságú
j vektorra.
k elem¶ részhalmaza [n℄-nek, és készítsük el uk -ra és v -re külön-külön azt a k! (n k) méret¶ kontingen iatáblát, melynek sorait SC elemeivel indexeljük, oszlopait pedig [n℄ n C elemeivel. A (j; x): ellába k k pedig írjuk be az u (Bj;x ) illetve a v (Bj;x ) értéket. Az u - és a v -táblának Legyen most
C
egy
azonosak a marginálisai : a sorösszegek az induk iós feltevés miatt egyeznek
8. L-FELBONTHATÓSÁG
48
meg, az oszlopösszegek pedig az
(ML uk )(x; C ) = (ML v )(x; C )
összefüggés
miatt. Ismert (pl. Dia onis és Sturmfels [32℄), hogy a rögzített marginálisú kétdimenziós kontingen iatáblák esetén a
lépések Markov bázist alkot-
1 6= 2 választáshoz tartozik egy ilyen lépés : kivonunk egyet a tábla (r1 ; 1 ) és (r2 ; 2 ) elláiból, és hozzáadunk egyet az (r1 ; 2 ) és (r2 ; 1 ) ellákhoz. Ilyen lépésekkel tehát az uk -tábla átvihet® a v -táblába. Ezeket a lépéseket végrehajthatjuk az fi függvényekkel : ha a 0 0 kontingen iatábla-lépés a j és j sorokon, és az x, x oszlopokon hat, ahol uk (Bj;x) > 0 és uk (Bj0 ;x0 ) > 0 (azaz a lépés megléphet®), akkor léteznek az [n℄ n (C [ x) illetve [n℄ n (C [ x0) halmazoknak g illetve g0 permutá iói, melyekre uk (j; x; g) > 0 és uk (j0 ; x0 ; g0) > 0. Az i = i(C; j; j0 ; (x; g); (x0 ; g0 )) választással az fi lépés éppen a kívánt kontingen iatábla-lépést eredményezi. Ha egymás után minden k elem¶ C halmazra egymásba alakítjuk a kontingen iatáblákat, k+1 gyakoriságvektorhoz. Végül un = v . eljutunk a következ® u nak. Minden
r1 = 6 r2
+
+
és
Itt jegyezzük meg, hogy
Sn
elemei megfeleltethet®k az
n-dimenziós
egységko ka, mint irányított gráf, maximális útjainak. A ko ka minden sú sa egy
n hosszú 0-1 vektor, és akkor vezet él v -b®l v 0 -be, ha v 0 úgy kapható
v -b®l, hogy egy 0 koordinátát 1-re serélünk. Így minden permutá ió a gráf egy
0-ból 1-be
vezet® irányított útjának felel meg :
0-ból
indulva sorra 1-re
(1):, (2):, stb. koordinátákat. 0 Legyen p (17) alakú L-felbontható eloszlás, és (v; v ) a ko kagráf egy 0 éle. Ha C jelöli v 1-koordinátáinak halmazát, és v -t az x: koordináta 10 re serélésével kaptuk, akkor írjuk a (v; v ) élre a (x; C ) paramétert. Így a permutá ió p( ) valószín¶sége az általa bejárt élekre írt paraméterek
seréljük a
szorzata. Vegyük észre, hogy a 8.4. Tétel fenti bizonyítása általánosabb esetben is
G irányított gráfban nin s irányított kör, és egyetlen F forrás és egyetlen N nyel® van benne. Álljon az eseménytér az F b®l N -be vezet® utakból. Ezen a téren tekintsük azt a torikus modellt, ahol m¶ködik. Tegyük fel, hogy egy
egy út valószín¶sége az általa bejárt élekhez rendelt nemnegatív paraméterek szorzata. A modellhez tartozó
IG
ideált az átkeresztezett utak generálják,
8.1. Markov bázis
49
12345 1235
2. ábra. Az
vagyis az olyan
1234
2345
123
234
12
13
23
1
2
3
S5 egy 16 elem¶ részhalmazának gráfja (8.5. Példa)
x s xs 11
22
xs xs 12
21
polinomok, ahol az
s11 , s22
utak valahol
találkoznak, és ebben a találkozási pontban átkeresztezve ®ket az
s12 , s21
utakat kapjuk. A bizonyításban arra kell sak gyelni, hogy a sú sokat az
F -b®l hozzájuk vezet® utak maximális hossza szerint vegyük sorra. Ebb®l az észrevételb®l következik, hogy az
LK
(szintén zárt torikus) mo-
dell Markov bázisa azokból a (19)-beli polinomokból áll (illetve az ezekhez tartozó függvényekb®l), melyeknél a szerepl® permutá iók keresztez®dnek át. Hiszen az
LK -beli
K -beli
eloszlásokra is igaz, hogy egy
helyen
per-
mutá ió valószín¶sége egy megfelel® gráf éleire írt paraméterek szorzata. Annyi sak a különbség, hogy ebben a gráfban többszörös élek is vannak, de ez nem okoz semmilyen gondot. Megjegyezzük még, hogy a salád szabad paramétereinek száma ebben az esetben is könnyen kiszámolható.
8.5. Példa.
Tekintsük például az
S5 ko kagráfjának a 2. ábrán látható rész-
gráfját ! A gráfot úgy rajzoltuk le, hogy minden él alulról felfelé legyen irányítva, ezért az irányítást nem is jelöltük külön. A sú sok mellé az halmazát írtuk : a legalsó sú s a
0,
a legfels® az
1.
A
1-koordináták
0-ból 1-be
vezet®
= (32451) permutá iónak felel meg. A gráfban 16 alulról felfelé irányított út van, ezek 16 permutá iónak felel-
legjobboldalibb út a
nek meg. A 2. táblázatban találjuk ezeket a permutá iókat, valamint azokat
8. L-FELBONTHATÓSÁG
50
2. táblázat. Az
u és v gyakoriságvektorok összekötése a Markov bázis elemeivel (8.5. Példa)
12345 12354 13245 13254 21345 21354 23145 23154 31245 31254 32145 32154 23415 23451 32415 32451 az
u
és
v
u
f2;3g f2;3;4g f1;2;3g f1;2;3g f1;2;3g 1 +1 +1 3 1 +3 1 +1 +1 +1 1 +3 3 1
4 2 5 1 4 2 1 4 0 6 4 3 2 5 1 4 1 +1
v
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
+1 1 1 +1
gyakoriságvektorokat, melyeket a 8.4. Tételben szerepl® Markov
bázis elemeivel össze szeretnénk kötni. A táblázatban már maga az összekötés is szerepel, nézzük meg, hogyan is adódnak a lépések ! A 8.4. Tétel bizonyításában leírtak szerint sorra vesszük a gráf sú sait, elemszám szerint növekv® sorrendben. Az els® olyan sú s, melyhez nemtriviális kontingen ia-táblázat tartozik (azaz a sorok és oszlopok száma is legalább kett®), a
f2;3g sú s. A megfelel® 2 2-es u-kontingen iatábla : 1 4 23 5 7 32 7 5
mivel
u-ban
pl.
5
darab
231-gyel
kezd®d® permutá ió van. A megfelel®
kontingen iatábla minden ellájában
6
kezd®d® permutá iók gyakoriságaihoz
van. Ezért a
1-et
231-gyel
324-gyel 234-gyel és
és a
kell hozzáadni, a
v-
8.1. Markov bázis
321-gyel
51
kezd®d®ek gyakoriságából pedig
1-et
ki kell vonni. Báziselemeink
segítségével ezt most négyféleképpen tehetnénk meg, hiszen ennyiféleképpen választhatunk ki egy-egy
f1;2;3g-ból illetve f2;3;4g-b®l f1;2;3;4;5g-be vezet®
utat. Válasszuk mondjuk a
u
45
és
51
utakat ! A bázislépést a 2. táblázat
utáni els® oszlopa mutatja. Ezután a
szintén egy
2 2-es
f2;3;4g sú sot vehetjük, melyhez
kontingen iatáblázat tartozik, és ezt is egy lépéssel a
kívánt táblába transzformálhatjuk. Végül az
f1;2;3g sú s következik, 6 2-es
kontingen iatáblákkal. Itt már több transzformá iós lépésre van szükség.
A (21)-beli
fi
Markov bázis lépéseit a klasszikus Metropolis algoritmus
szerint módosíthatjuk úgy, hogy az
Fu
állapottéren hipergeometrikus sta-
ionárius eloszlású, irredu ibilis, aperiodikus, megfordítható Markov lán ot kapjunk. Ehhez egy adott
u
állapothoz válasszuk
i
2 I -t egyenletesen, és
= 1, 1=2 valószín¶séggel, i-t®l függetlenül. Ha u0 = u + fi 0 negatív, akkor lépjünk u -be
legyen
u( )! ;1 min u0 ( )! 2Ci Y
valószín¶séggel, ahol
Ci
Sn
nem-
!
azokat a permutá iókat jelöli, melyekre
fi ( )6=0. Minden más esetben maradjunk u-ban. Ez az algoritmus nagy n esetén is könnyen futtatható, anélkül, hogy a báziselemeket memóriában
I halmazból úgy választhatunk ki egy elemet, ha el®ször választunk egy 2 k n 2 számot, majd egy k elemszámú C részhalmazt, majd C két 1 , 2 sorbarendezését, és [n℄ n C két 1 ; 2 sorbarendezését. Ahhoz, hogy a választott elem egyenletes eloszlású legyen I -n, a k elemszámot kellene tárolni. A
válasszuk a
[k! 1℄[(n k)! 1℄ kifejezéssel arányos valószín¶séggel, az összes
többi választás pedig legyen egyenletes. Egy másik algoritmus (Dia onis és Sturmfels [32℄, Lemma 2.2), amely hosszabb lépéseket tesz, a következ®. Legyen ismét
fi a Markov bázis véletlen-
u pedig a lán jelenlegi állapota. Határozzuk meg azon egész j értékek halmazát, melyekre u + jfi 0, és lépjünk át egy ilyen szer¶en választott eleme,
8. L-FELBONTHATÓSÁG
52
u + jfi állapotba a
1 (u( ) + jfi ( ))! 2Ci Y
mennyiséggel arányos valószín¶séggel, ahol
Ci
ugyanaz, mint az el®bb. Ez a
Markov lán is irredu ibilis, aperiodikus, megfordítható, és hipergeometrikus sta ionárius eloszlású. Szeren sére ebben a konkrét esetben ez a lán is könnyedén üzemeltethet® : ha választásunk az
i = i(C; 1 ; 2 ; 1 ; 2 )
index¶
báziselemre esett, akkor a
a = u(1 ; 1 ) b = u(1 ; 2 )
= u(2 ; 1 ) d = u(2 ; 2 ) kontingen iatáblát egy ugyanilyen sor- és oszlopösszegekkel rendelkez® nemnegatív táblával kell helyettesítenünk, melyet a hipergeometrikus eloszlás szerint kell kiválasztanunk. Ezt megtehetjük például úgy, hogy egyenletes
0 2 Sa+b+ +d permutá iót, és a-t = jf1 k a + b : 1 0 (k) a + gj értékkel helyettesítjük. eloszlás szerint generálunk egy
az
a0 =
A szakasz végén megemlítjük, hogy elméleti szempontból lehet jelent®sége annak, hogy egy Markov bázis minimális-e, illetve hogy hány minimális
fi függvényekb®l álló Markov bázist akkor nevezünk minimálisnak, ha bármelyik fi elemet elhagyva, a maradék függvények már
Markov bázis van. Egy
nem alkotnak Markov bázist. Minimális Markov bázisokat vizsgált például Takemura és Aoki [57℄.
8.6. Tétel. Az n = 4 és n = 5 esetben az L modell minimális Markov bázisa egyértelm¶, és megegyezik a (21) képletben szerepl® bázissal. Ha n 6, akkor a (21) képlet bázisa nem minimális, és a minimális Markov bázis nem egyértelm¶.
n = 4 vagy 5 eset : Azt kell megmutatni, hogy a megadott bázis minimális. Legyen fi az i = i(C; 1 ; 2 ; 1 ; 2 ) indexhez tartozó báziselem, és legyen u és v két gyakoriságvektor : Bizonyítás.
Az
u(1 ; 1 ) = u(2 ; 2 ) = 1; u( ) = 0 egyébként; v (1 ; 2 ) = v (2 ; 1 ) = 1; v ( ) = 0 egyébként:
8.2. Paraméterbe slés
53
Világos, hogy ezt a két gyakoriságvektort sak az
fi
lépéssel lehet összeköt-
ni, hiszen nin s is rajtuk kívül más gyakoriságvektor, mely ugyanezekkel az
fi nem hagyható el a bázisból. Az n 6 eset : Legyen i, u és v ugyanaz, mint az el®bb, és jC j = k . Az el®z® esethez képest annyi a különbség, hogy a (1 ; 1 ) és a (2 ; 2 ) permutá iókkal el®fordulhat, hogy nem sak a 0: és a k: elem után válnak szét. Például n = 6-ra az (123456) és a (214365) permutá iók a 0:; 2:; 4: elemek után válh 1 gyakoriságvektor nak szét. Általában, ha a szétválások száma h, akkor 2 rendelkezik ugyanazokkal az elégséges statisztikákkal, mint u (és persze v ). elégséges statisztikákkal rendelkezne. Azaz
Egy minimális Markov bázis lépései ezeket a gyakoriságvektorokat egy fává kap solják össze. Ezt a fát pedig az eredeti báziselemekb®l többféleképpen kiválaszthatjuk. Az el®z® példát tekintve, az
i = i(f1;2g; 12; 21; 3456; 4365)
indexhez tartozó lépést elhagyhatjuk, mert ez a lépés helyettesíthet® az
i1 = i(f1;2;3;4g; 1234; 2143; 56; 65); i2 = i(f1;2g; 12; 21; 3465; 4356); i3 = i(f1;2;3;4g; 1243; 2134; 56; 65) indexekhez tartozó három lépéssel.
Tehát az egyértelm¶ minimális Markov bázis pedig
270 elem¶.
n = 4-re 6 elem¶, n = 5-re
8.2. Paraméterbe slés Ebben a szakaszban az L-felbontható eloszlás salád paramétereinek maximum likelihood (ML) be slésével foglalkozunk. Legyen a (18) kanonikus felbontású
p
1 ; : : : ; m
iid minta
L-felbontható eloszlásból. Jelölje a minta
(f ( ) : 2 Sn ). Legyen (x; C ) a ko ka élgráfjának egy P éle, és legyen gf (x; C ) = ff () : (x; C ) 2 g, ahol (x; C ) 2 azt jelenti, hogy átmegy az (x; C ) élen. Vezessük még be a gyakoriságvektorát
h f (C ) =
X x62C
gf (x; C ) =
X y2C
gf (y; C n y )
8. L-FELBONTHATÓSÁG
54
jelölést a
L
C
sú son átmen® mintabeli utak (permutá iók) számára. Az
saládot a (18)-beli kanonikus L-felbontás paraméterezi, azaz a szabad
paraméterek száma
bn = Az
L
n X n
k k=2
(k
1) = 2n(n=2 1) + 1:
modellben a paraméterek jól interpretálhatóak : feltételes valószín¶-
ségeket jelentenek. A paraméterek maximum likelihood be slése pedig éppen a mintából számolt megfelel® tapasztalati feltételes valószín¶ség, azaz a
(x; C )
kanonikus paraméter maximum likelihood be slése
gf (x; C )=hf (C ).
Ha a mintánkban található összes permutá ió útját pirossal kihúzzuk a gráfon, akkor a maximum likelihood be slésként kapott eloszlás pontosan azokhoz a permutá iókhoz rendel pozitív valószín¶séget, melyek sak piros
ML -megvalósítható halmaz, mely a mintabeli permutá iókat tartalmazza). Az eloszlás p ^f ML be slése tehát :
éleken mennek át (ez a legsz¶kebb olyan
p^f ( ) =
nY1 gf ( (k + 1); k=0
f1::kg) : hf ( f1::kg)
(22)
Ebben az esetben a ML be slés pontos eloszlása kiszámítható. Annak valószín¶sége ugyanis, hogy a minta gyakoriságvektora éppen
P (f ) = Q
P (^pf = p^) = P (gf = g ) = H (g )
H (g ) = H (g )
legyen :
N! Y (x; C )gf (x;C ) : f ( )! (x;C )
Ebb®l pedig annak valószín¶sége, hogy a ML be slés pont
ahol
f
X
N!
Q f ( )! f :gf =g
azt mondja meg, hogy hány olyan
=
Y
(x;C )
(x; C )g(x;C ) ;
X 1 ;:::;m :gf =g
m
p^ legyen :
1:
elem¶ minta van, amely a
elégséges statisztikát produkálja. Felhasználtuk továbbá, hogy
p^ és g
g
között
8.2. Paraméterbe slés
55
köl sönösen egyértelm¶ megfeleltetés van.
8.7. Lemma.
H (g ) =
h(C )! : g ( x; C )! x 2 6 C C [n℄ Y
Q
1 ; : : : ; m minta van, melynek elégséges statisztikája g , azaz minden (x; C ) párra g (x; C ) darab 1 i m indexre teljesül, hogy if1::jC jg = C és i(jC j +1) = x. A következ® Bizonyítás.
Meg kell számolnunk, hogy hány olyan
eljárás az összes ilyen mintát el®állítja (egyszeres multipli itással). El®ször
1 (1); : : : ; m (1) sorozat g (1; ;) darab 1-es, ..., g (n; ;) darab n-es egy tetsz®leges ismétléses permutá iója. Ezután, ha a mintaelemek els® k koordinátája már megvan, akkor az fi : i f1::k g = C g index¶ mintaelemek k + +1. koordinátáinak sorozata legyen g (1; C ) darab 1-es, ..., g (n; C ) darab n-es egy tetsz®leges ismétléses permutá iója, ahol dení ió szerint g (x; C ) = 0, ha x 2 C . A lemma állítása ezután az ismétléses permutá iók darabszámainak is legyen a
összeszorzásával adódik.
Megkaptuk tehát az elégséges statisztika, illetve a ML be slés pontos eloszlását.
8.8. Tétel. Legyen p a (18)-beli kanonikus felbontású L-felbontható eloszlás, p^f pedig az eloszlásból származó, f gyakoriságvektorú iid mintához tartozó (22) ML be slés. Ekkor
P (^pf = p^) = P (gf = g ) =
Y C [n℄
h(C )!
(x; C )g(x;C ) : g ( x; C )! x62C Y
(23)
eloszlása L-felbontható, akkor a (1::k) és a (k + 1::n) véletlen vektorok feltételesen függetlenek a f1::k g véletlen halmazra nézve. Láttuk, hogy ha
Hasonló állítás a ML be slésre is érvényes, ezt nevezi Dawid és Lauritzen [25℄ hiper-Markov tulajdonságnak, mely felbontható grakus modellek esetén is teljesül.
8.9. Tétel. Legyen v 2 Sn , 1 k n 1 pedig rögzített. Jelölje f egy m elem¶ iid minta gyakoriságvektorát, P^ pedig a (22)-beli ML be slés szerinti
8. L-FELBONTHATÓSÁG
56
valószín¶ségeket. Ekkor
P^ ((1::k) = v (1::k)) = P^ ((k + 1::n) = v (k + 1::n)) = P^ (f1::kg = v f1::kg) =
kY1 gf (v (j
+ 1); v f1::j g) ; hf (v f1::j g)
j =0 nY1 gf (v (j + 1); v
f1::j g) hf (vf1::kg) ; hf (v f1::j g) m j =k hf (v f1::kg) : m
Valamint fP^ ((1::k) = u)gu és fP^ ((k +1::n) = v )gv feltételesen függetlenek fP^ (f1::kg = C )gC -re, ahol u; v; C az összes lehet®séget befutja.
Bizonyítás.
A három egyenlet könnyen igazolható (pl. induk ióval). A
fP^ ((1::k) = u)gu a fg(x; C )gjC jk 1 változók ^ ((k + 1::n) = v )gv pedig a fg (x; C )gjC jk változók függfüggvénye, fP ^ (f1::kg = C )gC köl sönösen egyértelm¶ kap solatban van a vénye. Végül P fh(C )gjC j=k változókkal. A (23) egyenletb®l pedig látszik, hogy ezek között feltételes függetlenséghez :
fennáll a feltételes függetlenség. Vegyük észre, hogy a 8.7. Lemma bizonyításában leírt eljárás lehet®séget ad arra, hogy a
1 ; : : : ; m mintának a gf
elégséges statisztikára vett feltéte-
les eloszlásából (ami éppen az egyenletes eloszlás az összes ilyen elégséges statisztikájú mintán) közvetlenül generáljunk. A leírt módszerrel az adatmátrixot, melynek oszlopai a
n m-es
1 ; : : : ; m permutá iók, soronként generál-
hatjuk. Ugyanilyen jó módszer az oszloponkénti generálás : menjünk el®ször végig a ko kagráfon úgy, hogy minden sú sból az élgyakoriságokkal arányos valószín¶séggel megyünk tovább. Így kapjuk a
1
mintaelemet. A
1
által
bejárt élek gyakoriságából vonjunk le egyet, és folytassuk az eljárást. A direkt generálás kivitelezhet®sége nem feltétlenül teszi feleslegessé az el®z® szakasz Markov bázis számításait. Egyrészt, nagyobb
n; m
esetén a
Monte Carlo módszert könnyebb lehet üzemeltetni, másrészt, látni fogjuk, hogy az el®z® szakaszban megtalált Markov bázis a bonyolultabb modelleknél is megjelenik majd. Megjegyezzük még, hogy ennek a szakasznak minden eredménye könnyen átfogalmazható az
LK
saládra, illetve tetsz®leges irányí-
tott forrás-nyel® gráf által deniált torikus modellre.
8.3. Illeszkedésvizsgálat
57
8.3. Illeszkedésvizsgálat Az
L
modell illeszkedésének vizsgálatára többféle módszert alkalmazha-
tunk. Problémát jelent, hogy a
H0 : p
2
L
hipotézis különböz® tartójú
exponen iális saládok uniója, és ezek az exponen iális saládok különböz® paraméterszámmal rendelkeznek. Gyakran természetes a
H0 : p
2 E(ML)
hipotézist feltenni, azaz a szigorúan pozitív L-felbontható eloszlásokra kon-
n!-hoz képest kis mintaelemszámok esetén gyakran el®fordul, hogy az E(ML ) saládban nem létezik ML be slés,
entrálni. Azonban a gyakorlatban az
azaz az
L-beli ML be slés nem teljes tartójú. Ha a ML be slés teljes tartójú,
akkor használhatjuk a be sléses illeszkedésvizsgálatra vonatkozó klasszikus
2 -próbát, melynek szabadsági foka n! 2n (n=2 1) 2.
Kis mintaelemszám esetén az illeszkedés jóságát Monte Carlo módszerrel vizsgálhatjuk, a korábban leírt módon. Azaz másodlagos mintákat generálunk a meggyelt elégséges statisztikával rendelkez® minták teréb®l, egyenletes eloszlás szerint, és a másodlagos minták deti mintáéval. Ebben az esetben a
2 -statisztikáit vetjük össze az ere-
2 statisztika helyett más, az illeszkedés
jóságát mér® statisztikát is használhatunk. Ahogy korábban leírtuk, másodlagos mintákat közvetlenül, vagy Markov lán módszerrel is generálhatunk. Az
n = 4
eset különösen egyszer¶. Ekkor sak egy felbonthatóságot
kell ellen®rizni, a
k=2
vágáshoz tartozót. Ez azt jelenti, hogy a kételem¶
6 darab 2 2-es kontingen iatáblázatban kell a 2 függetlenségnek teljesülni : a statisztika e 6 táblázat egy szabadsági fokú, 2 független statisztikáinak összege. Ebben az esetben az adott elégséges
részhalmazoknak megfelel®
statisztikával rendelkez® gyakoriságvektorok is könnyen felsorolhatók : a hat darab, rögzített marginálisú
2 2-es kontingen iatáblát kell nemnegatív egész
számokkal kitölteni. Erre az esetre ad példát a Croon [16℄ ikk adatsora, melyet többek között [8℄ és [32℄ is elemez. Egy kutatás során
2262 német állampolgár a következ®
négy politikai élt állította preferen ia-sorrendbe : (1) A rend fenntartása, (2) Kapjanak az emberek több beleszólást az ország ügyeibe, (3) Az iná ió megfékezése, (4) A szólásszabadság védelme. A kutatás abból a hipotézisb®l indult ki, hogy az emberek két soportra oszthatók : a liberálisok inkább a
8. L-FELBONTHATÓSÁG
58
(2)-es és (4)-es élokat részesítik el®nyben, míg a konzervatívok az (1)-est és a (3)-ast. A következ®
6 kontingen iatáblában a sorok
a sorrend els® két
elemét, az oszlopok az utolsó két elemét jelentik, azaz pl. fel az
(1234) sorrendet.
137-en
A 34 43 12 137 29 21 48 23
B 24 42 13 309 255 31 330 294
C 23 32 14 52 93 41 21 30
D 14 41 23 61 55 32 117 69
E 13 31 24 33 59 42 29 52
F 12 21 34 70 34 43 35 27
állították
A; B; C; D; E; F táblák 2 statisztikája rendre 6:47, 0:43, 0:46, 3:14, 0:00, 1:97. Felt¶n®, hogy a B; E táblák statisztikája a legkisebb, ezek azokat a Az
válaszadókat tartalmazzák, akik a liberális élokat az els® két vagy az utolsó két helyre rangsorolják. A függetlenség egyedül az
A tábla esetén nem elfo-
gadható : láthatjuk, hogy a függetlenség esetén vártnál többen választották
(1234) sorrendet. Elképzelhet®, hogy egyes válaszadók gondolkodás nélkül ezt a sorrendet adták meg. Az is kiszámolható, hogy összesen 692723631600 az
gyakoriságvektor adja ezeket a táblamarginálisokat. Nézzünk ezután néhány szimulá iós eredményt ! A permutá iók hosszúsága
n = 5 illetve 6 lesz, a mintanagyságot pedig jelölje most is m. Háromféle
eloszlásból generálunk mintát : az els® az egyenletes, a második a Pla kettLu e eloszlás,
i = i választással. Ez a két eloszlás L-felbontható. A harmadik
eloszlást véletlen kereséssel választottuk úgy, hogy viszonylag messze legyen
L-t®l, külön n = 5-re és n = 6-ra. A divergen ia D(P kL) = 0:1748 az n = 5 esetben, és D (P kL) = 0:1899 az n = 6 esetben. Itt jegyezzük meg, hogy érdekes lenne tudni, hogy melyik eloszlás(ok) van(nak) a legmesszebb az L modellt®l (divergen ia értelemben). Minden esetben
50 mintát generáltunk,
500 Monte Carlo mintánk volt (direkt generálással). Az aszimptotikus kritikus érték az n = 5 esetben 90:53, az n = 6 esetben 647:62 ( = 0:05). Az eredményeket a 3., 4. és 5. táblázatokban foglaltuk össze. A és minden mintához
8.3. Illeszkedésvizsgálat
59
3. táblázat. Monte Carlo illeszkedésvizsgálat : egyenletes eloszlás
n=5 n=6 m! 60 120 240 180 360 720 1440 #f2 > asz g 0 4 3 0 2 2 2 #f2 > MC g 5 4 2 1 1 2 2 átl. 73:22 90:29 91:32 608:61 652:01 649:10 649:54 MC átl. tartó 96 117 120 654 717 720 720 4. táblázat. Monte Carlo illeszkedésvizsgálat : Pla kett-Lu e eloszlás
m! #f2 > asz g #f2 > MC g átl. MC átl. tartó
n=5 n=6 60 120 240 180 360 720 1440 0 0 0 0 0 0 2 3 2 0 1 1 3 1 52:06 70:52 83:61 397:59 522:62 606:93 641:76 69 93 110 423 561 661 707
#f2 > asz g sor azt mutatja, hogy az 50 mintából hányszor utasítottuk el 2 az L-felbonthatóság hipotézisét az aszimptotikus próbával. A következ®, #f2 > MC g sor pedig a Monte Carlo módszerrel elutasított minták számát adja meg. Az ezután következ® átl. mennyiség a Monte Carlo kritikus MC értékek átlaga az 50 mintából, átl. tartó pedig a ML be slés tartójának átlagos elemszáma (egészre kerekítve). Látható, hogy az egyenletes eloszlás esetén az
= 120,
az
n = 6
esetben már
m = 360
n=5
esetben már
m=
mintanagyságra a kétféle próba
majdnem ugyanazt az eredményt adja, és a ML be slések tartója majdnem teljes. Hasonlót mondhatunk a nem L-felbontható eloszlásra is. A Pla kettLu e eloszlás esetén azonban nagyobb elemszámra van szükség ahhoz, hogy a kétféle próba hasonló eredményt adjon. Adott minta esetén feladatunk lehet annak eldöntése, hogy az elméleti eloszlás melyik
k-knál felbontható. Egy adott k-nál a felbonthatóságot köny-
8. L-FELBONTHATÓSÁG
60
5. táblázat. Monte Carlo illeszkedésvizsgálat : nem L-felbontható eloszlás
n=5 n=6 m! 60 120 240 180 360 720 1440 #f2 > asz g 2 37 50 2 41 50 50 #f2 > MC g 16 41 50 13 42 50 50 átl. 72:63 88:83 91:24 596:82 650:45 650:56 648:86 MC átl. tartó 94 115 120 638 715 720 720 ny¶ vizsgálni, ahogy az
n = 4 esetnél már láttuk : a függetlenségnek
n darab k
k! (n k)! méret¶ kontingen iatáblán kell teljesülnie. Mivel ezen táblák 2
statisztikái függetlenek egymástól, a statisztikákat összeadva aszimptotiku-
san
szabadsági fokú
2
n [(k! 1)((n k)! 1)℄ k
eloszlású próbastatisztikát kapunk a felbonthatóság
hipotézise mellett. Amennyiben kevés adatunk van, akkor Monte Carlo módszert használhatunk, azaz a rögzített marginálisú táblákon Markov lán ot futtatva értékeljük ki az illeszkedés jóságát. Ha egyszerre több
k-nál
szeretnénk a felbonthatóságot vizsgálni, akkor a különböz® elemszámú sú sokhoz tartozó táblák
2 statisztikái már nem függetlenek. A korlátozottan
L-felbontható modellek közül a legjobb megtalálásához ajánlható például a következ® módszer : el®ször egyesével teszteljük a felbonthatóságokat, majd illesszük azt a modellt, mely az így elfogadott felbonthatóságokat tartalmazza. Ezután még megnézhetjük, hogy jobb modellt kapunk-e egy-egy felbonthatóság elhagyásával, vagy bevételével.
61
9. Duplán L-felbonthatóság Ahogy a bevezetésben már említettük, egy párosítási, sorbarendezési, vagy átrendezési kísérlet eredményét ugyanúgy megadhatjuk egy permutá ióval vagy annak inverzével. Vizsgálhatjuk, hogy egyik vagy másik megadás Lfelbontható eloszlást eredményez-e
Sn -en, de azzal a hipotézissel is élhetünk,
hogy mindkét megadás L-felbontható.
9.1. Dení ió. A véletlen permutá ió (vagy eloszlása) duplán L-felbontható, ha és 1 is L-felbontható. Jelölje a duplán L-felbontható eloszlások saládját a továbbiakban hasonlóan deniálhatjuk az invertálva L-felbontható eloszlások azaz
L0 = fp :
L0
B. L-hez
saládját,
(p) 2 Lg;
inv
(inv(p))( ) = p( 1 ). Természetesen L0 is torikus modell, a hozzá 1 tartozó ML0 mátrixot úgy kapjuk ML -b®l, hogy a (; ) inverzpároknak
ahol
megfelel® oszlopokat páronként fel seréljük. Látni fogjuk, hogy az
L
és
L0
B,
amely
torikus modellek metszete, maga nem torikus modell, ezért ez a
salád nehezebben kezelhet®, mint
L.
Mostantól egy darabig sak a szigorúan pozitív duplán L-felbontha-
E(ML ) \ E(ML0 ) metszettel. > > a n! lineáris Vezessünk be két új jelölést ! Legyen F = ImML az ML : R n ! R 0 > operátor képtere, és F = ImM 0 . Ezt a két alteret egyszer és mindenkorra
tó eloszlásokkal fogunk foglalkozni, vagyis az
rögzítsük ! Ezzel a jelöléssel ahol
log()
p
L
2 E(ML) akkor és sak akkor, ha log p 2 F ,
koordinátánként értend®. Ebb®l adódik, hogy
p
akkor lesz szigorúan pozitív duplán L-felbontható eloszlás, ha
akkor és sak
log p 2 F \ F 0 ,
és ezek az eloszlások is exponen iális saládot alkotnak. Egy darabig azon az ártatlannak t¶n® feladaton fogunk dolgozni, hogy meghatározzuk az
F \ F0
altér dimenzióját, illetve egyszer¶ bázisát. A feladat megoldását a mer®legességek teszik majd lehet®vé. Az
U
és
V
U -nak V -re vett mer®leges vetülete éppen U \ V , vagy ami ezzel ekvivalens, ha V -nek U -ra vett mer®leges vetülete éppen U \ V . Jelölje az U -ra való mer®leges
alterekr®l azt mondjuk, hogy mer®legesen metszik egymást, ha
9. DUPLÁN L-FELBONTHATÓSÁG
62
P rU . A mer®leges metszéssel ekvivalens az a tulajdonság P rU és P rV operátorok kommutálnak. A mer®leges metszésre a
vetítés operátorát is, hogy a
?\ jelölést használva kapjuk, hogy
U ?\ V
() P rU V = U \ V () P rV U = U \ V () P rU P rV = P rV P rU :
F 0 mer®legesen metszik egymást, s®t, 0 0 mind F -et, mind F -t fel tudjuk majd bontani páronként mer®leges Fk és F` 0 alterekre úgy, hogy, minden (Fk ; F` ) altér-pár mer®legesen messe egymást. 0 Ezután elég lesz az Fk \ F` ala sony dimenziós alterek dimenzióját és bázisát Azt fogjuk megmutatni, hogy
F
és
meghatározni.
9.1. Hierar hikus modellek permutá iókra El®ször egy ki sit általánosabb vizekre evezünk : deniáljuk, hogy mit értünk hierar hikus modellen véletlen permutá iók esetén. A klasszikus hierar hikus modellek terminológiáját használva, a modellt generátorok fogják deniálni. Egy-egy generátor pedig az
[n℄ [n℄ halmaz egy-egy szorzatpartí-
iója lesz. Az
[n℄ halmaz egy partí iója
D = fD1; : : : ; Ddg : [di=1Di = [n℄; Di \ Dj = ; 8i 6= j: A
Di
halmazok a partí ió osztályai, ezekr®l mindig feltesszük, hogy nem
üresek. Ha
D
és
R két
partí ió
[n℄-en,
akkor a
D R szorzatpartí ió az
[n℄ [n℄ halmazt partí ionálja. Legyen D (illetve R) az [n℄ halmaz egy d (illetve r ) osztályú partí iója. A permutá ió durvítása a D R szorzatpartí ióra a következ® d r -es mátrix :
j(D R)j = (tij ); tij = jf1 s n : s 2 Di; (s) 2 Rj gj:
D R szorzatpartí ióhoz hozzárendelhet® egy UP R n! n! euklideszi tér elemei a v = lineáris altér a következ®képpen. Legyenek az R Minden
P
(24)
=
9.1. Hierar hikus modellek permutá iókra
63
= (v ( ) : 2 Sn ) vektorok,
()
a kifeszített altérre pedig használjuk a Span
jelölést. Ekkor
UP = fv 2 R n! : j (P )j = j (P )j ) v ( ) = v ( )g; azaz
v
2 UP
akkor és sak akkor, ha létezik a
függvény, mellyel
d r-es
(25)
mátrixokon olyan
v ( ) = (j (P )j). Most már deniálhatjuk a hierar hikus
modellt.
9.2. Dení ió. Legyenek P1 ; : : : ; Ps az [n℄ [n℄ szorzatpartí iói. Az Sn -en adott szigorúan pozitív p eloszlás akkor tartozik a P1 ; : : : ; Ps generátorok deniálta hierar hikus modellhez, jelölésben p 2 L(P1 ; : : : ; Ps ), ha
log p( ) =
s X i=1
i (j (Pi )j)
8 2 Sn
valamilyen i függvényekre. Ezzel ekvivalens, hogy
log p 2 Span(U1 ; : : : ; Us ); ahol az UPi = Ui egyszer¶sít® jelölést használtuk. Ismert, hogy a klasszikus hierar hikus modellek esetén az
A
és az
A0
generátorrendszer¶ modellek metszete szintén hierar hikus modell, melynek generátorai az
fA \ A0 : A 2 A; A0 2 A0g halmazok (a hierar hikus modell
alatt most sak a szigorúan pozitív eloszlásokat értjük). Ez a következ®képpen látható be. Az rendelhet®k
UA
A-hierar hikus modell A generátoraihoz hasonló módon
lineáris alterek, mint a permutá iók hierar hikus modelljei
A; A0 [n℄ generátorpárra UA és UA0 mer®legesen metszi egymást, valamint UA \ UA0 = = UA\A0 . Az állítás ezután a 9.5. Lemmából következik. 0 Permutá iók esetén a helyzet nem ilyen egyszer¶, mivel nem minden P ; P
esetében. A 9.3. Lemma alapján könny¶ belátni, hogy minden
partí ió-párra metszik a megfelel® alterek mer®legesen egymást. Elégséges feltételt adunk azonban arra, hogy két hierar hikus modell metszete hierar hikus modell legyen, melynek generátorai is azonosíthatók.
9. DUPLÁN L-FELBONTHATÓSÁG
64
9.3. Lemma. Legyen ( ; A; P ) valószín¶ségi mez®, és jelölje L2 (A) a négyzetesen integrálható valószín¶ségi változók Hilbert terét. A B A -algebrára jelölje L2 (B) a B-mérhet® valószín¶ségi változók zárt lineáris alterét L2 (A)-ban. Legyen B1 , B2 A. Ekkor L2 (B1 ) ?\ L2 (B2 ) akkor és
sak akkor, ha B1 és B2 feltételesen független B1 \ B2 -re nézve. Bizonyítás.
L2 (B1 \B2 ) = L2 (B1 ) \ L2 (B2 ), az L2 (B1 ) és L2 (B2 ) terek akkor metszik egymást mer®legesen, ha minden f 2 L2 (B1 ),
Mivel
akkor és sak
g 2 L2 (B2 ) esetén
E f E (f j B1 \ B2 ) g E (g j B1 \ B2)
= 0:
A feltételes függetlenség teljesülése esetén a következ® er®sebb egyenl®ség is igaz :
E f E (f j B1 \ B2 ) g E (g j B1 \ B2 ) j B1 \ B2
= 0:
Fordítva, ha a két altér mer®legesen metszi egymást, akkor legyen
2 B1, E2 2 B2 két esemény, és jelölje C azt az eseményt, hogy
E1
2
P (E1 \ E2 j B1 \ B2 ) P (E1 j B1 \ B2 )P (E2 j B1 \ B2 ) > 0: Bevezetve az
f = (E1 )(C ) és g = (E2 )(C ) jelöléseket,
E f E (f j B1 \ B2 ) g E (g j B1 \ B2 ) = E ( E (fg j B1 \ B2) E (f j B1 \ B2 )E (g j B1 \ B2 )) = = E (C ) P (E1 \ E2 j B1 \ B2 ) P (E1 j B1 \ B2 )P (E2 j B1 \ B2 ) = 0: Ez sak úgy lehetséges, ha
P (E1 \ E2
j B1 \ B2 ) P (E1 j B1 \ B2 )P (E2 j
j B1 \B2 ) 0 teljesül 1 valószín¶séggel. A fordított egyenl®tlenség hasonlóan igazolható, azaz E1 és E2 feltételesen függetlenek a B1 \ B2 -algebrára. A partí iók között tekintsük a következ® részbenrendezést. A
= (D10 ; : : : ; Dd0 0 )
partí ió nomabb a
D
= (D1 ; : : : ; Dd )
D0
=
partí iónál (vagy
9.1. Hierar hikus modellek permutá iókra
65
D durvább D0-nél), ha minden i-hez van olyan j , hogy Di0 Dj . Jelölje ezt 0 a relá iót D D . Világos, hogy ebb®l UD 0 UD következik. 9.4. Lemma. Legyenek
D0 D és R0 R az [n℄ partí iói. Ekkor
UDR0 ?\ UD0 R és UDR0 \ UD0 R = UDR : Bizonyítás.
Alkalmazzuk a 9.3. Lemmát az
(26)
Sn -en egyenletes eloszlásra. Az
L2 -beli mer®legesség az R n! -beli mer®legességgel ekviaz [n℄ [n℄ halmaz partí iója. Jelölje a továbbiakban (P )
egyenletesség miatt az valens. Legyen
P
az
XP : 7! j (P )j
valószín¶ségi változó által generált lenne
(XP )-vel
-algebrát Sn -en.
Ezt talán pontosabb
jelölni, azonban reméljük, hogy ez a jelölés sem vezet fél-
reértéshez. Ekkor az
UP
altér éppen azokból a
v : Sn ! R
függvényekb®l áll,
(P )-mérhet®k, azaz UP = L2 ( (P )). 0 0 A (26)-beli második állítás a (D R) \ (D R ) = (D R) köny-
melyek
nyen ellen®rizhet® összefüggés miatt teljesül. Az els® állításhoz pedig azt kell belátni, hogy
j(D0 R)j és j(D R0 )j feltételesen függetlenek a j(D
R)j rögzítése mellett, ha egyenletes eloszlású véletlen permutá ió. Ez ismét könnyen ellen®rizhet®.
Még két lineáris algebrai lemmára lesz szükségünk. A mer®leges felbontást
U = U1 U2 , ennek pontos jelentése tehát az, hogy U = Span(U1 ; U2 ), ahol U1 és U2 mer®leges alterek.
jelölje
9.5. Lemma. Legyen U = Span(Ui : i 2 I ) és V = Span(Vj : j 2 J ) két altér. Tegyük még fel, hogy Ui ?\ Vj minden i; j párra. Ekkor U ?\ V , és U \ V = Span(Ui \ Vj : i 2 I; j 2 J ).
P rVj Ui Ui minden i; j -re, ezért P rVj U U minden j -re, tehát U mer®legesen metsz minden Vj alteret. Emiatt P rU Vj Vj minden j -re, amib®l már következik a bizonyítandó P rU V V tartalmazás. Másrészt, legyen W = Span(Ui \ Vj : i 2 I; j 2 J ).
Bizonyítás.
Feltevésünk szerint
9. DUPLÁN L-FELBONTHATÓSÁG
66
Erre
P rVj Ui
W , továbbá P rU Vj
= P rVj U
W,
amib®l
P rU V
W
következik.
9.6. Lemma. Legyen U = U1 U2 és V = V1 V2 két altér. Ha U ?\ V , U1 ?\ V1 , U ?\ V1 és U1 ?\ V teljesülnek, akkor U2 ?\ V2 is igaz, és
U \ V = (U1 \ V1 ) (U1 \ V2 ) (U2 \ V1 ) (U2 \ V2 ): U ?\ V akkor és
sak akkor, ha a vetítés operátorok kommutálnak, azaz P rU P rV = P rV P rU .
Bizonyítás.
Az els® állításhoz azt használjuk fel, hogy
Mármost
P r U P rV = ( P rU 2
2
P rU )(P rV P rV ) = P rU P r V P rU P r V 1
1
1
P rU P rV + P rU P r V ; 1
1
1
ahol a feltétel szerint mind a négy tag operátorai fel serélhet®k. A fel seréléseket elvégezve éppen a
P rV P rU 2
2
operátort kapjuk. A második állítás
pedig a 9.5. Lemmából következik.
A 9.4. Lemma és a 9.5. Lemma azonnali következménye az alábbi.
9.7. Következmény. Legyen L(Di R : i = 1; : : : ; s) és L(D Rj : j = = 1; : : : ; t) két hierar hikus modell, ahol D Di és R Rj minden 1 i s, 1 j t esetén. Ekkor a két modell metszete az L(Di Rj : i = = 1; : : : ; s; j = 1; : : : ; t) hierar hikus modell. 9.2. A salád paraméterezése Ebben a szakaszban megmutatjuk, hogy a szigorúan pozitív L-felbontható és invertálva L-felbontható eloszlások egy-egy hierar hikus modellt alkotnak. Ez a két salád ráadásul olyan szeren sés, hogy alkalmazható rájuk a 9.7. Következmény is, így könnyen megkapjuk a szigorúan pozitív duplán L-felbontható eloszlások hierar hikus reprezentá ióját is. Azonban a modell szabad paraméterei számának meghatározásához ennél ki sit több munkára lesz szükség.
9.2. A salád paraméterezése Deniáljuk el®ször a
67
vastag vágásokat,
ezek az
[n℄
halmazt három inter-
vallumra partí ionálják, melyek közül a középs® sak egy pontból áll. A
k:
vastag vágás tehát
k = (f1::k Kényelmes lesz a
k
1g; fkg; fk + 1::ng); 2 k n
jelölést
k = 1-re
teljes partí iónak
(27)
k = n-re is használni, bár ezek a [n℄-et. Azt a partí iót, mely [n℄-et
és
vastag vágások sak két részre bontják elemeire hasítja,
1:
nevezzük, jelölésben
= (f1g; f2g; : : : ; fng): A (17) egyenletb®l világos, hogy az
E(ML ) L-felbontható exponen iális salád
egy hierar hikus modell :
E(ML ) = L(k : 1 k n): Ez amiatt van, hogy a
j(k )j 0
(28)
1-mátrix ekvivalens a ( f1::k 1g; (k))
párral. A permutá iók invertálása azt jelenti, hogy a szorzatpartí iókban a szorzást fordított sorrendben kell elvégezni. Ebb®l kapjuk, hogy az invertálva L-felbontható exponen iális saládra
E(ML0 ) = L( k : 1 k n): Legyen a
(k; `): vastag kereszt k` = k ` ;
ez tehát a (27)-ban deniált vastag vágások szorzata. Vezessük be a szigorúan pozitív duplán L-felbontható eloszlások saládjára az
E(MB ) jelölést, hiszen
tudjuk, hogy ezek exponen iális saládot alkotnak, bár az
MB
mátrixot még
nem ismerjük. A 9.7. Következmény szerint
E(MB ) = L(k` : 1 k; ` n):
(29)
9. DUPLÁN L-FELBONTHATÓSÁG
68
A (29) reprezentá ió által máris ölünkbe hull egy
MB mátrix, ez azonban nem
lesz teljes rangú. A továbbiakban azon dolgozunk, hogy ennek a mátrixnak a
E(MB )
rangját, azaz az
salád szabad paramétereinek számát meghatároz-
zuk. A (28)-beli hierar hikus modell egy részmodelljére is szükség lesz a számoláshoz. Ezt durvább partí iók generálják.
Vékony vágásnak
olyan partí iót, mely két intervallumra bontja
[n℄-et. A k: vékony vágás tehát
e k = (f1::k g; fk + 1::ng); 1 k n
1:
(30)
e n 1 . Az egyszer¶bb jelölés kedvéért a n = e n triviális partí iót is vezessük be. Az E(ML ) egy részmodellje az
Vegyük észre, hogy
e1 1 =
nevezünk egy
és
ek : 1 k n E(MS ) = L(
1)
S -felbonthatónak nevezzük, ahol S az angol set (halmaz) szóból jön, mivel ebben a modellben minden C [n℄
hierar hikus modell. Az ilyen eloszlásokat
részhalmazhoz tartozik egy paraméter. Ez a modell önmagában is érdekes lehet, bár nekünk sak mint segédmodell bukkan fel. Kés®bb majd részletesebben megvizsgáljuk ezt a modellt. Hasonlóan deniáljuk az invertálva Sfelbontható eloszlások
E(MS 0 ) saládját. Felidézve a szorzatpartí iókhoz ren-
delt alterek (25)-beli dení ióját, vezessünk be néhány újabb jelölést a leggyakrabban el®forduló altereinkre. Legyen
Uk = Uk ; Ue k = Uek : A partí iók között fennálló relá ió miatt kiegészít® alterét
Uk -ban Fk . Hasonlóan,
Uek
Uek
Uk ,
jelölje
Uek
ortogonális
Uk+1 is teljesül. Ezért
(Uk : 1 k n) = Span(Fk : 1 k n; Uen ):
Span
e 1 , így F1 = f0g. Továbbá, mivel e n a triviális partí ió, U en = 1 = = Span(1). Ezért az E(ML ) L-felbontható hierar hikus modellhez tartozó Mivel
9.2. A salád paraméterezése altér
69
F = Span(Uk : 1 k n) = Span(Fk : 2 k < n; 1):
Megmutatjuk, hogy a (31) jobb oldalán álló alterek az
F
(31)
altér ortogonális
felbontását adják.
k n) alterek mer®legesek egymásra és az 1
9.8. Lemma. Az Fk (2 vektorra. Bizonyítás.
Ismét használjuk, hogy az egyenletes eloszlás melletti
mer®legesség ekvivalens az zonyításban a
R
n! -beli
L2 -beli
euklideszi mer®legességgel. Ebben a bi-
k = (k ); ek = (e k )
E (f j ek ) alakban állnak el®, ahol f k -mérhet®. Az 1-re való mer®legesség az E (f1 ) = 0 összefüggésb®l adódik. A másik állításhoz pedig legyen g1 2 Fj , ahol j > k . Könny¶ ellen®rizni, hogy
jelölést használjuk. Az
Fk elemei f1 = f
egyenletes eloszlás esetén
k
és
j
feltételesen függetlenek a
ek -algebrára
nézve. Ezért
E (f1 g1) = E [E (f1 g1 j ek )℄ = E [E (f1 j ek )E (g1 j ek )℄ = 0; hiszen Az
1 valószín¶séggel E (f1 j ek ) = 0. E(ML )
salád szabad paramétereinek
bn
száma könnyen számolható,
többek között a (31) ortogonális felbontásból kapjuk, hogy
bn = dim(F ) 1 = ahol
Fk
n X k=2
(Fk ) =
dim
n X n
k k=2
(k
1) = 2n (n=2 1) + 1;
dimenziójának kiszámítása könny¶ feladat (
bn -et egyébként már ko-
rábban is meghatároztuk). Azonban a (31) felbontás igazi haszna abban áll,
G = F \ F 0 altér dimenzióját. 0 e 0 ; F 0 alterek az E(ML0 ) modellhez ugyanúgy, ahogy Tartozzanak az U` ; U ` ` e Uk ; Uk ; Fk az E(ML ) modellhez tartozik. Tehát a (25)-beli jelöléssel,
hogy segít kiszámolni a
U ` = U`0 ; U e ` = Ue`0 :
9. DUPLÁN L-FELBONTHATÓSÁG
70
Ekkor a 9.8. Lemma szerint az invertálva L-felbontható hierar hikus modellhez tartozó altér :
F 0 = n`=2 F`0 Span(1):
A 9.4. Lemma szerint minden
U
2 fUk ; Uek : 2 k ng; U 0 2 fU`0 ; Ue`0 : 2 ` ng
U ?\ U 0 , hiszen az U -alterekhez tartozó szorzatpartí iók második 0 tényez®je, míg az U -alterekhez tartozó szorzatpartí iók els® tényez®je az [n℄ 0 teljes partí iója. A 9.6. Lemmából kapjuk, hogy Fk ?\ F` minden k; ` esetén. 0 Továbbá a 9.5. Lemma alapján a G = F \ F altér egy ortogonális felbontása altér-párra
G = 2k;`n(Fk \ F`0 ) 1: Fk \ F`0 alterek dimenzióját és bázisát kell meghatároznunk. Ehhez rögzítsük k -t és `-et. A 9.4. Lemma alapján a k` vastag kereszthez 0 0 tartozó altér Uk \ U` . Vegyük észre, hogy Fk \ F` pontosan azokból az Uk \ \ U`0 -beli vektorokból áll, melyek mer®legesek az Uek és az Ue`0 terekre. 0 Emlékezzünk vissza, hogy az Uk \ U` tér vektorainak : koordinátája sak a (24)-ben deniált j (k` )j statisztikától függ. A j (k` )j = (tij ) 3 3-as mátrix elemeinek sorösszegei rendre k 1; 1; n k, oszlopösszegei rendre ` 1; 1; n ` kell legyenek. Ezért elég a mátrixnak a bal fels® 2 2-es részét megadni. Mivel a t12 ; t21 ; t22 elemek sak 0 vagy 1 érték¶ek lehetnek, k` k` a j (k` )j statisztikát még tömörebben leírhatjuk egy (a ( ); q ( )) párral. Most már sak az
Legyen tehát
ak` ( ) = t11 + t12 + t21 + t22 ; q k`( ) a 6. táblázat szerinti. 0 Mivel az Uk \ U` altér vektorainak : koordinátája sak 0 statisztikától függ, az Uk \ U` altér egy ortogonális bázisa a
és
k` k` k` aq ( ) = fa ( ) = a; q ( ) = q g indikátorvektorokból áll, ahol
a; q
a
j(k`)j (32)
minden olyan lehetséges értéket befut,
9.2. A salád paraméterezése 6. táblázat. A
71
j(k`)j statisztika lehetséges értékeinek kódolása
(tij )1i;j 2 q k`( ) a 1 1 1 0 0 a 2 1 2 1 0
melyre
k` aq
a 1 0 1 0
(tij )1i;j 2 q k` ( ) a 0 4 0 0 a 1 0 5 0 1
3
nem azonosan nulla. Ehhez például szükséges, hogy
max(0; k + ` n) a min(k; `);
q általában 1-t®l 5-ig bármi lehet, kivéve ha a 2 f0;1; k; `g. P k` 0 Legyen most u = b;q bq bq az Uk \ U` altér általános eleme, meg kell ek és U e 0 alterekre. Legyen el®ször határoznunk, hogy mikor lesz mer®leges az U ` v ( ) = ( f1::kg = C ) az Uek tér egy báziseleme, és legyen j C \ f1::`g j= a. Ha még h = (k 1)! (n k)!, akkor a skaláris szorzatra
míg
(u; v ) =
8 < (k a)h + (a a1 a2 : ah + (k a)h a3 a4
1)h + a5 h
v ( ) = ( 1 f1::`g = D) az Ue`0 j D \ f1::kg j= a, és g = (` 1)! (n `)!, akkor
Hasonlóan, ha
(u; v ) = Az
8 <
a3 (`
altér báziseleme, valamint
a)g + a2 (a 1)g + a5 g : ag + (` a)g a1 a4
Fk \ F`0 altér tehát olyan
P5 k` q=1 aq aq
` 2 C; ha ` 62 C:
ha
k 2 D; ha k 62 D:
ha
vektorok lineáris kombiná ióiból
9. DUPLÁN L-FELBONTHATÓSÁG
72
áll, melyekre
a1 (k
a) + a2 (a 1) + a5 = a3 a + a4 (k a) =
a3 (` a) + a2 (a 1) + a5 = a1 a + a4 (` a) = 0:
A négy feltételb®l három lineárisan független választható ki, így általában két lineárisan független megoldás van. Az végignézni. Az
a = 0 esetben
a = 0;1; min(k; `) eseteket
külön kell
sak az azonosan nulla megoldás, míg az
Nak`
a=
= 1; min(k; `) esetekben egy nemnulla megoldás van. Jelölje a lineárisan k` független megoldások számát, azaz Na nulla, egy vagy kett®. Megmutatjuk, hogy minden 1 i n-re
jf(k; `) : dim(Fk \ F` 1) igj = (n i)2 : k; ` párokat, melyekre dim(Fk \ F`0 ) 2j + 2. k` Ez úgy lehet, ha az Na mennyiségek között vagy két 1-es és legalább j 2-es van, vagy egy 1-es és legalább (j + 1) 2-es. Az els® lehet®ség akkor következik be, ha ` + k n +1 és minfk; `g j + + 2, a második pedig akkor, ha ` + k n + 2 és maxfk; `g n j 1. De ha ` + k n + 1 és k; ` j + 2, akkor k; ` n j 1 is igaz. Hasonlóképp, ha ` + k n + 2 és k; ` n j 1, akkor egyszersmind k; ` j + 3 > j + 2. 1 Tehát dim(Fk \ F` ) 2j +2 akkor és sak akkor, ha j +2 k; ` n j 1, ilyen párból pedig [n (2j + 2)℄2 van. 0 Most keressük meg azon k; ` párokat, melyekre dim(Fk \ F` ) 2j + 1. Ez k` úgy történhet, ha az Na értékek között vagy két 1-es és legalább j 2-es van, vagy egy 1-es és legalább j 2-es. Az els® lehet®ség akkor következik be, ha ` + k n + 1 és minfk; `g j + 2, a második pedig akkor, ha ` + k n + 2 és maxfk; `g n j . De ha ` + k n + 1 és k; ` j + 2, akkor k; ` n j 1 < n j is teljesül. Ha pedig ` + k n + 2 és k; ` n j , akkor k; ` j + 2 is fennáll. Tehát 0 dim(Fk \ F` ) 2j + 1 akkor és sak akkor, ha j + 2 k; ` n j , ilyen párból pedig [n (2j + 1)℄2 van. Keressük meg el®ször azon
9.2. A salád paraméterezése
73
Mivel
X
X (Fk \ F` 1 ) = jf(k; `) : dim(Fk \ F` 1) igj;
dim
k;` és az
E(MB )
i1
salád szabad paramétereinek száma
G=F
\ F 0 dimenziója
mínusz egy, kaptuk, hogy
9.9. Tétel. Az E(MB ) salád szabad paramétereinek száma
dn =
n 1 X i=1
i2 :
Továbbá beláttuk a következ® tételt.
9.10. Tétel. Legyen
k` a1 = k` a2 =
k` k` a2 + (a 1)a5 k` (` a)ak` a1 + (k a)(` a)a2 k` +a2 k` a4 + (k a)(` a)a5 :
(k
a)ak` a3 +
Ekkor az
f1g [ fk`ai : 2 k; ` n; max(0; k + ` n) a min(k; `); i = 1;2g vektorok közül az azonosan nullákat elhagyva, a G altér ortogonális bázisát kapjuk. A mer®legesség különösen kényelmes tulajdonság, ha egy szigorúan pozitív duplán L-felbontható eloszlásnak a 9.10. Tételben megadott paraméterezését keressük. Ugyanígy könnyen meghatározhatjuk egy szigorúan pozitív eloszlás logaritmusának a
G altért®l vett euklideszi távolságát, illetve a hoz-
zá euklideszi értelemben legközelebb es® duplán L-felbontható eloszlást. Ez természetesen különbözni fog a maximum likelihood be slést®l. Most a
G térnek egy indikátor-vektorokból álló bázisát is megadjuk. Tet-
9. DUPLÁN L-FELBONTHATÓSÁG
74
sz®leges
k; `; a-ra vezessük be a ak`
jelölést, ahol emlékeztetünk
k` aq
=
5 X q=1
k` aq
(32)-beli dení iójára.
9.11. Tétel. Az 1 és a
ak` : 1 k; ` n 1; max(0; k + ` n) < a min(k; `); k` a5 : 1 k; ` n 1; max(1; k + ` n) < a min(k; `)
(33)
vektorok a G altér bázisát alkotják.
Bizonyítás.
Két dolgot mutatunk meg. Egyrészt triviális kiszámolni, hogy
k` aq (2 k; ` n) vektorok benne vannak a tételbeli vektorok által generált G k` k` altérben. Rögzített k; `-re a a és a5 vektorrendszerek mindegyikéb®l egy vektort kizártunk, méghozzá a lehet® legkisebb a értékhez tartozót (ha pl. min(k; `) = 1, akkor a k` a5 vektorok között sak az a = 1 fordul el®, amit ki is zárunk). Ezt azért tehetjük meg, mert ezek már benne vannak G -ben,
a tételbeli vektorok elemszáma
dn + 1.
Másrészt megmutatjuk, hogy a
amint azt most megmutatjuk. El®ször is, mivel
min( k;`) X a=max(0;k+` n) a
ak`
vektorok
a = max(0; k + `
esetében pedig elég belátni, hogy azaz a
v k`
=
ak` = 1;
n)-re is G -ben vannak. A k` a5 vektorok a f (k ) = `g esemény indikátorvektora, min( k;`) X
a=max(1;k+` n)
k` a5
G -beli. Ezt induk ióval mutatjuk meg. Az induk iós lépésben feltesszük, ij hogy v 2 G minden i k , j `, (i; j ) 6= (k; `) esetén, majd ebb®l megk` 2 G is igaz. Így az (1;1) párból elindulva minden (k; `) mutatjuk, hogy v 11 = 11 2 G . párhoz eljutunk. Az induk ió kezdetéhez vegyük észre, hogy v 1
vektor
9.2. A salád paraméterezése
75
Az induk iós lépés pedig a
k X ` X i=1 j =1
v ij =
X a
aak` 2 G
összefüggés miatt végezhet® el.
2 k; ` n 1 értékeket, és mutassuk meg, hogy k` aq 2 G minden a min(k; `), 1 q 4 választásra. A bizonyítás lényegét Rögzítsük most a
a következ® egyenletek adják :
k 1;` k 1;` k` a1 = a a k` + k 1;` 1 k` = a2 a a k` k;` 1 a3 = a ak 1;` k 1;` 1 + k` 4 a4 = a
1 + 1 ak 1;` 1 + 3
ahol
i = di k` a+2;2 + valamilyen
5 X q=1
ak;` 1
k` a5 + 2
iq k` a+1;q
(34)
(35)
di ; iq együtthatókkal, melyeknek pontos értéke nem fontos. Ezért
a szerinti visszafelé haladó induk ióval bizonyíthatunk : ha már tudjuk, hogy k` bq 2 G minden b a + 1-re, akkor a (35) egyenletben i 2 G , és így k` aq 2 G is, mivel a (34) egyenletek jobb oldalainak többi vektora a tételbeli (33) bázis eleme. (Az induk ió elindításával sin s gond, mivel a = min(k; `) esetén i = 0.) Végül nézzük azt az esetet, amikor max(k; `) = n. Tegyük fel, hogy ` < < k = n, ekkor a = ` lehet sak, és n 1;` n 1;` 1 n 1;` n` ; n` ; n` `1 = ` `2 = ` 2 `5 = 1 ` Ha pedig
k = ` = n, akkor a = n, és n 1;n 1 n 1;n 1 : ; nn nn n5 = n 1 n2 = 1 n 1
`n 21;` 1 :
9. DUPLÁN L-FELBONTHATÓSÁG
76
Nevezzük azokat az eloszlásokat, melyek S-felbonthatók és invertálva Sfelbonthatók is, duplán S-felbontható eloszlásoknak. A 9.7. Következmény szerint a pozitív duplán S-felbontható eloszlások hierar hikus modellt alkotnak, melynek generátorai a
e k` = ek e` szorzatpartí iók, melyeket
vékony kereszteknek
hívunk. Emlékeztetünk a
szorzótényez®k (30)-beli dení iójára. Ebben az esetben x partí ióhoz tartozó
Ue k`
altérnek a
ak`
vektorok (ahol
a
k; `-re
a
e k`
minden lehetséges
értéket befut) ortogonális bázisát adják. A 9.11. Tétel szerint a különböz®
(k; `)
párokhoz tartozó
Ue k`
alterek majdnem lineárisan függetlenek, a
közöttük lév® lineáris összefüggés sak abból származik, hogy az
1
vektor
mindegyikükben benne van. Ebb®l a következ® tételt kapjuk.
9.12. Tétel. A pozitív duplán S-felbontható eloszlások hierar hikus modellt alkotnak, mely szabad paramétereinek száma
en =
b(nX 1)=2 j =0
(n
2j
1)2 :
A modellhez tartozó altér egy bázisa az 1 vektorból és a ak` vektorokból áll, ahol k; `; a ugyanott fut, mint (33)-ban. A (33)-beli
k` a5
vektorok tehát a duplán L-felbontható és a duplán S-
felbontható eloszlások közötti különbséget adják meg. A teljesség kedvéért megjegyezzük, hogy a pozitív S-felbontható eloszlás salád szabad paramétereinek száma
n =
n X n i=1
i
1 = 2n
n 1:
Végül megemlítjük, hogy elmetszhetjük egymással az
LK
és az
L0K 0
salá-
dokat is, azaz kereshetjük azokat az eloszlásokat, melyek felbonthatók minden
k
2 K -ra és invertálva felbonthatók minden k0 2 K 0-re, ahol K; K 0
9.3. Két szemléltetési mód
77
[n℄ tetsz®leges halmazok. Az ilyen pozitív eloszlások is hierar hikus modellt alkotnak (9.7. Következmény), melynek paraméterszáma minden konkrét
n; K; K 0-re lineáris algebrai módszerekkel meghatározható. 9.3. Két szemléltetési mód
Szólunk pár szót arról, hogy a véletlen permutá iókat, a
j(P )j statiszti-
kákat, illetve a feltételes függetlenséget hogyan lehet szemléletesen ábrázolni. Két ábrázolásmódot mutatunk be : a páros gráfot és a sakktáblát.
2 Sn -hez hozzárendelhetjük a G( ) = ([n℄; [n℄; E ( )) páros gráfot. Itt [n℄ jelöli mind a két sú sosztályt, azaz mindkét osztályban n darab, 1-t®l n-ig számozott sú s van. Az élek halmaza pedig E = f(k; (k)) : k = = 1; : : : ; ng, azaz az els® osztály k: sú sát a második osztály (k): sú sával Minden
kötjük össze. Ebben a gráfban tehát minden pont foka pontosan egy. Ha most
Di
D és R az [n℄ partí iói, akkor a G() gráf els® sú sosztályának minden
részhalmazát vonjuk össze egy
i
sú
sá, és második sú sosztályának
j sú
sá úgy, hogy az összevont
sú sok megöröklik a régi sú sok éleit. A j (DR)j = (tij ) mátrix tij eleme
minden
Rj
részhalmazát vonjuk össze egy
ekkor azt adja meg, hogy a kapott multigráfban hány él vezet az els® osztály
i és a második osztály j sú sa között.
Tegyük fel, hogy a két sú sosztályt két oszlopban rendezzük el, balra az els® osztályt, jobbra a második osztályt helyezzük, és a sú sok számozása lefelé növekszik. Az élek pedig legyenek egyenes szakaszok. Ekkor például a
j(k`)j
= (tij )
statisztikát lokálisan leolvashatjuk a gráfból. Azt kell
(k; (k)) él a (k; `) szakasz alatt, fölött, vagy 1 rajta fut, (ii) a ( (`); `) él a (k; `) szakasz alatt, fölött, vagy rajta fut, és (iii) hány E -beli él metszi a (k; `) szakaszt. (iii)-hoz azt vegyük észre, hogy a (k; `) szakaszt metsz® E -beli élek száma t13 +t31 , ebb®l pedig t11 kiszámítható, ha ismerjük még a t12 ; t21 ; t22 ; t23 ; t32 mátrixelemeket. A sakktábla reprezentá ióhoz vegyünk egy n n-es sakktáblát. Minden 2 Sn -hez helyezzünk el n darab bástyát a táblán, a k: bástya kerüljön a k: sor (k ): oszlopába. A sakk sak úgy jön el®, hogy ezek a bástyák nem ütik egymást. Ha most D és R az [n℄ partí iói, akkor a tábla sorainak minden Di meghatároznunk, hogy (i) a
9. DUPLÁN L-FELBONTHATÓSÁG
78
O O O O O O n = 6. Feltéve, hogy f1::4g = f1;3;4;6g, (1::4) és (5::6) független.
3. ábra. L-felbonthatóság a sakktáblán,
részhalmazát vonjuk össze egy
sorrá, és oszlopainak minden
Rj
részhal-
(i ; j ) tábla-mez® megörökli a régi mez®k bástyáit. A j (D R)j = (tij ) mátrix tij eleme ekkor azt adja meg, hogy az új (i ; j ) mez®ben hány bástya áll. mazát vonjuk össze egy
j
i
oszloppá úgy, hogy az összevonás utáni
A sakktábla reprezentá ió segítségével szemléltethetjük az L-felbonthatóságot. Ha a sakktáblát vízszintesen elvágjuk két sora között, akkor a fels® és alsó részben a bástyák elhelyezkedése független lesz, feltéve, hogy tudjuk, mely oszlopokat foglalják el a fels® és alsó rész bástyái. (lásd a 3. ábrát). Ez akkor is igaz, ha a táblát több vízszintes részre vágjuk. Az invertálva L-felbonthatóságot úgy kapjuk, ha a sorok és oszlopok szerepét fel seréljük. Ugyanígy a páros gráfon is szemléltethetjük az L-felbonthatóságot. Ha az els® sú sosztályt valahol elvágjuk, akkor a vágás feletti és alatti sú sokból kiinduló élek függetlenek lesznek, feltéve, hogy ismerjük a vágás feletti
sú sok szomszédainak halmazát (lásd a 4. ábrát). Az invertálva L-felbonthatóságot úgy kapjuk, ha a két sú sosztály szerepét fel seréljük.
9.4. Markov bázis
n = 4-re
Az L-felbontható torikus modellre könny¶ volt egy Markov bázist megadni, általános
n-re. Adódik a kérdés,
hogy a duplán L-felbontható esetben is
megoldható-e ez a feladat. Szeretnénk tehát megkeresni, hogy melyek azok
9.4. Markov bázis n = 4-re
79
1
1
2
2
3
3
4
4
5
5
6
6
n = 6. Feltéve, hogy f1::4g = f1;3;4;6g, (1::4) és (5::6) független.
4. ábra. L-felbonthatóság a páros gráfon,
(F(MB ))
a polinomiális összefüggések, melyek a l den elemére teljesülnek. Ezt általános
n-re
zárt torikus modell min-
nem sikerült tisztázni. S®t, az
n, melyre a nyílt hozzáférés¶ program somagok eredményesek voltak, az n = 4. Az n = 5 már túl nagy feladatnak bizonyult ezen egyetlen nemtriviális
program somagok számára. Mi a 4ti2 [1℄ program somagot használtuk, mely egy adott modellmátrixhoz tartozó torikus ideál minimális generátorrendszerét számolja ki algoritmikusan. Korábban láttuk, hogy az
n = 4 esetben az
IML minimális generátorrendszere hat másodfokú polinomból áll, ugyanígy az IM 0 -é is. Két polinom azonban közös, így összesen tíz másodfokú poliL nomot kapunk, melyek nyilván az IMB ideálnak is elemei. Ezeken túl az IMB minimális generátorrendszerében még nyol negyedfokú polinom szerepel :
1 2 3 4 5 6 7 8
x1324 x2431 x3241 x4123 x1324 x2431 x3214 x4132 x1324 x1432 x3241 x4213 x1324 x2341 x4213 x4132 x1342 x2413 x3241 x4123 x1342 x2413 x3214 x4132 x1432 x2413 x3241 x3124 x2314 x2431 x3142 x4123
x1423 x2341 x3124 x4231 x1432 x2314 x3124 x4231 x1342 x1423 x3214 x4231 x1342 x2314 x4231 x4123 x1423 x2341 x3142 x4213 x1432 x2314 x3142 x4213 x1423 x2431 x3214 x3142 x2341 x2413 x3124 x4132
(36)
9. DUPLÁN L-FELBONTHATÓSÁG
80
Ez a nyol polinom egyetlen orbitot alkot a következ® értelemben. A következ® szakaszban belátjuk, hogy az
E(MB )
salád, és így a lezártja is, invariáns
bizonyos transzformá iókra nézve. Ezek a transzformá iók valamilyen
Sn -en
p( ) valószín¶ségeket. Konkrétan, legyen : Sn ! Sn köl sönösen egyértelm¶ leképezés, p pedig Sn -en adott eloszlás. p-nek szerinti átrendezése a p ( ) = p(( ))-vel deniált p eloszlás. Akkor mondjuk, hogy egy eloszlás salád invariáns -re, ha minden p elemével együtt p is eleme a saládnak. Ha az invertálás, vagy bizonyos permutá iókkal való jobbról vagy balról szorzás, akkor E(MB ) invariáns -re (lásd a következ® szakaszt). A transzformá ió természetes módon hat az x
adott transzformá ió szerint átrendezik a
változókból felépített polinomokra is. Ha egy polinomiális összefüggés igaz egy saládban, és a salád invariáns
-re,
akkor a
szerint transzformált
polinomiális összefüggés is érvényes a saládban. Egy polinomiális összefüggés orbitját az összes, a saládot invariánsan hagyó
-k szerint transzformált
polinomok képezik. A (36) nyol polinomja ebben az értelemben teljes orbitot alkot. Mivel
E(ML ) \ E(ML0 ) = E(MB ),
így szigorúan pozitív
x
változók e-
IML és IML0 bázisának tíz másodfokú összefüggéséb®l, a következ®képpen. Az x1324 x2413 = x2314 x1423 és az x3214 x4123 = x3124 x4213 polinomok IML0 -höz tartoznak. Ezeket összeszorozva kapjuk, hogy x1324 x2413 x3214 x4123 = x3124 x4213 x2314 x1423 , azaz setén a (36)-beli polinomok levezethet®k az
x1324 x2413 x3214 x4123 = 1: x3124 x4213 x2314 x1423 Azonban az L-felbonthatóság miatt
x2413 x2431 = x4213 x4231
és
x3214 x3241 = : x2314 x2341
Ez utóbbit az el®bbibe helyettesítve, és a nevez®vel visszaszorozva éppen a (36) polinomok közül az els®t kapjuk. Összességében azt mondhatjuk, hogy a pozitív duplán L-felbontható
9.5. Maximum likelihood be slés
81
eloszlásokra a következ® alakú összefüggések érvényesek :
x13ab x = 14 d x31ab x41 d x d14 xab13 = xab31 x d41 x1 d2 x1a2b = x2a1b x2 d1 x3 d4 x3a4b = x4a3b x4 d3 ahol az
a; b; ; d; e; f; g; h
= = = =
x23ef x = 24gh x32ef x42gh xef 23 xgh24 = xef 32 xgh42 xe12f xg1h2 = xe21f xg2h1 xe34f xg3h4 = ; xe43f xg4h3
tetsz®leges értékek. Ezek az összefüggések ugyan-
úgy vezethet®k le, mint a (36) els® polinomja : valamilyen az összefüggés két
a; : : : ; h értékekre
IML -beli vagy IML0 -beli polinom összeszorzásával és átren-
dezésével kapható meg. Ebb®l pedig, ismét felhasználva az L-, illetve invertálva L-felbonthatóságot, az összefüggés tetsz®leges
a; : : : ; h
választásra
is teljesül. Ha a fenti összefüggésekben elt¶ntetjük a nevez®ket, megkapjuk
(F(MB ))-beli eloszlás kielégít.
azokat a polinomokat, melyeket minden l
9.5. Maximum likelihood be slés A permutá iók hierar hikus modelljei esetében a maximum likelihood be slés ugyanúgy megkapható az IPS algoritmussal, mint a kontingen iatáblák esetében. A ML be slés pedig a 2.7. Tételben kimondott tulajdonságokkal rendelkezik. Az IPS algoritmus során a generátor-partí iókat iklikusan vesszük sorra, és az éppen soron lev®
j(P )j statisztika elméleti eloszlását átskálázással
egyenl®vé tesszük a megfelel® tapasztalati eloszlással. A duplán L-felbontható hierar hikus modell esetén egy alternatív algoritmus kínálkozik, mivel az
L
és
L0
saládokban a ML be slés expli it. A következ® algoritmusban,
melyet nevezzünk iteratív vetítésnek, felváltva számoljuk az ML be sléseket. Ismét
L-beli és L0 -beli
r jelöli a minta tapasztalati eloszlását.
9. DUPLÁN L-FELBONTHATÓSÁG
82
Iteratív vetítés :
p0 := r, k := 0.
Ismételjük :
q := a pk eloszlás ML be slése L-ben, k := k + 1, pk := q , q := a pk eloszlás ML be slése L0 -ben, k := k + 1, pk := q , amíg az eljárás konvergál. Az iteratív vetítési algoritmusról egyel®re nem tudtuk bizonyítani, hogy
(F(MB ))-beli
a l
ML be sléshez tart, ami biztosan nem is igaz teljes ál-
(E(MB )) ( L \ L0 . Így ha az
talánosságban. Amint azt kés®bb látni fogjuk, l
r tapasztalati eloszlás (L \ L0 ) n l(E(MB ))-beli, akkor az iteratív vetítés nem mozdul el r -b®l, míg az IPS algoritmus a l(E(MB ))-beli ML be sléshez konvergál. Azt sejtjük azonban, hogy szigorúan pozitív r -ekre az iteratív vetítés ugyanoda konvergál, mint az IPS algoritmus. Nézzünk erre egy numerikus példát ! Legyen
r
2
r a (38)-beli permutá iókon egyenletes eloszlás (n = 4), erre A hozzá tartozó l(E(MB ))-beli ML be slés (az
(L \ L0 ) n l(E(MB )).
IPS algoritmussal) a következ® :
p(1324) = p(2431) = p(3241) = p(4321) = 0:1123; p(2341) = p(3124) = p(4231) = 0:1734; p(1423) = 0:0306: Módosítsuk most ki sit
r-et !
A (38)-beli permutá iókhoz rendeljünk egy-
forma valószín¶séget, az összes többi permutá ióhoz pedig egy kis pozitív valószín¶séget (például
= 0:0001). Ekkor
az IPS algoritmus és az iteratív
vetítés ugyanahhoz a határponthoz konvergál. Az iteratív vetítés azonban sokkal lassabb. Gyakorlati szempontból is érdekes lehet a következ® kérdés. Tegyük fel, hogy két hierar hikus modell metszetében szeretnénk a ML be slést megtalálni, ahol a ML be slés a két modellben külön-külön expli it kiszámolható, azonban a két modell nem teljesíti a 9.7. Következmény feltételeit. Ekkor a metszetükr®l nem tudjuk, hogy hierar hikus modell (esetleg nem is az), így
9.6. A modell lezártja
83
nem alkalmazhatjuk minden további nélkül az IPS algoritmust. Vajon az iteratív vetítés ekkor elvezet-e a ML be sléshez ? Kés®bb még visszatérünk arra, hogy mit mondhatunk két hierar hikus modell metszetér®l általában.
9.6. A modell lezártja Ebben a szakaszban áttérünk a nem szigorúan pozitív eloszlások vizsgálatára. Emlékeztetünk, hogy az L-felbontható eloszlások
L saládja mege-
F(ML ) zárt torikus modellel. Már megvizsgáltuk a pozitív duplán L-felbontható eloszlásokat, és azt kaptuk, hogy ezek egy E(MB ) exponengyezik az
iális saládot alkotnak, ahol az
MB
mátrix expli it megadható. Ebben a
szakaszban három modellt szemlélünk meg közelebbr®l : (i) az exponen iális
(E(MB )) lezártját, (ii) az F(MB ) torikus modellt, (iii) az összes dup-
salád l
lán L-felbontható eloszlás
L \ L0
saládját. Megmutatjuk, hogy ez a három
modell szigorúan b®vül® sorozatot alkot. Mivel az
MB
F(MB ) salád nem sak az
sorai által kifeszített altért®l függ, meg kell mondanunk, hogy pontosan
mi legyen ez a mátrix. Legyenek séges
MB
sorai a
k` aq
vektorok, minden lehet-
k; `; a; q választásra. Tudjuk, hogy ezek nem lineárisan függetlenek, de
ez most nem is kell nekünk. A következ® lemma hasznos lesz, ha a meggyeléseinket akarjuk terjeszteni
n > 4-re.
n = 4-r®l
ki
A lemmában * helyére L, invertálva L, vagy
duplán L írható.
9.13. Lemma. (i) Legyen n < m, p pedig Sn -en adott eloszlás. Legyen még az n + 1; : : : ; m egészek tetsz®leges permutá iója. A p eloszlás Sm -re való -felemeltje a következ® q eloszlás:
q ( ) =
8
ha f1::ng = f1::ng és (n + 1::m) = ;
:0
egyébként.
Ekkor, ha p *-felbontható, akkor q is az. P (ii) Legyen n < m, és q olyan eloszlás Sm -en, melyre f1::ng=f1::ng q () > 0.
9. DUPLÁN L-FELBONTHATÓSÁG
84
Legyen még az n + 1; : : : ; m egészek olyan permutá iója, melyre X (n+1::m)=
q () > 0:
Ekkor a q eloszlás Sn -re való -megszorítása a következ® p eloszlás:
p( ) = q (; ); ahol normáló tényez®. Ezekkel a dení iókkal, ha q *-felbontható, akkor p is az. A lemma bizonyítása triviális, ezért eltekintünk t®le.
9.14. Tétel. A szakasz elején deniált modellek között a következ® szigorú tartalmazások állnak fenn: E(MB ) $ F(MB ) $ l(E(MB )) $ L \ L0 : Bizonyítás.
Az els® relá ió triviális. A másik kett®nél is sak azt kell meg-
mutatnunk, hogy egyenl®ség nem állhat fenn. Mindkét esetben mutatunk egy eloszlást a két modell különbségében általános
n > 4 esetre.
Az els® relá ió esetén
n = 4-re
n = 4-re,
legyen
majd ezt felemeljük az
T = T4
S4
a következ®
16
permutá ióból álló halmaz :
1234; 1243; 1324; 1342; 1423; 2134; 2143; 2341; 3241; 3412; 3421; 4231; 4213; 4321; 4312; 4123:
(37)
T nem MB -megvalósítható, mivel az [2T Supp(b(; )) halmaz MB minden sorát lefedi (b(; ) most az MB mátrix : oszlopát jelöli). A T -n egyenletes p eloszlás tehát nem eleme F(MB )-nek. Viszont eleme
l(E(MB ))-nek. Közvetlenül látszik ugyanis, hogy a pm 2 E(MB ) eloszlások konvergálnak p-hez m ! 1 esetén, ahol log pm = mv + (m)1, ahol v a következ® 24 hosszúságú vektor :
Könnyen adódik, hogy
v = 111
112
121 + 2222
23 32 22 25 + 25 + 25
333 + 33 35 ;
9.6. A modell lezártja ahol, mint korábban is,
85
ak` =
P5 k` q=1 aq .
Térjünk át az utolsó tartalmazási relá ióra,
n = 4-et még mindig rögzítve.
A 2.2. Tétel fényében azt kell belátnunk, hogy
XML \ XML0
% XM : B
Ezt pedig már tudjuk, hiszen mind a három nemnegatív varietásra meghatároztuk már a rajtuk zérus polinomok ideáljának bázisát. Könny¶ felírni például olyan eloszlást, mely az
IML -t
és
IML0 -t
generáló összesen tíz má-
sodfokú polinomot kielégíti, de a (36)-beli els® negyedfokú polinomot nem (mely az
IMB
ideál eleme). Egy ilyen eloszlás az alábbi permutá iókból álló
Z4 S4 halmazon egyenletes eloszlás :
1324; 2341; 2431; 3241; 3124; 4231; 4123:
(38)
n > 4, akkor rögzítsünk egy tetsz®leges permutá iót az 5; : : : ; n egészeken. Nézzük az els® bizonyítandó relá iót ! A Tn = T4 = f(; ) : : 2 T4 g halmazon egyenletes eloszlás nem eleme F(MB )-nek, mivel a Tn -et tartalmazó legsz¶kebb MB -megvalósítható halmaz az S4 = f(; ) : 2 2 S4g permutá iókból áll. Vegyük ugyanis észre, hogy a k; ` 4 esetben Ha most
fj(k`)j : 2 Tng = fj(k`)j : 2 S4 g; míg ha
k
vagy
`
nagyobb négynél, akkor a
j(k`)j statisztika konstans az
S4 halmazon (ahol a konstans függ -tól)
j(k`)j = (k; `; ) 8 2 S4 ; Másrészt megmutatjuk, hogy a
Tn -en
ha
k > 4 vagy ` > 4: (E(MB ))-
egyenletes eloszlás eleme l
nek. Legyen
vn = 111
112
121 + 2222
ahol a vektorok koordinátái most az
23 32 22 25 + 25 + 25
333 + 33 35 ;
Sn -beli permutá iókkal vannak indexel-
9. DUPLÁN L-FELBONTHATÓSÁG
86
ve. Minden
2 S4 -re vn (; ) = v4(). Ha most k; ` > 4, akkor deniáljuk
a
wnk` = 1 k` ak` (;);qk` (;)
2 S4 tetsz®legesen választható, ett®l nem függ a wnk` dení iója. Ezek a vektorok tehát nullák az S4 -beli koordinátákon, de minden k` más 2 Sn -re van legalább egy olyan k; ` pár, hogy wn () = 1. Ha tehát pm az az E(MB )-beli eloszlás, melyre vektorokat, ahol
log pm = m(vn
X k;`>4
wnk`) + (m)1;
elég nagy, akkor pm a Tn -en egyenletes eloszláshoz tart. Nézzük a másik bizonyítandó állítást. Legyen most Zn = Z4 . A 9.13. Lemma (i) része szerint a Zn -en egyenletes eloszlás duplán L-felbontható. Megmutatjuk azonban, hogy nem eleme a l(E(MB )) saládnak. Tegyük ugyanis fel, hogy eleme. Ekkor lenne hozzá tartó qm 2 E(MB ) részsorozat, melynek S4 -re való -megszorítása, pm , a 9.13. Lemma (ii) része miatt benne lenne E(MB )-ben n = 4-re. A pm sorozat viszont a Z4 -en egyenletes eloszlásés
hoz tart, ami ellentmondás.
9.15. Következmény. L \ L0 nem torikus modell, így nem is exponen iális
salád lezártja. Az
L \ L0
metszet pontos leírásával nem rendelkezünk.
Megmutattuk, hogy az
F(MB )
torikus modell nem zárt, van azonban
max reprezentá ió (MB kiegészítve néhány sorral), melyre olyan maximális MB F(M max ) már zárt. A 4ti2 program somaggal kiszámoltunk egy ilyen maxiB
32 sorból álló 0 1 mátrixot kaptunk, melyb®l 24 k` sor aq alakú volt valamilyen k; `; a; q négyesre. A 8 új sor mindegyike nyol 1-est tartalmazott, az egyik sor például pontosan a (37)-beli permutá iókon
mális reprezentá iót. Egy
volt nulla. Ez a maximális reprezentá ió is bizonyítja, hogy a (38)-beli per-
(E(MB ))
mutá iókon egyenletes eloszlás nin s a l halmaz nem az
M max -megvalósítható, B
(1423) permutá iót.
saládban, mivel a (38)
sak akkor válik azzá, ha hozzávesszük
9.6. A modell lezártja
B = L
A
\ L0
87
salád nyilván jellemezhet® az
L
és az
L0
saládokat
jellemz® feltételes függetlenségi relá iók összességével. E szakasz végén egy másik, szimmetrikusabb jellemzést is adunk. Minden
2 Sn permutá ióra
Æ = f(i; (i)) : 1 i ng a -hez tartozó bástyaelrendezést az [n℄ [n℄ négyzetben (azaz a sakktábla-reprezentá iót). Továbbá jelölje Pr1 (illetve Pr2 ) [n℄ [n℄-ben az els® (illetve második) koordinátára való vetítést, azaz tetsz®leges Æ [n℄ [n℄ részhalmazra
jelölje
Pr
1 (Æ ) = fi 2 [n℄ : 9j
2 [n℄ melyre (i; j ) 2 Æg:
9.16. Dení ió. Legyen véletlen permutá ió, D és R pedig d és r osztályú partí iói [n℄-nek. Azt mondjuk, hogy majdnem független növekmény¶ D R-en, ha a
Æ \ (Di Rj ); 1 i d; 1 j r
véletlen ponthalmazok feltételesen függetlenek, ha a Pr1 (Æ \ (Di Rj )); Pr2 (Æ \ (Di Rj ));
1 i d; 1 j r
vetületek mind ismertek.
9.17. Tétel. A véletlen permutá ió akkor és sak akkor duplán L-felbontható, ha majdnem független növekmény¶ minden olyan D R-en, ahol D; R intervallum-partí iók (azaz minden elemük intervallum). Bizonyítás.
Az egyik irány triviális : a duplán L-felbonthatósághoz elég
olyan partí ió-párokra tudni a feltételes függetlenségeket, ahol az egyik partí-
duplán L-felbontható. Az \ (Di [n℄) (1 i d) ponthalma 1i = Pr2 (Æ \ (Di [n℄)) (1 i d)
ió triviális. A másik irányhoz tegyük fel, hogy L-felbonthatóság miatt a
1 = Æ i
zok feltételesen függetlenek, ha az
vetületek ismertek. A feltételes függetlenség megmarad, ha a feltételbe az
2j = Pr1 (Æ \ ([n℄ Rj )) (1 j r) vetületeket is bevesszük, hiszen ezek a
1 változók értékét egyesével korlátozzák. Beláttuk tehát, hogy a 1 változók i i 1 2 feltételesen függetlenek, ha az i ; j vetületek mind ismertek. Invertálással 2 = Æ \ ([n℄ Rj ) (1 j r) halmazokra is. kapjuk, hogy ugyanez igaz a j
9. DUPLÁN L-FELBONTHATÓSÁG
88
O O O O O O O O 5. ábra. Duplán L-felbonthatóság a sakktáblán : feltéve, hogy a téglalapokban ismerjük a rá sokat, a bástyák elhelyezkedése az egyes rá sokon független (9.17. Tétel)
Legyen
E
az
1i ; 2j
vetületek által generált
P ( = jE ) = Továbbá
ahol
ij
d Y i=1
-algebra egy atomja. Ekkor
P ( 1i = i1 jE ):
1 = (Æ \ (D R ) : 1 j i j i
= Æ \ (Di Rj ) a 2j
r );
függvénye, így kapjuk, hogy
r
Y P ( 1i = i1 jE ) = P ( j =1
és ezt kellett bizonyítani.
A tétel tartalmát az 5. ábra szemlélteti.
ij
= ij jE );
89
10. Egyéb felbonthatóságok 10.1. S-felbonthatóság Térjünk ki sit vissza az S-felbontható és duplán S-felbontható modellekre ! Ha nem szorítkozunk a szigorúan pozitív eloszlásokra, akkor a következ® dení ió t¶nik természetesnek.
10.1. Dení ió. Az Sn -en adott p eloszlás, illetve a p eloszlású véletlen permutá ió S-felbontható, ha léteznek (C ) 0 (C [n℄) paraméterek, melyekkel
p( ) =
n Y
k=1
( f1::kg); 2 Sn :
Továbbá p, illetve duplán S-felbontható, ha és 1 is S-felbontható. Az S-felbonthatóság másik megfogalmazása az, hogy a
Zk = f1::kg, k =
= 1; : : : ; n véletlen halmazok kvázi-függetlenek. Az interpretá iót a következ® tétel is segíti.
10.2. Tétel. A p szigorúan pozitív eloszlás (illetve a permutá ió) akkor és sak akkor S-felbontható, ha L-felbontható és léteznek olyan 0 (C ) > 0 (; 6= C [n℄) paraméterek, melyekre
P ((k + 1) = xj f1::kg = C ) = Bizonyítás.
Az egyik irányban, ha
0 (C [ x) : 0 y62C (C [ y )
P
(39)
p L-felbontható és (39) teljesül, akkor p
S-felbontható, mivel
p( ) =
nY1 0 ( 1::k ) 1 Pn P 0 0 j =1 (j ) k=1 y62f1::kg ( 1::k
A másik irányban, tegyük fel, hogy
f
p
f
g
g [ y) (f1::ng): 0
S-felbontható. Ekkor
p
nyilván L-fel-
10. EGYÉB FELBONTHATÓSÁGOK
90
bontható, és
P ((k + 1) = xjf1::kg = C ) = P Qn P Qk 1 Cj j =1 (Cj ) (C )(C [ x) Dj j =k+2 (C [ x [ Dj ) ; P P Qk 1 P Qn ( C ) ( C ) ( C [ y [ E ) ( C [ y ) j j y62C Cj j =1 Ej j =k+2 Cj halmazok az összes C1 ( C2 ( ( Ck 1 ( C lán ot futják be, a Dj halmazok az [n℄ n (C [ x) halmaz hasonló lán ait futják be, az Ej halmazok pedig az [n℄ n (C [ y ) lán ait futják be. Egyszer¶sítve látjuk, hogy P Qn 0 (39) teljesül a (C [ x) = (C [ x) Dj j =k+2 (C [ x [ Dj ) választással. ahol a
A fenti tétel alakja emlékeztet a Pla kett-Lu e modellre : emlékeztetünk, hogy ott
P ((k + 1) = xj f1::kg = C ) = P
x
y62C y
:
Azaz minden jelölthöz tartozik egy paraméter, és a következ® lépésben a szóbajöv®
jelöltek közül ezen
paraméterekkel arányos
valószín¶séggel
választunk. Az S-felbontható modellben viszont minden halmazhoz tartozik egy paraméter, és a következ® lépésben a szóbajöv® halmazok közül ezen paraméterekkel arányos valószín¶séggel választunk. Képzeljük el a következ® feladatot. Tegyük fel, hogy egy bizottságnak egy sapatversenyre kiküldend®
sapatot kell kiválasztani, de még nem lehet tudni, hány f®s sapat utazhat. A bizottság ezért felállít egy sorrendet, melyb®l az els® valahány jelölt alkotja majd a sapatot. A bizottság minden
C
lehetséges sapathoz hozzárendel
0 egy (C ) kívánatossági értéket. Tegyük fel, hogy a sorrend els® k
már megvan, jelölje az ® halmazukat a
k: elem x lesz, arányos
1 eleme
C . Ekkor annak a valószín¶sége, hogy
0 a (C [ x) értékkel.
Ha már a Pla kett-Lu e modellt említettük, akkor bevezethetünk egy analóg S-felbontható modellt. Tegyük fel, hogy minden jelöltnek van egy
C sapat kíváP natossága egyszer¶en a tagok paramétereinek összege, azaz (C ) = i2C i . pozitív
i
paramétere, mely a jelölt jóságát méri, és egy
10.1. S-felbonthatóság
91
Ekkor kapjuk, hogy
P
iP 2C i + x : y62C ( i2C i + y )
P ((k + 1) = xj f1::kg = C ) = P
Azaz a Pla kett-Lu e modellel ellentétben, a véletlen sorrend vége felé a jelöltek közötti különbségek sökkennek, a feltételes eloszlás a még választható jelöltek halmazán egyre egyenletesebb lesz. Ugyanúgy, mint az L-felbontható esetben, a 10.1. Dení ióból kiolvasható az az
MS
mátrix, mellyel az S-felbontható modell éppen az
F(MS )
torikus
modellel egyezik meg. Megkérdezhetjük, hogy ez a torikus modell zárt-e, illetve kiszámíthatjuk Markov bázisát.
n = 3-ra
mind az S-felbonthatóság,
mind a duplán S-felbonthatóság lényegében a kvázi-függetlenséggel ekvivalens, tehát nem annyira érdekes. Az
n=4
esetben a 4ti2 programmal a maximális reprezentá iót kiszá-
molva adódik az eredmény, hogy az
F(MS ) modell nem zárt. A programmal
a minimális Markov bázist kiszámolva pedig azt kapjuk, hogy az egyrészt az L-felbontható salád hat darab másodfokú polinomjából áll, ezen kívül pedig még
64
darab harmadfokú, és
93
darab negyedfokú polinom is van benne.
A harmadfokú polinomokat viszonylag könny¶ jellemezni. Minden legyen
Ci; Ci; Ci 1
2
3
i 2 [4℄-re
[4℄ az i-t tartalmazó három darab kételem¶ részhalmaz,
D1i ; D2i ; D3i [4℄ pedig az i-t tartalmazó három darab három elem¶ részhalmaz. Az S4 gráfja erre a hat sú sra megszorítva hat élt tartalmaz, mely két darab teljes párosítás uniója. Ha j = 1;2;3-ra választunk egy-egy tetsz®leges Cji -hez vezet® utat a gráfban, akkor a polinom egyik tagjában az egyik teljes párosításon megyünk tovább, a másik tagban a másikon. Például i = 1-re i a Cj halmazok : f1;2g; f1;3g; f1;4g, válasszuk hozzájuk az 12; 31; 41 utakat. Ebb®l a bázisbeli polinom :
x1234 x3142 x4123
x1243 x3124 x4132 :
4 8 = 32 polinomot kaptunk. A másik 32 pedig úgy kapható, hogy minden x változó indexébe helyett annak megfordítottját írjuk, azaz pl.
Ezzel
10. EGYÉB FELBONTHATÓSÁGOK
92
az el®z® polinomból
x4321 x2413 x3214
x3421 x4213 x2314
lesz. A negyedfokú bázispolinomok hasonlóak : az összes kételem¶ részhalmaz
A), és annak komplementerét, jelölje a fA;Ag (1 j 4). A D halmazok maradék négy kételem¶ részhalmazt Cj j pedig legyenek a háromelem¶ részhalmazok (1 j 4). Az S4 gráfja erre
közül hagyjunk el egyet (legyen ez
a nyol sú sra megszorítva egy nyol hosszúságú kör. Ha választunk egyegy tetsz®leges
CjfA;Ag -hez
vezet® utat a gráfban, akkor a polinom mindkét
tagjában a kör négy nem-szomszédos élén megyünk tovább. Az el®z® példánál maradva, ha az
13; 41; 32; 24 utakat választjuk, akkor a polinom
x1342 x4123 x3214 x2431 Ez összesen
x1324 x4132 x3241 x2413 :
3 16 = 48 polinom, megfordítva még 48 polinomot kapunk, ami
96 negyedfokú polinom. Az így kapott bázis azonban nem minimális. Válasszunk megint egy kételem¶ A halmazt, és S4 gráfjából hagyjuk el az A; A sú sokat. Tekintsük most azokat a mintákat, melyekre a maradék gráf minden C (0 < jC j < 4) sú sán pontosan egy mintaelem halad át. Ilyen összesen
mintából négy darab van, melyeket a felsorolt báziselemek egy körré kap solnak össze. A Markov bázis akkor lesz minimális, ha e négy báziselemb®l egyet (méghozzá bármelyiket) elhagyjuk. Mivel három kivonva kapjuk, hogy a minimális bázisban
A; A pár van, a 96-ból 3-at
93 negyedfokú polinom szerepel.
Hasonló eredményeket kapunk a duplán S-felbontható eloszlások esetére is. Itt is mint a duplán L-felbontható esetben három modell különül el : legsz¶kebb a torikus modell, ennél b®vebb annak lezártja, legb®vebb pedig a 10.1. Dení ió modellje. Szinte biztos, hogy kevés er®feszítéssel pre ízen lehetne bizonyítani a 9.14. Tételnek megfelel® eredményt erre a három modellre is. Mindenesetre
n = 4-re
a 4ti2 programmal kiszámoltuk, hogy a
torikus modell nem zárt. A minimális Markov bázis egyrészt a duplán L-felbontható salád tíz darab másodfokú polinomjából áll. Ezen kívül tartalmaz még
104
darab harmadfokú, és
33
darab negyedfokú polinomot is. A ne-
10.1. S-felbonthatóság
93
gyedfokú polinomok mindegyike az S-felbontható salád Markov bázisából, valamint azok invertáltjaiból származik, és a harmadfokú polinomok többsége is ilyen. Összesen
8 darab új harmadfokú polinom van, egyikük :
x2341 x3412 x4123
x2413 x3142 x4321 :
Ez a nyol új polinom is egyetlen orbitot alkot ugyanabban az értelemben, mint a duplán L-felbontható salád esetében. Az S-felbontható modell egy (nem minimális) Markov bázisa általános
n-
re is megadható. Tartalmazza az L-felbontható modell Markov lépéseit, plusz olyan polinomokat, melyekben a permutá iókat egy alternáló kör mentén átkötjük. A kérdés feltehet® általános forrás-nyel® gráfok esetében is, amenynyiben a forrás-nyel® utak valószín¶sége az út sú saiban ül® paraméterek szorzata. Most azonban a bizonyítás nem megy át erre az esetre teljes általánosságban.
10.3. Tétel. Jelölje Gn az Sn gráfját. A gráf k. szintje álljon azokból a C [n℄ sú sokból, melyekre jC j = k. Legyen K a Gn gráfban egy olyan (páros hosszú) kör, melynek minden sú sa a k: vagy a (k + 1): szinthez tartozik valamilyen 1 k n 2-re. Jelölje a K kör egymás utáni sú sait C1 ; D1 ; C2 ; D2 ; : : : ; Cj ; Dj , ahol a Ci sú sok a k:, a Di sú sok a (k + 1): szinten vannak. Legyenek még i 2 SCi a Ci halmazok elemeinek permutá iói, és i 2 S[n℄nDi az [n℄ n Di halmazok elemeinek permutá iói. Minden ilyen választásra készítsük el a j Y i=1
x(i ;Di nCi ;i )
j Y i=1
x(i ;Di nCi ;i ) 1
polinomot, ahol D0 = Dj és 0 = j . Ekkor a együttesen generálják az IMS ideált.
Bizonyítás.
(40)
1
(19)
és a
(40)
polinomok
Megmutatjuk, hogy a mondott polinomokhoz tartozó Markov
u és v gyakoriságvektor összeköthet®, melyekre a Gn gráf minden sú sán ugyanannyi permutá ió megy át. Az u gyako0 riságvektorból elindulva, elég a (40) lépések segítségével egy olyan u gyakolépésekkel tetsz®leges két olyan
10. EGYÉB FELBONTHATÓSÁGOK
94
riságvektorba eljutni, hogy a megy át
u0
és
v
Gn
gráf minden élén ugyanannyi permutá ió
szerint. Hiszen ekkor már tudjuk, hogy
u0 -b®l
elérhet®
v
a (19) lépések felhasználásával.
0: és 1: szintek közötti éleken ugyanannyi permutá ió megy át u és v szerint. Tegyük fel, hogy eljutottunk egy olyan uk vektorba, hogy a (j 1): és j: szintek közötti éleken ugyanannyi permutá ió megy át uk és v szerint minden j k-ra. Nézzük most a k: és (k + 1). szintek közötti Azt tudjuk, hogy a
éleket ! Ehhez készítsünk el egy-egy
n k
n k+1
méret¶ kontingen iatáblát
uk -ra és v -re. A táblák sorait indexeljük az [n℄ alaphalmaz k elem¶ részhalmazaival, oszlopait pedig a k + 1 elem¶ részhalmazokkal. A (C; D ) ellába pedig írjuk be, hogy hány permutá ió megy át a C ! D élen az adott gyakoriságvektor szerint. A feltevés szerint e két tábla marginálisai megegyeznek. A tábláknak minden olyan
(C; D) ellája strukturális nulla, melyre C
6 D.
Szeren sére a strukturális nullákkal rendelkez®, rögzített marginálisú kétdimenziós kontingen iatáblák Markov bázisa is ismert (pl. Dia onis és Sturmfels [32℄, Remark 3.4). Ezeket a kontingen iatábla-báziselemeket lehet most is a permutá iókra átvinni úgy, hogy a korábbi élek elégséges statisztikáját ne rontsuk el, pont ugyanúgy, mint a 8.4. Tétel bizonyításában. Ebb®l következik az állítás.
10.2. Bal-jobb szorzások hatása a modellekre Egy
A és B halmaz közötti véletlen párosítást leíró véletlen permutá ió
L-felbonthatósága függhet attól, hogy a halmazok elemeit hogyan számozzuk. Tegyük fel, hogy valamely számozás ( ímkézés) mellett a permutá ió
0 ,
0 (k) az A-beli k- ímkéj¶ elem B -beli párjának ímkéje. Cseréljük most minden i 2 [n℄-re az A-beli i ímkét (i)-re, ahol 2 Sn , és a B -beli i ímkét (i)-re, ahol 2 Sn . Az új ímkézéssel az eredeti párosítást a 1 permutá ió 1 összefüggés áll fenn. Ezért írja le. A két permutá ió között a 1 = 0 azaz
az eloszlásukra
p0 ( ) = P (0 = ) = P (1 = 1 ) = p1 ( 1 ):
10.2. Bal-jobb szorzások hatása a modellekre
95
Ebben a szakaszban azt vizsgáljuk, hogy az L-felbonthatóság meg®rz®dik-e ilyen átszámozások során. Korábban már elmondtuk, hogy mikor nevezünk egy eloszlás saládot in-
: Sn ! Sn köl sönösen egyértelm¶ transzformá ióra nézve. Vezessünk be néhány ilyen transzformá iót ! Minden 2 Sn -re legyen Æ : : 7! , illetve Æ : 7! a -val való jobbról, illetve balról szorzás. Jelölje (12) az 1-et és 2-t fel serél® permutá iót (inverziót), és r a megfordító permutá iót, azaz melyre r (k ) = n + 1 k. Az e szakasz elején vizsgált véletlen párosítások esetében az A; B halmavariánsnak egy
zoknak lehet, hogy van természetes számozása, de lehet, hogy a számok sak
ímkék, melyeknek értéke semmiféle jelentést nem hordoz. A sorbarendezések esetében azonban a sorban elfoglalt egymás utáni helyek számozása adott, és sak a sorbarendezett objektumok számozása variálható. Az L-felbonthatóság dení iójából azonnal látszik, hogy egy ilyen véletlen sorbarendezés L-felbonthatósága nem függ az objektumok számozásától. Ezt úgy is megfogalmazhatjuk, hogy az L-felbontható eloszlás salád invariáns a
Æ
ímke-invariáns,
azaz
balról szorzásokra. Az invertálva L-felbontható salád en-
nek megfelel®en a jobbról szorzásokra invariáns. Bár azt mondtuk, hogy a sorbarendezési szituá ióban nem variáljuk a sorrend helyeit, matematikailag értelmes kérdés, hogy az L-felbontható salád invariáns-e a jobbról szorzásokra. Különösen érdekelhet minket a sorrend helyeinek megfordítása, azaz amikor az objektumokat nem a legjobbtól a legrosszabbig rakjuk sorba, hanem fordítva, a legrosszabbtól a legjobbig. Ha egy sorbarendezési modell invariáns erre a transzformá ióra, azaz a modell
Ær
jobbról szorzásra, akkor a
megfordítható. A ímke-invarian ia és a megfordíthatóság teljesülését
Crit hlow et al. [15℄ számos modellre ellen®rizte. A következ® tétel azt mondja ki, hogy az L-felbontható salád megfordítható, és ezen kívül lényegében
sak egy másik jobbról szorzásra invariáns.
10.4. Tétel. Legyen n 4. Az L salád az összes Æ balról szorzásra invariáns. A jobbról szorzások közül pontosan azokra a Æ transzformá iókra invariáns, ahol eleme a r és (12) által generált nyol elem¶ soportnak.
10. EGYÉB FELBONTHATÓSÁGOK
96
Bizonyítás.
pÆr ( ) =
A balról szorzások esete triviális. A
nY1 k=0
( (n k); fn
r (x; C ) = (x; C n x),
ahol
k + 1::ng) =
Ær
nY1 j =0
esetben
r ( (j + 1); f1::j g);
ez mutatja az invarian iát. A
Æ
(12)
esetben
pedig
pÆ ( ) = ( (2); ;) ( (1); (2)) (12)
nY1 k=2
( (k + 1); f1::kg) = nY1 k=0
ahol
(12) (x; C ) =
8 > < > :
1 (x; ;) (x; C ) (x; C )
(12) ( (k + 1); f1::kg);
ha ha ha
C=; jC j = 1 ; jC j 2
azaz megint készen vagyunk. Meg kell még mutatni, hogy
L
semmilyen más jobbról szorzásra nem
2 Sn -hez van olyan (szigorúan hogy pÆ nem L-felbontható. Azt
invariáns. Ehhez belátjuk, hogy minden más pozitív) duplán L-felbontható
p
eloszlás,
már tudjuk, hogy a szigorúan pozitív L-felbontható eloszlások a
p(11 ) p(21 ) = p(12 ) p(22 ) összefüggésekkel jellemezhet®k, ahol
ij , 1 i; j 2 átkeresztezett
(41)
permu-
tá iók. A tétel állításában szerepl® nyol elem¶ rész soport tagjai :
id; r ; (12) ; r (12) ; r (12) r ; (12) r ; r (12) r (12) ; (12) r (12) : Ha
nem eleme ennek a rész soportnak, akkor az inverze sem, és ezért van
10.2. Bal-jobb szorzások hatása a modellekre olyan
2an
97
2, melyre
1 f1::ag 6= f1::ag; fn a + 1::ng: Rögzítsünk egy ilyen
a-t. Van tehát ; e 2 f1::ag és d; f
62 f1::ag, melyekre
= 1 ( ) > 1 (d) = d ; e = 1 (e) < 1 (f ) = f : ; ; számokra azt mondjuk, hogy elválasztja -t és -t, ha < < vagy > > . Ha most d f , akkor d (és f is) elválasztja -ot és e ot. Ha pedig d < f , akkor vagy valamelyikük elválasztja -ot és e -ot, vagy
(és e is) elválasztja d -ot és f -ot. Ezért a következ® két eset valamelyike Az
teljesül :
1: 2:
9 ; e 2 f1::ag; d 62 f1::ag : d elválasztja -ot és e-ot 9 2 f1::ag; d; f 62 f1::ag : elválasztja d-ot és f -ot
A két eset ugyanúgy kezelhet®, a bizonyítást az els®re részletezzük. Legyen
62 f1::ag, f 6= d tetsz®leges, és f = 1(f ). Emlékezzünk vissza a (32) d d dení ióra, és legyen p = (d ) expfd 5 g, ez egy pozitív duplán L-felbontf
ható eloszlás. Legyen kapjuk :
11 = 1 ,
melyb®l
22 -t
két pár elem fel serélésével
22 ( ) = e ; 22 (e) = ; 22 (d) = f ; 22 (f ) = d :
21 a-nál átkeresztezett permutá iókat. Megmutatjuk, hogy erre a négy permutá ióra pÆ nem elégíti ki a (41) egyenletet. Egyrészt d d ugyanis 11 = id, melyre d 5 (id) = 1. Másrészt viszont a 12 és 21 d d koordinátákon d 5 nullát vesz fel, mivel 12 -nak d nem xpontja, és 21 els® d koordinátája között van d -nál nagyobb. Ezzel bizonyításunk teljes. Készítsük el a
12
és
Végül megjegyezzük, hogy az S-felbontható eloszlás salád is rendelkezik a 10.4. Tételben megfogalmazott invarian iákkal, és valószín¶leg be lehet bizonyítani, hogy sak azokkal.
10. EGYÉB FELBONTHATÓSÁGOK
98
10.3. Teljesen L-felbontható eloszlások Ebben a szakaszban karakterizáljuk a teljesen L-felbontható (TL-felbontható) pozitív eloszlásokat : ezek azok a
p
Sn -en, melyekre a pÆ 2 Sn -re. Másképpen, a
eloszlások
jobbról szorzott eloszlás L-felbontható minden
TL-felbontható eloszlások pontosan azok, melyek majdnem független növek-
D R szorzatpartí ión. Megint sak az n 4 eset az érdekes. Belátjuk, hogy ekkor minden szi-
mény¶ek minden
gorúan pozitív TL-felbontható eloszlás kvázi-független, azaz léteznek
1 i; x n paraméterek, melyekkel
p( ) =
n Y i=1
i ( (i))
8 2 Sn:
i (x),
(42)
10.5. Tétel. Legyen n 4. Az Sn -en adott szigorúan pozitív p eloszlás akkor és sak akkor TL-felbontható, ha kvázi-független, azaz (42) alakú.
n = 3-ra nem igaz, hiszen ekkor minden eloszlás TL-felbontható, míg ismert, hogy S3 -on a kvázi függetlenséget a
A 10.5. Tétel
p(123)p(231)p(312) = p(132)p(321)p(213) egyenl®ség karakterizálja. Ebb®l kapjuk, hogy a 10.5. Tétel nem marad igaz, ha a pozitivitás feltételét elhagyjuk.
10.6. Példa. a
f4; : : : ; ng
következ®
Legyen
számok
p eloszlást :
n 4, és legyen q tetsz®leges eloszlás S3 -on. Rögzítsük egy tetsz®leges permutá ióját. Deniáljuk Sn -en a (
p( ) =
q () 0
ha
= (; )
egyébként,
(; ), mint eddig, a két permutá ió egymás után írását jelöli. Ekkor p TL-felbontható, de nem kvázi független, ha sak q nem az.
ahol
A 10.5. Tétel egyik iránya triviális : könny¶ látni, hogy minden kvázifüggetlen eloszlás TL-felbontható. A másik irányt lemmák sorozatán keresztül
10.3. Teljesen L-felbontható eloszlások
99
bizonyítjuk.
10.7. Lemma. Legyen p szigorúan pozitív TL-felbontható eloszlás Sn -en. Ekkor vannak olyan dij (x; y ) paraméterek (ahol 1 i < j n és 1 x < < y n), melyekkel
p( )=p( ) = dij (x; y );
(43)
ha (i) = x, (j ) = y , (i) = y , (j ) = x, és (k) = (k) ha k 6= i; j .
; a lemmában szerepl® permutá iók. Meg kell mutatnunk, hogy a p( )=p( ) hányados sak az i; j; x; y négyest®l függ. A TLBizonyítás.
Legyenek
felbonthatóságot felhasználva kapjuk, hogy
p( ) = pi (x) pj ji (y jx) pk ;:::;kn ji;j ( (k1 ); : : : ; (kn 2)jfx; y g); 1
ahol
k1 ; : : : ; kn 2
az
[n℄ n fi; j g
halmaz tetsz®leges felsorolása, és az utolsó
feltételes valószín¶ség feltételében bonthatóság miatt.
2
x; y
helyett
fx; yg-t írhattunk a TL-fel-
p( )-t is ilyen alakban felírva, a hányadosra p( ) pi (x)pj ji (y jx) = p( ) pi (y )pj ji(xjy )
adódik, azaz a lemmát bebizonyítottuk. Vegyük észre, hogy ha
p kvázi-független, akkor p( ) i (x) j (y ) = ; p( ) i (y ) j (x)
minden olyan
;
(44)
esetén, mely a 10.7. Lemma állításában szerepel. Ennek
megfordítása is igaz.
10.8. Lemma. Legyen p szigorúan pozitív eloszlás Sn -en. Tegyük fel, hogy léteznek olyan i (x) paraméterek (ahol 1 i; x n), melyekkel (44) teljesül, valahányszor (i) = x, (j ) = y , (i) = y , (j ) = x, és (k) = (k) ha k 6= i; j . Ekkor
p( ) = K
n Y i=1
i ( (i))
8 2 Sn
10. EGYÉB FELBONTHATÓSÁGOK
100
valamilyen K konstanssal.
id = (12 : : : n) az identitás permutá ió, és tegyük fel, hogy (44) teljesül. Az id permutá ióból kiindulva, jussunk el -hez transzpozí iók valamilyen sorozatával, azaz kapjuk az id = 0 , 1 ; : : :, k = Bizonyítás.
Legyen
sorozatot. A sorozat szomszédos tagjai sak egy transzpozí ióban különböznek, azaz alkalmazható rájuk a (44) összefüggés. Tehát
p( ) = p(id)
p( ) p(1 ) p(2 ) : p(id) p(1 ) p(k 1 )
A hányadosok mindegyike (44) alakú valamilyen
i; j; x; y -ra.
Rögzített
i; x
i (x) tényez® akkor szerepel egy hányados nevez®jében, ha az adott transzpozí ió x-et elmozdítja az i: pozí ióból. Hasonlóan, a i (x) tényez® párra a
akkor szerepel valamelyik hányados számlálójában, ha az adott transzpozí ió
x-et
az
i:
i; x párokra x = (i). Kapjuk
pozí ióba mozgatja. Ezek a tényez®k sak azokra az
nem ejtik ki egymást, melyekre
(i) = 6 i,
és
x=i
vagy
tehát, hogy
Q
p( ) =
i:(i)6=i i ( (i)) Q p(id) i:(i)6=i i (i)
n p (id) Y = Qn
i ( (i)): i=1 i (i) i=1
10.9. Lemma. Legyenek dij (x; y ) pozitív számok (ahol 1 1 x < y n). Akkor és sak akkor léteznek a
dij (x; y ) =
i < j n és
i (x) j (y )
i (y ) j (x)
(45)
egyenleteket kielégít® i (x) (1 i; x n) paraméterek, ha a dij (x; y ) számok kielégítik a következ® két egyenletrendszert:
dij (x; y )djk (x; y ) = dik (x; y ) dij (x; y )dij (y; z ) = dij (x; z ) Bizonyítás.
8i < j < k; x < y 8x < y < z; i < j:
(46)
A sak akkor irány triviális. Az akkor irányhoz tegyük fel,
hogy a (46) egyenletek teljesülnek. Legyen
i (x) = 1,
ha
min(i; x) = 1,
és
10.3. Teljesen L-felbontható eloszlások
i (x) = d1i (1; x),
ha
i; x > 1.
101
Könny¶ ellen®rizni, hogy ezzel a dení ióval
(45) teljesül.
A következ® lemma teljessé teszi a 10.5. Tétel bizonyítását.
10.10. Lemma. Legyen p szigorúan pozitív TL-felbontható eloszlás Sn -en, ahol n 4. Ekkor a (43) egyenlettel deniált dij (x; y ) mennyiségek kielégítik a (46) egyenletrendszereket. Bizonyítás.
Vegyük els®nek észre, hogy a TL-felbontható eloszlások salád-
ja dení ió szerint invariáns az összes Ezen túl az eloszlás salád invariáns
Æ jobb- és az összes Æ bal-szorzásra. 1 invertálásra is. Ezért a 1 : 7!
elég a
d12 (1;2)d23 (1;2) = d13 (1;2)
(47)
egyenl®séget belátni. A (46) els® sorának többi egyenlete bal- és jobbszorzásokkal következik ebb®l, míg a (46) második sorának egyenletei invertálással adódnak. A (47) egyenl®séget kiírva, bizonyítandó a
p(123 0 )p(231 0)p(312 0 ) = p(132 0 )p(321 0)p(213 0 )
(48)
0 a 4; : : : ; n egészek tetsz®legesen rögzített permutá iója. a q ( ) = log p( ) jelölést. A pozitív TL-felbontható eloszlások
egyenl®ség, ahol Vezessük be
logaritmusai abban a lineáris altérben ülnek, melyet a különböz® permutált L-felbonthatóságokat kifejez® lineáris feltételek jelölnek ki. Azt kell belátni, hogy a (48) egyenlet logaritmusaként kapott lineáris feltétel a korábbi lineáris feltételek következménye. Most pontosan megadjuk, hogy mely lineáris feltételekb®l vezethet® le (48) logaritmusa. Megjegyezzük, hogy az
n = 4-re. Válasszuk 0 -t olyannak, 0 hogy els® eleme 4, azaz = (4; ), ahol az 5; : : : ; n egészek permutá iója. A TL-felbonthatóság miatt q -ra teljesülnek a 7. táblázatban felsorolt
alábbi levezetést a számítógép adta,
egyenl®ségek. Az els® három összefüggés például abból következik, hogy a
((2); (3); (5); : : :)
((1); (4)) koordinátákismert a f(1); (4)g halmaz.
koordináták függetlenek a
tól (ezeket vastagon jelöltük), feltéve, hogy
A többi összefüggés hasonlóan következik, vastaggal jelöltük, hogy mely
10. EGYÉB FELBONTHATÓSÁGOK
102
7. táblázat. Egy TL-felbontható eloszlás
q logaritmusára teljesül®
összefüggések
q (3412 ) q (3241 ) q (2431 ) q (4312 ) q (2341 ) q (4231 ) q (1432 ) q (4231 ) q (3421 ) 2q (3124 ) 2q (2314 ) 2q (1234 )
+ q (2143 ) + q (1423 ) + q (1342 ) + q (1243 ) + q (4123 ) + q (3142 ) + q (4123 ) + q (2413 ) + q (4312 ) + 2q (4213 ) + 2q (4132 ) + 2q (4321 )
q (3142 ) q (3421 ) q (2341 ) q (1342 ) q (4321 ) q (3241 ) q (4132 ) q (2431 ) q (4321 ) 2q (3214 ) 2q (2134 ) 2q (1324 )
q (2413 ) q (1243 ) q (1432 ) q (4213 ) q (2143 ) q (4132 ) q (1423 ) q (4213 ) q (3412 ) 2q (4123 ) 2q (4312 ) 2q (4231 )
= = = = = = = = = = = =
0 0 0 0 0 0 0 0 0 0 0 0
koordináta-részhalmazok feltételes függetlenségét használjuk. A 7. táblázat sorait összeadva, majd kett®vel osztva kapjuk a kívánt
q (3124 ) + q (2314 ) + q (1234 ) q (3214 ) q (2134 ) q (1324 ) = 0 egyenl®séget.
Megkérdezhetjük,
hogy
melyek
azok
a
szigorúan
pozitív eloszlások,
melyek teljesen S-felbonthatók (TS-felbonthatók). Egy ilyen eloszlás TLfelbontható is, azaz a 10.5. Tétel szerint kvázi-független. Azonban könnyen látszik, hogy a kvázi-független eloszlások S-felbonthatók, mert kielégítik a 10.3. Tételben szerepl® polinomokat. Emiatt persze TS-felbonthatók is, hiszen tetsz®leges jobbról szorzottjuk is kvázi-független. Azaz azt kaptuk, hogy a szigorúan pozitív eloszlások körében a TL-felbonthatóság és a TS-felbonthatóság ekvivalens fogalmak. Természetesen a kvázi-független eloszlások duplán S-felbonthatók is. Az, hogy a kvázi-független eloszlások duplán S-felbonthatók, közvetlenül is látszik : ezen eloszlások logaritmusai a 9.11. Tétel bizonyításában bevezetett
v k`
vektorok lineáris kombiná iói. Szintén e tétel
10.4. Hierar hikus modellek metszete
103
bizonyítása során megmutattuk, hogy a torok lineáris kombiná ióiként. Végül a
v k`
ak`
vektorok felírhatók a
ak`
vek-
vektorok a duplán S-felbontható
modellhez tartozó altér elemei.
10.4. Hierar hikus modellek metszete Tegyük fel, hogy van két (szigorúan pozitív) hierar hikus modellünk :
L1 = L(P1; : : : ; Ps); L2 = L(R1 ; : : : ; Rt): Legyen
Dij a Pi és az Rj partí iók közös durvítása. Ekkor triviálisan L(Dij : 1 i s; 1 j t) L1 \ L2:
(49)
A 9.7. Következmény egy olyan esetr®l szól, amikor a fenti tartalmazás egyenl®séggel teljesül. Az egyik kérdés, melyre nem tudjuk a választ, hogy mindig igaz-e, hogy a (49) egyenlet baloldalán álló
L3
hierar hikus modell a leg-
b®vebb olyan hierar hikus modell, melyet a metszet tartalmaz. Egy másik kérdés, hogy az
L1 \ L2
metszet, mint exponen iális salád, megadható-e
nulla-egy mátrixszal, azaz van-e olyan supa
0
1
elem¶
M
L1 \ L2 = E(M ). Sajnos erre a kérdésre sem tudjuk a választ.
mátrix, hogy
Egy viszonylag kis méret¶ esetben a következ®képpen járhatunk el. Jelöl-
Li elemeinek logaritmusai által kifeszített alteret Vi R n! , i = 1;2;3. Két kérdésünk van tehát : 1) Teljesül-e, hogy V1 \ V2 = V3 ? 2) Ha nem, akkor van-e a V1 \ V2 altérnek indikátor vektorokból álló bázisa ? Az els® kérdés
je az
megválaszolásához elég az alterek dimenzióját kiszámolni. A második kérdés megválaszolásához pedig meg kell keresni a
V1 \ V2 altér összes indikátorvek-
torát. Ez utóbbi feladatot könnyítheti meg a következ® tétel.
10.11. Tétel. Legyen M olyan 0 1 mátrix, melyre az F(M ) torikus modell zárt. Ekkor M > képterének minden indikátorvektora el®áll, mint M néhány sorának összege. Bizonyítás. Jelölje M > képterét V , emlékeztetünk, hogy mindig feltesszük, hogy 1 2 V . Legyen v 2 V indikátorvektor, jelölje S = Supp(v ) a v vektor
10. EGYÉB FELBONTHATÓSÁGOK
104
S az S halmaz komplementere. El®ször megmutatjuk, hogy az S halmaz M -megvalósítható. Jelölje ugyanis M azt a mátrixot, melyet M -b®l úgy kapunk, hogy hozzávesszük a v vektort utolsó, (t + 1). sorként. Ekkor nyilván l(F(M )) = l(F(M )). A t+1 = 0, k 6= 0 (1 k t) paraméterválasztással a (2) egyenlet szerint el®állított p 2 F(M ) eloszlásra Supp(p ) = Supp(v ). Ha F(M ) zárt, akkor p 2 F(M ), amib®l a 2.2. Tétel szerint kapjuk, hogy Supp(p ) M -megvalósítható. Jelölje az M mátrix sorait v1 ; : : : ; vt . Azt kell belátnunk, hogy v = P = k2K vk alakú. Vezessük be a T (S ) = [b2S Supp(mb ) jelölést. Mivel az S halmaz M -megvalósítható, minden a 62 S -re Supp(ma ) ( T (S ). Átfogalmazva, minden a 2 S -re van olyan k 2 Supp(ma ), melyre k 2 T (S ) n T (S ). Másrészt, minden k 2 T (S ) n T (S )-re teljesül, hogy Supp(vk ) S = Supp(v ). P A v = 0 eset nem érdekes, hiszen akkor v = k2; vk . Minden más esetben S 6= ;, azaz a fentiek szerint van olyan k , hogy v vk is indikátorvektor, melynek kevesebb 1-es koordinátája van, mint v -nek. Innen induk ióval k kapjuk, hogy v felbontható v -k összegére. (S®t, vegyük észre, hogy az is tartóját, és legyen
elérhet®, hogy mindig az els® nem-nulla koordinátát nullázzuk ki.)
Ha tehát az akkor az összes
L1
modellhez tartozó
V1 -beli
indikátorvektor az
tartójú sorának összege. Ha
M1
M1
F( M 1 )
mátrix olyan, hogy
M1
F(M1 )
zárt,
mátrix valahány, diszjunkt
nem zárt, akkor pedig meg kell keresni
maximális reprezentá ióját. Az is egy nyitott kérdés, hogy az általunk
vizsgált mátrixok maximális reprezentá iója mindig
10.12. Példa.
0 1 mátrix-e.
Korábban szóltunk már a duplán L-felbontható modell
maximális reprezentá iójáról az
n = 4
esetben. Ennek
24
MBmax
sora bizonyos
vastag kereszteknek felel meg. Nyilvánvaló, hogy minden vastag kereszt indikátorvektora felírható, mint az
ML mátrix néhány sorának összege. A 10.11.
Tétel szerint ezzel a tulajdonsággal a maradék nyol sor is rendelkezik. Említettük, hogy az egyik extra sor éppen a (37) halmaz komplementerének indikátorvektora. A
v
v vektor az ML mátrix következ® (x; C ) párokkal indexelt
sorainak összege :
(1; f3g); (4; f2g); (3; f1;4g); (1; f2;3g):
10.4. Hierar hikus modellek metszete Természetesen a
v
105
indikátorvektorunkat az
ML0
mátrix néhány sorának
összegeként is fel kell tudni írni : ebben az esetben ugyanezeket a sorokat kell összeadni, mivel a (37) halmaz komplementere öninverz.
10.13. Példa.
Legyen
modellt, ahol
és
= (1324).
n = 4,
vizsgáljuk meg az
M = E(ML ) \ E(ML)
E(ML ) = fpÆ : p 2 E(ML )g; Tehát két egyszer¶ hierar hikus modell metszetére vagyunk
kíván siak. A (49) képlet szerinti, a közös durvításoknak megfelel® hierar hikus modell könnyen láthatóan a kvázi-függeten exponen iális saláddal egyezik meg, melynek szabad paraméterszáma menziója
10).
Ezzel szemben az
9
(a hozzá tartozó altér di-
M modell szabad paraméterszáma 12, a hozzá tartozó
altér dimenziója pedig
13. Tehát a (49) egyenletben szigorú tartalmazás van.
A metszet altérben van indikátorvektorokból álló bázis, például a követke-
65 vektor kifeszíti a teret. A vektorok között szerepel természetesen az 1, a maradék 64 pedig négy darab 16 elem¶ osztályba sorolható. Ezek a vektorok a 10.11. Tételnek megfelel®en mind az ML mátrix néhány sorának összegeként állnak el®. Mind a 64 nulla-egy vektor ML három sorának összege. A négy
soport leírásában fi; j; k; `g = f1; 2; 3; 4g valamilyen sorrendben. Könnyen ellen®rizhet®, hogy az alábbi négy osztály mindegyike 16 vektort deniál. Azt adjuk meg, hogy a metszetbeli indikátorvektor az ML mátrix melyik (x; C ) z®
párokkal indexelt sorainak összege :
1: 2: 3: 4:
(i; fj g) (i; fkg) (j; fig) (k; fig) (j; fig) (`; fi; kg) (j; fig) (i; fj; kg)
10.14. Példa. Legyen még mindig n = 4, = E(MB ) \ E(MB ) modellt, ahol
(`; fj; kg) (i; fj; kg) (k; fi; `g) (i; fj; `g)
most vizsgáljuk meg az
E(MB ) = fpÆ : p 2 E(MB )g;
M
=
10. EGYÉB FELBONTHATÓSÁGOK
106
= (1324). A M modell szabad paraméterszáma 11, a hozzá tartozó altér dimenziója pedig 12. A (49) képlet szerinti, a közös durvításoknak megfelel® és
hierar hikus modell viszont ismét a kvázi-függeten exponen iális salád. Megnéztük, hogy a kvázi-független modell mátrixához hogyan lehet még két sort hozzáadni úgy, hogy a keletkez® mátrix rangja
12
legyen. A következ® két
sor pl. megfelel :
22 32 22 33 22 32 23 v1 = 33 24 + 14 + 11 + 25 ; v2 = 24 + 14 + 11 + 11 : Itt az
MB
mátrix sorainak korábban bevezetett jelölését használtuk. Tehát
ismét azt kaptuk, hogy a két hierar hikus modell metszetének van indikátorvektorokból álló bázisa.
10.5. Ismert eloszlás saládok felbonthatósága Ebben a szakaszban megvizsgáljuk, hogy azok az eloszlás saládok, melyeket a gyakorlatban (és az irodalomban) gyakran illesztenek permutá ióadatokra, rendelkeznek-e valamilyen felbontható tulajdonsággal. Az itt szerepl® modellek többségének L-felbonthatóságát már Crit hlow et al. [15℄ is vizsgálta. A rendezett minta modellek, illetve a Thurstone modellek általában nem L-felbonthatók. Fontos kivételt képez a Pla kett-Lu e modell, amely a sorbarendezési axióma szerint L-felbontható, de általános paraméterek mellett nem duplán L-felbontható, és nem is S-felbontható. Ugyanez érvényes a Babington Smith modellre, az L-felbonthatóság a következ® felírásból látszik :
p( ) = ()
nY1
Y
i=1 y62f1::ig
(i)y :
Viszont ennek spe iális esete, a Mallows-Bradley-Terry modell, kvázi-független, így a jelen értekezésben tárgyalt összes felbonthatósággal rendelkezik. A többlép s®s helyezési modell (THM) és az ismételt beszúrások modellje (IBM) az eddigiekkel szemben duplán L-felbontható. A két modellben egy-
10.5. Ismert eloszlás saládok felbonthatósága
107
egy L-felbontás :
THM: IBM:
(x; C ) = (jC \ f1::xgj; jC j + 1); (x; C ) = (j(C [ x) \ f1::xgj; x):
A duplán L-felbonthatóság pedig a
THM: IBM:
P
log(p) = k;`;a(log (n + 1 a; k))k` a5 ; P k` log(p) = k;`;a(log (a; `))a5
felírásokból következik. Térjünk rá a távolságalapú modellekre ! Vegyük el®ször észre, hogy ha a távolság
d(; ) =
Pn k=1 k ( (k ); (k ))
alakba írható, akkor a megfelel®
távolságalapú modell kvázi-független. Ez az 1. táblázatból a Hamming,
p, és
maximum távolságokra teljesül. A maradék három esetben el®ször azt szeretnénk vizsgálni, hogy a sorrendek eloszlása L-felbontható-e, ezért az eredeti dení ióval összhangban most legyen a
sorrend
valószín¶sége
p( ) = K ( ) e A
=0
d( 1 ;0 1 ) ;
2 Sn :
(50)
paraméter mellett persze minden távolságalapú modell az egyen-
letes eloszlást adja, ami minden felbonthatósággal rendelkezik. Az viszont, hogy egy
= 6 0
távolságtól függ,
paraméter mellett az (50) eloszlás L-felbontható-e, sak a
és 0 értékét®l nem. Érvényes a következ® tétel.
10.15. Tétel. (Crit hlow et al. [15℄) A sorrendeken megadott (50) eloszlás akkor és sak akkor L-felbontható, ha a d távolság additíven felbontható (additively de omposable), azaz minden 2 k n-re léteznek olyan fk és gk függvények, melyekkel
d(; id) = fk ( (1::k
1)) + gk ( (k::n)):
Ebb®l következik, hogy a Kendall távolsághoz tartozó modell is L-felbontható, míg a Cayley és Ulam távolságokhoz tartozó modellek nem. Megjegyez-
10. EGYÉB FELBONTHATÓSÁGOK
108
zük, hogy a tétel egyszer¶en levezethet® az L-felbontható modell Markov bázisának ismeretéb®l. A Cayley-, illetve Ulam távolságon alapuló modell akkor invertálva L-felbontható adott
0 -ra, ha T (11 0 ) + T (22 0 ) = T (12 0 ) + T (21 0 )
teljesül minden keresztez®
11 ; 22
permutá ió-párra, ahol
T
az els® eset-
ben a iklusok száma, a második esetben pedig a leghosszabb monoton növ® részsorozat hossza. A Cayley távolság esetében, mivel balról is invariáns, fel-
0 = id. Ekkor, ha n = 4, akkor a 11 = (3412); 22 = (4321) választással a bal oldal 4, a jobb oldal 2 lesz, és ezt az ellenpéldát tetsz®leges n > 4-re ki lehet terjeszteni. Az Ulam távolság nem balról invariáns, ezért az invertálva L-felbonthatóság függhet a 0 választásától. Egy olyan 0 -t sem tehet®, hogy
találtunk, amely mellett a modell rendelkezne a mondott tulajdonsággal. A Kendall távolság sem balról invariáns, tehát ugyanaz vonatkozik rá, mint az Ulam távolságra. Ebben az esetben azt találtuk, hogy a modell olyan permutá iókra lesz invertálva L-felbontható, melyekre a minden
0 1 f1::kg
0
halmaz
1 k n-re intervallum, vagy 0 egy ilyen permutá ióból a r ; (12)
elemekkel való balról szorzásokkal adódik. A szakasz lezárásaként bemutatunk egy olyan távolságot, melyhez tartozó modell S-felbontható. Legyen
; 2 Sn két sorrend-vektor. Legyen
Vi (; ) = j f1::ig n f1::igj = j f1::ig n f1::igj -ben az els® i hely egyikén vannak, de -ban Pn 1 1 nem. Könny¶ látni, hogy d1 ( ; ) = 1=2 i=1 Vi (; ). Általánosabban, válasszunk i pozitív paramétereket, és legyen azon jelöltek száma, akik
dV (; ) Ez balról invariáns távolság
=
Sn -en
n X i=1
i Vi (; ):
(teljesíti a háromszög-egyenl®tlenséget),
109
és deniálható vele a
p( ) = ()e távolság-alapú modell a s®t, pl.
dV (;0 )
sorrendekre. Ez a modell nyilván S-felbontható,
0 = id esetén duplán S-felbontható.
11. APA adatsor elemzése Ebben a szakaszban egy "híres" adatsort vizsgálunk felbonthatóság szempontjából. Az adatok az Amerikai Pszi hológiai Társaság (Ameri an Psy hologi al Asso iation, APA) 1980-as elnökválasztásához kap solódnak. Az APA tagjainak minden évben öt elnökjelölt sorbaállításával kell szavazniuk. 1980ban körülbelül 15 ezren szavaztak, de ebb®l sak
5738
szavazó rangsorolta
mind az öt jelöltet (a többiek sak az általuk legjobban preferált egy, két vagy három jelöltet nevezték meg). Az érdekesség kedvéért megjegyezzük, hogy az APA a Hare-rendszer szerint jelöli ki a gy®ztest. Ha valamelyik jelölt a szavazók több, mint felét®l els® helyezést kap, akkor nyer. Ha nin s ilyen jelölt, akkor a legkevesebb els® helyezést kapott jelöltet törlik. A törölt jelöltre leadott els® helyezéseket szétosztják a maradék jelöltek között, mégpedig aszerint, hogy a törölt jelöltet els® helyre rangsoroló szavazók kit tettek a második helyre. Ha valahány jelöltet már töröltek, akkor minden szavazó rangsorából az els® nem törölt jelöltet veszik gyelembe. Az eljárást addig folytatják, amíg meg nem találják a gy®ztest. Ez egyike a számos szavazatszámlálási rendszernek, melyeknek komoly elmélete van. A Hare rendszer el®nyeit és hátrányait pl. Fishburn [34℄ elemzi. Az APA adatsor egyike a legtöbbet vizsgáltaknak, lásd például [12, 29, 48, 49, 54℄. Érdekessége, hogy viszonylag nagy az elemszáma az
5!-hoz képest,
így nem könny¶ rá jól illeszked® modellt találni. 1980-ban az 5 jelölt ABC sorrendben : W. Bevan, I. Is oe, C. Kiesler, M. Siegle, és L. Wright volt. Máris egy olyan számozást rögzítünk, amely mellett a felbontható eloszlás saládok legjobban illeszkednek :
1
Bevan
;2
;3
Kiesler
;4
Siegle
Is oe
;5
Wright
:
11. APA ADATSOR ELEMZÉSE
110
8. táblázat. APA elnökválasztás : az egyes sorrendek gyakorisága
12345 12435 12543 13245 13425 13542 14325 14235 14523 15342 15432 15243 21345 21435 21543 23145 23415 23541 24315 24135
45 102 70 24 35 48 27 30 29 52 35 51 96 172 162 35 35 28 40 74
24513 25341 25431 25143 32145 32415 32541 31245 31425 31542 34125 34215 34521 35142 35412 35241 42315 42135 42513 43215
52 43 34 87 28 35 24 28 52 53 75 51 44 133 84 67 16 34 22 23
43125 43512 41325 41235 41523 45312 45132 45213 52341 52431 52143 53241 53421 53142 54321 54231 54123 51342 51432 51243
42 45 26 40 24 50 30 31 37 22 62 29 57 107 54 26 34 63 45 44
12354 12453 12534 13254 13452 13524 14352 14253 14532 15324 15423 15234 21354 21453 21534 23154 23451 23514 24351 24153
50 95 70 17 28 35 35 28 34 40 37 36 79 186 106 36 26 30 50 82
24531 25314 25413 25134 32154 32451 32514 31254 31452 31524 34152 34251 34512 35124 35421 35214 42351 42153 42531 43251
35 38 38 45 27 22 24 21 52 34 64 24 66 61 49 54 29 30 11 19
43152 43521 41352 41253 41532 45321 45123 45231 52314 52413 52134 53214 53412 53124 54312 54213 54132 51324 51423 51234
34 46 42 30 36 50 40 25 34 30 41 31 91 71 58 24 41 35 53 40
Az adatok elemzése során több elemz® is észrevette, hogy a szavazatok az
1
APA megosztottságát tükrözik : éles választóvonal van a kutatók ( -es és
3
es jelölt) és a klinikusok ( -as és
5-ös
2-
jelölt) között, illetve egy harmadik,
4
kisebb soportot alkotnak a közösségi pszi hológusok ( -es jelölt). Nyilván a különböz® soportok nagyon más szempontok alapján szavaznak, mindenki a saját jelöltjeit részesíti el®nyben. A 8. táblázat tartalmazza a nyers adatokat : a jelöltek minden sorrendjére megadja, hogy hány szavazó választotta az adott sorrendet (a teljes szavazatot leadók közül). Miel®tt a felbontható modelleket illesztenénk, tekintsük át, hogy néhány más modell hogyan illeszkedik az adatokra ! Az eredményeket a jelöltek általunk rögzített számozásával közöljük. A nagy mintaelemszám és a szavazók heterogenitása miatt a legegyszer¶bb, legfeljebb öt paramétert tartalmazó modellek nagyon rossz illeszkedést adnak. Ennek egyik megoldása az, hogy több ilyen egyszer¶ modell keverékével próbálkozunk, és az irodalomban találunk is ilyen megközelítést. Mi most mégis inkább azokra az elemzésekre kon entrálunk, ahol egy, de bonyolultabb modellt illesztettek a kutatók. Marden [48℄ az adatokra log-lineáris modelleket illeszt. A kvázi-független
111
modell nem ad jó illeszkedést : az illeszkedést mér®, aszimptotikusan lású statisztika értéke
GOF = 973:8, szabadsági foka df = 103. Itt GOF = 2m
ahol
m a minta elemszáma, r
X 2Sn
r( ) log
2 elosz-
r ( ) ; p^( )
a tapasztalati eloszlás,
p^ pedig a ML be slés.
Marden ezután a kvázi-független modellhez egyesével vesz hozzá interak iós tagokat. Az általa legjobbnak ítélt modellben a
log p( ) =
X k;i
ki f (i) = kg +
X X
(k;`)2A i;j
sorrend valószín¶ségére
ij k` f (i) = k; (j ) = `g;
A = f(1;2); (1;4); (3;5); (4;5)g. Erre a modellre GOF = 66:82, a szabadsági fok pedig 59. ahol
Chung és Marden [12℄ az ortogonális kontrasztokra épül® hierar hikus modellt illeszti az adatokra. El®ször a kontrasztokat választja ki, egyrészt el®zetes elemzések, másrészt próbálkozás alapján. Emlékeztetünk, hogy minden kontraszt a jelöltek bizonyos részhalmazainak halmaza. A választott kontrasztok tehát :
I = (4; 1235), II = (12;35), III = (1;2)
és
IV = (3;5),
ezek éppen a kutató/klinikus/közösségi felbontásnak felelnek meg. Mivel a kontrasztok ortogonálisak, az egyes kontrasztok értékei tetsz®legesen kombinálhatók egymással, és minden kombiná ió egyértelm¶en meghatároz egy sorrendet. A kapott
5 6 2 2 méret¶
kontingen ia-táblára a legjobban
illeszked® hierar hikus modell generátorai : ha tudjuk az
I, II
fI, II, III g és fI, II, IV g, azaz
kontrasztok értékét, akkor a
feltételesen függetlenek. Az illeszkedést mér® szabadsági foka
29.
III
és
GOF
IV
kontrasztok értékei
statisztika értéke
32:78,
M Cullagh [49℄ az inverziós modelleket illesztette az APA adatokra. Az els®rend¶ (Babington Smith) modellre
GOF = 1527:9, df = 109 adódott, ami
persze nagyon rossz illeszkedést mutat. A teljes másodrend¶ modell (melyben az összes els®- és másodrend¶ inverzió szerepel) esetében adódott,
89 szabadsági fokkal. A
GOF = 246:5
paraméterek be sült értékei alapján végül
11. APA ADATSOR ELEMZÉSE
112
M Cullagh a következ® modellt javasolta az
log p( ) = 14 f (1) < (4)g + Az illeszkedés próbastatisztikája
1;2;3;4;5 jelöltek helyezéseire :
X
fj;kg
fj;kg j (j ) (k)j:
GOF = 290:5, szabadsági foka 109.
A fenti három modell közül az els® kett® valóban jó illeszkedést ad az adatokra. Közös bennük, hogy a modell szerkezetét mindkét esetben próbálkozás útján választották ki a sok lehetséges szerkezet közül, ami általában jellemz® a hierar hikus modellek illesztésénél. Mindkét modell meglehet®sen sok paramétert használ, míg a harmadik esetben kevesebb a paraméter, de az illeszkedés is sokkal rosszabb. Illesszük most a sorrendadatokra el®ször a hat "teljes" felbontható modellt : L- és S-felbonthatóból is a simát, az invertáltat, és a duplát. A sima felbonthatóságok invariánsak a balról szorzásokra (jelen esetben a jelöltek átszámozására), a jobbról szorzásokra (jelen esetben a helyezések átszámozására) viszont nem. A helyezések számozása nem sak ímkézés, hanem egy valódi rendezést tükröz, az érdekesség kedvéért mégis a sorrendek valamennyi jobbról szorzott változatára illesztettük a modelleket (ez
15
eset az ekvivalen iaosztályok miatt). "Szeren sére" a helyezések eredeti számozása adta a legjobb illeszkedést. Az invertálva felbonthatóságok esetében a helyzet éppen fordított : itt az illeszkedés jósága a jelöltek számozásától függ. Mivel a jelöltek számozása
sak ímkézés, ebben az esetben természetes megközelítés a számozások mind a
15 ekvivalen iaosztályát kipróbálni, és a legjobb illeszkedést adó számozást
elfogadni. A legjobb eredményt a már említett számozás (illetve azzal ekvivalens másik hét) adta, mind az L-, mind az S-esetben. Vegyük észre, hogy az ekvivalens számozások is három soportra osztják az öt jelöltet :
ff1;2g; f3g; f4;5gg, ez a felosztás azonban sak részben egyezik meg a kutató/ klinikus/ közösségi felosztással. A duplán felbontható esetekben mind a balról-, mind a jobbról szorzás érdekes, tehát
15 15
különböz® illesztés végezhet® el. Itt is, mind az L-,
mind az S-esetben az el®z® két bekezdésben leírt számozások adták a legjobb eredményt. (A kvázi-független modell esetén, melynek illeszkedésér®l már
113
9. táblázat. Felbontható eloszlások illeszkedése az APA adatokra Modell L-felbontható S-felbontható invertálva L-felbontható invertálva S-felbontható duplán L-felbontható duplán S-felbontható
L 49 72 62 85 75 89
2 (df ) 98:9 (70) 144:8 (93) 126:5 (70) 171:7 (93) 151:8 (89) 180:1 (99)
u 2.44 3.80 4.78 5.77 4.71 5.76
szóltunk, természetesen minden számozás ugyanazt az eredményt adja.) Az illesztések eredményét a 9. táblázatban foglaltuk össze. Az eloszlás nemparaméteres maximum likelihood be slése a tapasztalati eloszlás (telített modell), e mellett a minta log-likelihoodja
26612.
A jobb áttekinthet®ség
kedvéért a modellek log-likelihoodját ehhez az értékhez viszonyítva adjuk meg, azaz
L jelöli, hogy az egyes modellek maximális log-likelihoodja meny-
nyivel kisebb a telített modell értékénél. Megadjuk azután az illeszkedésvizs-
2 -próbájának próbastatisztikáját (2 ), ahol nem vontunk össze osztályokat, azaz 120 osztállyal dolgoztunk. Zárójelben szerepel a szabadsági fok, azaz 119 mínusz a be sült paraméterek száma. Az utolsó oszlopban a p 2 statisztika standardizáltját, az u = (2 df )= 2 df értéket t¶ntettük
gálat
fel. Látható, hogy a vizsgált modellek közül az L-felbontható modell adta a legjobb illeszkedést, erre
p = 0:013.
A modellek közül az L-felbontható illeszkedik a legjobban. Ebben az eset-
S5 gráfját mutatja, az élekre pedig a ML be slés szerinti (x; C ) = P ((k +1) = xjf1::k g = C )
ben a paraméterek ML be slését is megadjuk : a 6. ábra az
feltételes valószín¶ségeket írtuk. Ha szeretnénk jobban illeszked® modellt találni, és nem bánjuk, ha ehhez több paramétert kell használnunk, illeszthetünk korlátozottan L-felbontható modellt. Ha például a
k = 2;3-nál való felbonthatóságok közül sak a k = 2-t
tesszük fel, akkor
p( ) = P ((1::2) = (1::2))P ((3::5) = (3::5)jf1::2g = f1::2g):
11. APA ADATSOR ELEMZÉSE
114
6. ábra. Az L-felbontható ML be slés kanonikus paraméterei az APA adatra
Ennek a modellnek
69
szabad paramétere van. A be sléses illeszkedésvizs-
gálatot elvégezve kapjuk, hogy a
2
statisztika
57:98,
szabadsági foka
50.
Megjegyezzük, hogy ez a modell ekvivalens az els® két és az utolsó három koordináta kvázi-függetlenségével. Ha pedig sak a tesszük fel, akkor a
2
statisztika értéke
64:32.
k=3
felbonthatóságot
HIVATKOZÁSOK
115
Hivatkozások 4ti2 A software pa kage for algebrai , geometri and ombinatorial problems on linear spa es. Available at www.4ti2.de.
[1℄ 4ti2 team :
[2℄ Agresti, A. :
Categori al Data Analysis.
Wiley, New York (1990).
[3℄ Babington Smith, B. : Dis ussion of Professor Ross's paper.
So . Ser. B 12
J. Roy. Statist.
(1950), 153-162.
[4℄ Blo k, H. W., Chhetry, D., Fang, Z. and Sampson, A. R. : Partial orderings on permutations. In : Blo k, H. W., Sampson, A. R. and Savits, T. H. (eds.) :
Topi s in Statisti al Dependen e.
IMS Le ture NotesMonograph Series
16
(1990), 45-56. [5℄ Blo k, H. W., Chhetry, D., Fang, Z. and Sampson, A. R. : Partial orders on permutations and dependen e orderings on bivariate empiri al distributions.
Ann. Statist. 18
(1990), 1840-1850.
[6℄ Blo k, H. W., Chhetry, D., Fang, Z. and Sampson, A. R. : Metri s on permutations useful for positive dependen e.
J. Statist. Plann. Inferen e 62
(1997),
219-234.
Matematikai Statisztika.
[7℄ Borovkov, A. A. :
Typotex, Budapest (1999).
[8℄ Bökenholt, U. : Appli ations of Thurstonian models to ranking data. In : [36℄ 157-172. [9℄ Bradley, R. A. and Terry, M. A. : Rank analysis of in omplete blo k designs, I.
Biometrika 39
[10℄ Christensen, R. :
(1952), 324-345.
Log-linear models.
Springer-Verlag, New York (1990).
[11℄ Chung, L. and Marden, J. I. : Use of nonnull models for rank statisti s in bivariate, two-sample, and analysis-of-varian e problems.
Asso . 86
J. Amer. Statist.
(1991), 188-200.
[12℄ Chung, L. and Marden, J. I. : Extensions of Mallows' [13℄ Cox, D., Little, J., O'Shea, D. :
model. In : [36℄ 108-139.
Ideals, Varieties, and Algorithms.
Springer,
New York (1992). [14℄ Cox, D. R. and Wermuth, N. :
Multivariate dependen ies.
Chapman and Hall,
London (1996). [15℄ Crit hlow, D. E., Fligner, M. A. and Verdu
i, J. S. : Probability models on rankings.
J. Math. Psy h. 35
(1991), 294-318.
[16℄ Croon, M. : Latent lass models for the analysis of rankings. In : De Solte, G., Feger, H. and Klauer, K. C. (eds.) :
modeling.
New developments in Psy hologi al hoi e
North-Holland, Amsterdam (1989), 99-121.
HIVATKOZÁSOK
116
[17℄ Csiszár, I. and Tusnády, G. : Information geometry and alternating minimization pro edures.
Statisti s and De isions,
Supplementary Issue No. 1 (1984),
205-237. [18℄ Csiszár, V. : Conditional independen e relations and log-linear models for random mat hings.
A ta Math. Hungar.,
Online First (2008).
[19℄ Csiszár, V. : Markov bases of onditional independen e models for permutations.
Kybernetika,
közlésre elfogadva.
[20℄ Csiszár, V. : On L-de omposability of random permutations.
J. Math. Psy h.,
átdolgozás alatt. [21℄ Csiszár, V. : An a y li operation on the symmetri group, benyújtva. [22℄ Csiszár, V., Rejt®, L. and Tusnády, G. : Statisti al Inferen e on Random Stru tures. In :
Horizons of Combinatori s,
17, Springer
Bolyai So iety Mathemati al Studies
(2008), 37-66.
[23℄ Daniels, H. E. : Rank orrelation and population models.
Ser. B 12
J. Roy. Statist. So .
(1950), 171-181.
[24℄ Darro h, J. N. and Rat li, D. : Generalized iterative s aling for log-linear models.
Ann. Math. Statist. 43
(1972), 1470-1480.
[25℄ Dawid, A. P. and Lauritzen, S. L. : Hyper Markov laws in the statisti al analysis of de omposable graphi al models.
Ann. Statist. 21
(1993), 1272-1317.
[26℄ Deming, W. E. and Stephan, F. F. : On a least squares adjustment of a sampled frequen y table when the expe ted marginal totals are known.
Statist. 11
Ann. Math.
(1940), 427-444.
[27℄ Dempster, A. P., Laird, N. and Rubin, D. B. : Maximum likelihood from in omplete data via the EM algorithm (with dis ussion).
Ser. B 39
J. Roy. Statist. So .
(1977), 1-38.
[28℄ Dia onis, P. :
Group Representations in Probability and Statisti s. Institute
of
Mathemati al Statisti s, Hayward, California (1988). [29℄ Dia onis, P. : A generalization of spe tral analysis with appli ation to ranked data.
Ann. Statist. 17
(1989), 949-979.
[30℄ Dia onis, P. and Eriksson, N. : Markov bases for non ommutative Fourier analysis of ranked data.
J. Symboli Comput. 41
(2006), 173-181.
[31℄ Dia onis, P. and Graham, R. L. : Spearman's foot rule as a measure of disarray.
J. Roy. Statist. So . Ser. B 39
(1977), 262-268.
[32℄ Dia onis, P. and Sturmfels, B. : Algebrai algorithms for sampling from onditional distributions.
Ann. Statist. 26
(1998), 363-397.
HIVATKOZÁSOK
117
[33℄ Doignon, J.-P., Peke£, A. and Regenwetter, M. : The repeated insertion model for rankings : missing link between two subset hoi e models.
69 (2004), 33-54.
[34℄ Fishburn, P. :
Psy hometrika
The Theory of So ial Choi e. Prin eton University Press, Prin e-
ton, N.J. (1973). [35℄ Fligner, M. A. and Verdu
i, J. S. : Multi-stage ranking models.
Statist. Asso . 83
J. Amer.
(1988), 892-901.
[36℄ Fligner, M. A. and Verdu
i, J. S. (eds.) :
Analyses for Ranking Data.
Probability Models and Statisti al
Springer-Verlag, New York (1993).
[37℄ Geiger, D., Meek, C. and Sturmfels, B. : On the tori algebra of graphi al models.
Ann. Statist. 34
[38℄ Haberman, S. J. :
(2006), 1463-1492.
The analysis of frequen y data. University of Chi ago Press,
Chi ago (1974). [39℄ Huang, T.-K., Weng, R. C. and Lin, C.-J. : Generalized Bradley-Terry models and Multi- lass probability estimates.
J. Ma h. Learn. Res. 4
(2006), 85-115.
[40℄ Hunter, D. R. : MM algorithms for generalized Bradley-Terry models.
Statist. 32
Ann.
(2004), 384-406.
[41℄ Hunter, D. R. and Lange, K. : Rejoinder to dis ussion of Optimization transfer algorithms using surrogate obje tive fun tions.
J. Comput. Graph. Statist. 9
(2000), 52-59. [42℄ Lauritzen, S. :
Graphi al Models.
Clarendon Press, Oxford (1996).
[43℄ Lehmann, E. L. : Some on epts of dependen e.
Ann. Math. Statist 37 (1966),
1137-1153. [44℄ Lu e, R. D. :
Individual hoi e behavior.
Wiley, New York (1959).
[45℄ Mallows, C. L. : Non-null ranking models, I.
Biometrika 44
(1957), 114-130.
[46℄ Marden, J. I. : Use of orthogonal ontrasts in analyzing rank data.
Report
Te hni al
Dept. Statist., University of Illinois at Urbana-Champaign (1990).
[47℄ Marden, J. I. : Use of nested orthogonal ontrasts in analyzing rank data.
Amer. Statist. Asso . 87
[48℄ Marden, J. I. :
J.
(1992), 307-318.
Analyzing and Modelling Rank Data.
Chapman&Hall, London
(1995). [49℄ M Cullagh, P. : Permutations and regression models. In : [36℄ 196-215. [50℄ M La hlan G. J. and Krishnan, T. : Wiley&Sons, New York (1997).
The EM Algorithm and Extensions. John
HIVATKOZÁSOK
118
[51℄ Rao, P. V. and Kupper, L. L. : Ties in paired- omparison experiments : A generalization of the Bradley-Terry model.
J. Amer. Statist. Asso . 62 (1967),
194-204. [52℄ Rapallo, F. : Tori statisti al models : parametri and binomial representations.
Ann. Inst. Statist. Math.,
Online First (2006).
[53℄ S hriever, B. F. : An ordering for positive dependen e.
Ann. Statist. 15 (1987),
1208-1214. [54℄ Stern, H. : Probability models on rankings and the ele toral pro ess. In : [36℄ 173-195.
Gröbner bases and onvex polytopes.
[55℄ Sturmfels, B. :
Amer. Math. So ., Provi-
den e, RI (1996). [56℄ Sullivant, S. :
Tori Ideals in Algebrai Statisti s.
PhD thesis, University of
California, Berkeley (2005). [57℄ Takemura, A. and Aoki, S. : Some hara terizations of minimal Markov basis for sampling from dis rete onditional distributions.
56 (2004), 1-17.
Ann. Inst. Statist. Math.
[58℄ Thompson, G. L. : Generalized permutation polytopes and exploratory graphi al methods for ranked data.
Ann. Statist. 21
(1993), 1401-1430.
[59℄ Thurstone, L. L. : A law of omparative judgement.
Psy hologi al Reviews 34
(1927), 273-286. [60℄ Whittaker, J. :
Graphi al models in applied multivariate statisti s. John Wiley
and Sons, Chi hester (1990). [61℄ Wu, C. F. J. : On the onvergen e properties of the EM algorithm.
Statist. 11
Ann.
(1983), 95-103.
[62℄ Yemeli hev, V. A., Kovalev, M. M. and Kravtsov, M. K. :
and Optimisation.
Cambridge University Press (1984).
Polytopes, Graphs
Összefoglalás Az értekezés a véletlen permutá iók statisztikai vizsgálatának néhány kérdésével foglalkozik. Az el®készületek után a második részben bemutattuk a sorbarendezési adatokra az irodalomban leggyakrabban használt modelleket. M Cullagh inverziókon alapuló torikus modelljében bizonyítottuk a paraméterek identikálhatóságát, ami azon az észrevételen múlt, hogy a helyre rakó, úgynevezett H-lépés körmentes gráfot indukál a szimmetrikus
soporton. Ezután a Pla kett-Lu e-féle modellek paramétereinek maximum likelihood be slésére vezettünk le EM algoritmusokat. A harmadik rész a feltételes függetlenség és a hierar hikus modellek kap solatát vizsgálja a permutá iós felállásban. Megmutattuk, hogy az L-felbontható eloszlások saládja több szempontból szépen viselkedik : zárt hierar hikus modell, melyben a maximum likelihood be slés expli it kiszámolható, és a minta feltételes eloszlása az elégséges statisztikára nézve egyaránt generálható direkt módszerrel, illetve egy egyszer¶, másodfokú Markov bázis segítségével. Ezután azokat az úgynevezett duplán L-felbontható véletlen permutá iókat vizsgáltuk, melyek nem sak L-felbonthatók, hanem az inverzük is az. Megmutattuk, hogy szigorúan pozitív esetben a szabad paraméterek száma
n3 nagyságrend¶, ahol n a permutá ió hossza. Ezek a vizsgálatok vezettek
minket a véletlen permutá iók hierar hikus modelljeinek bevezetésére, melyek olyan torikus modellek, melyeket az
f1; : : : ; ng halmaz partí ió-párjai gen-
erálnak. Kiderült, hogy a duplán L-felbontható modell nem rendelkezik az L-felbontható modell szép tulajdonságaival. A Markov bázis meghatározása például rendkívül nehéz a gyors méretnövekedés miatt : az elérhet® algoritmusok sak az
n = 4 esettel tudtak megbirkózni. Még egy érdekes fogalmat,
az S-felbonthatóságot is, bár rövidebben, de tanulmányoztuk. Megkérdeztük, hogy melyek azok a véletlen permutá iók, melyeknek bármely részvektora és annak komplementere feltételesen független, ha a részvektorokba es® elemek halmazát ismerjük. Megmutattuk, hogy ha minden permutá ió valószín¶sége pozitív, akkor ezek éppen a kvázi-független eloszlású permutá iók. Végül egy ismert adatsorra illesztettük a felbontható modelleket.
Summary This dissertation addresses a number of questions onne ted to the statisti al analysis of random permutations. After the preliminaries, in Part II., we introdu ed the models for rank-ordered data most frequently used in the literature. We demonstrated that the parameters in M Cullagh's inversionbased model are identifyable. This result followed from the fa t that the graph on the symmetri group, indu ed by the so- alled move-home-step is y le free. Then we obtained EM algorithms for the maximum likelihood estimates of the parameters in the Pla kett-Lu e model and its generalizations. Part III. deals with onditional independen e and hierar hi al models in the permutation setting. We showed that the L-de omposable family has some ni e properties : namely, it is a losed hierar hi al model in whi h the ML estimate is expli ite, and the onditional distribution of the sample, given the su ient statisti s, an be generated either dire tly, or by means of a simple, degree-2 Markov basis. We turned our attention to the so- alled bi-L-de omposable random permutations, whose distribution, as well as that of their inverse, is Lde omposable. We al ulated the number of parameters to be (in the stri tly positive ase) of order
n3 ,
where
n
denotes the length of the permutation.
These investigations led naturally to the denition of hierar hi al models, whi h are generated by partition-pairs of the set
f1; : : : ; ng. It turned out
that the bi-L-de omposable model possesses none of the ni e properties of the L-de omposable model. For example, the al ulation of a Markov basis be omes qui kly infeasible due to the size of the problem : the available algorithms ould solve only the ase
n = 4.
We briey looked at another
interesting property alled S-de omposability. We asked whi h random permutations had the property that every subve tor and its omplement are onditionally independent, given the set of elements in ea h subve tor. We proved that if every permutation has positive probability, then these random permutations are exa tly the quasiindependent ones. Finally, we t our de omposable models to a real dataset.