D függelék Angol – magyar “többváltozós-elemzéstani” kisszótár és kislexikon Ebben a függelékben az angol nyelvû biológiai/többváltozós szakirodalom leggyakoribb szakkifejezéseit gyûjtöttük össze. A megadott néhány mondatos szómagyarázatok tájékoztató információul szolgálnak, s – már csak a terjedelmi korlátok miatt is – nem jelentenek teljesen szabatos definíciót. A dõlt betûvel szedett szavak a kisszótárban önálló címként is elõfordulnak, s ott keresendõk. Tilde (~) jelöli a címszó ismételt elõfordulását az adott szócikkben.
ACCTRAN (ACCelerated TRANsformation) gyorsított átalakulás: Többféleképpen lehetséges kladogram-rekonstrukció (reconstruction) folyamán a karakter-átmenet az õstõl számítva
az elsõ lehetséges helyen bekövetkezik. A késõi visszafordulásoknak kedvez (vö. DELTRAN). Adaptive clustering adaptív osztályozás: Osztályozási stratégia, amely a klasszifikáció menetét az objektumhalmaz bizonyos, a számítások közben megállapított tulajdonságaihoz igazítja. Additive tree additív fa: Olyan fa-gráf, amelyben bármely két objektum között futó élek hosszúságainak összege éppen a két objektum távolságát adja ki, azaz teljesül a négy-pont metrika feltétele (four point metric). Additivity additivitás: Egyes statisztikák és mérõszámok tulajdonsága, miszerint az eredmény az egyes változók hozzájárulásainak aritmetikai összegeként állítható elõ. A négyzetösszeg (sum of squares) pl. additív mennyiség.
Affine transformations affin transzformációk: Uniform transformations. Agglomerative agglomeratív: Egymás utáni összevonásokon alapuló (pl. hierarchikus osztályozás). Apomorphy apomorfia: Egy karakter leszármaztatott állapota, szembeállítva az õsi (plesiomorph) állapottal. Arch effect: Horseshoe effect
Area cladogram área kladogram: Taxonok kladogramjában az OTU-k helyére az elõfordulási területeiket beírva kapunk ~-ot. Több rendszertani csoport ~jának összehasonlító értékelése felvilágosítást adhat a biogeográfiai történésekrõl (cladistic biogeography).
368
D függelék
Association asszociáltság: Rendszerint nominális vagy ordinális változók közötti kapcsolat mértéke
(régi és félreérthetõ néven: társulás). A korrelációval (correlation) való analógia kedvéért értékkészlete rendszerint [1,1], így az együttes elõfordulás pozitív, a kölcsönös kizárás pedig negatív értéket ad. Objektumokra alkalmazva inkább hasonlóságról (similarity) beszélünk. Association analysis asszociáltság-elemzés: Olyan divizív és monotetikus hierarchikus osztályozó módszer, amely a változók között asszociáltságot (association) méri, s a többi változóval leginkább asszociált változó alapján végzi el a felosztást minden lépésben. Attribute attribútum: (Itt) Objektumok egy tulajdonsága, bélyege. Attribute duality attribútum dualitás: Alapelv, miszerint egy adatmátrixban a sorok éppúgy tekinthetõk az oszlopok attribítumainak, mint az oszlopok a sorokénak. Ebbõl eredendõen egy adatmátrix kétféle módon reprezentálható grafikusan. Average link átlagos kapcsolódás: Egyes agglomeratív osztályozó módszerek gyûjtõneve; az összevonást követõen a kapott új osztály és a többi távolságát valamilyen átlagolással kapjuk meg (group average, simple average). Bartlett test Bartlett próba: (Itt) Kanonikus tengelyek szignifikanciájának vizsgálata a Wilks-féle lambda alapján a χ2 eloszlás felhasználásával. Általában: varianciák homogenitásának próbája.
Barycenter súlypont: Centroid. Baseline alapvonal: Biológiai formák koordináta-rendszerbeli elhelyezését elõsegítõ fõtengely, két
jól azonosítható kulcspont között. Ezek koordinátái [0,5, 0] és [0,5, 0] jelentik a viszonyítási alapot a többi objektum elhelyezéséhez, ill. azok koordinátáinak kiszámításához (Bookstein koordináták). Beta diversity béta v. elkülönülési diverzitás: Általában faj/egyed-diverzitásbeli különbség egyes mintaterületek, mintavételi egységek között a társuláson belül, társulások között, illetve egy transzszekt mentén (gyakran helytelenül ez utóbbira szkítik le a ~ értelmezését). Binary bináris: Két állapottal rendelkezõ, pl. ~ tulajdonság (prezencia/abszencia, igen-nem stb). Biplot kettõs szórásdiagram: Változók és objektumok ordinációjának együttes ábrázolása (pl. PCA). Szûkebb értelemben csak az a diagram tekinthetõ ~-nak, amely az adatmátrix értékeinek közelítésére alkalmas (még joint plot). Bipolar axis kétpólusú tengely: Ordinációs tengely, amelyre nézve az objektumok egy része az egyik, a másik része pedig az ellenkezõ végen helyezkedik el. Block clustering blokk-osztályozás: Adatmátrixok átrendezése objektumok és a változók egyidejû osztályozásával olymódon, hogy a mátrix belsejében nagy homogenitású részmátrixokat kapjunk, amelyek kölcsönösen értelmezik a két osztályozást. Block seriation blokk-szeriálás: Mátrixok átrendezése annak érdekében, hogy az oszlopok és sorok csoportjai közötti megfeleltetést tükrözõ blokkok az átló mentén helyezkedjenek el, maximális kontrasztban az átlón kívüli blokkokkal. Bookstein coordinates: Baseline. Bootstrap: Számítógép-intenzív újramintavételezési módszer, amelyben kiindulásként feltételezzük, hogy a mintában lévõ m egységre kapható gyakoriságeloszlás a lehetõ legjobban képviseli az eredeti populációban lévõ gyakoriságokat. A mintából m-elemû visszatevéses mintavételezést sokszor végrehajtva kapjuk a ~ mintákat, amelyeket valamilyen paraméter becslésére, egy statisztika kiszámítására vagy megismételt többváltozós elemzésre is hasz-
Kisszótár és kislexikon
369
nálhatunk. A ~ elnevezés a pull yourself up by the bootstraps idiómából (kb. segíts magadon) származik. Bootstrap consensus tree bootstrap konszenzus fa: A változók bootstrap újramintavételezésével elõállított alternatív fák (pl. kladogramok) egyesítése (consensus), amely kiküszöböli a változók kiválasztásában jelentkezõ szubjektív elemeket, s alkalmas a leginkább stabilis osztályok kimutatására. Branch and bound method leágazás és korlát módszer: Valamilyen kritérium szerint optimális eredményt (pl. osztályozást) keresõ eljárás, melynek egyes lépéseiben a részleteket (pl. az osztályozás néhány csoportját) is kiértékeljük, s abban az irányban, amelyre már a részeredményekre vonatkozó kritérium meghaladja az addig talált legjobbat, nem próbálkozunk tovább. Bush bokor: Fa-gráf, melynek minden ága a gyökérbõl fut ki. Camin Sokal character Camin - Sokal tulajdonság: Olyan tulajdonság, melynek állapotai csak egy irányban alakulhatnak át egymásba (irreverzibilisek), szemben a Wagner-féle rendezett és reverzibilis karakterekkel. Canonical kanonikus: Általános érvényû; pl. minden csoportra vonatkozó. Canonical axis kanonikus tengely: Kanonikus korreláció vagy diszkriminancia elemzés során kapott ordinációs tengely, melyen a koordináták a kanonikus változók megfelelõ értékei. Canonical correlation kanonikus korreláció: Két változócsoport közötti korreláció mértéke, valójában kanonikus változók korrelációja. Canonical correlation analysis kanonikus korreláció-elemzés: Két változócsoport esetén alkalmazható kötött (constrained) ordinációs módszer, melynek feladata a változócsoportokat kanonikus változókkal helyettesíteni. Canonical variates kanonikus változók: A kanonikus korreláció-elemzésben két csoportba tartozó változókra meghatározható mesterséges változók, amelyek egy csoporton belül lineárisan korrerálatlanok egymással, s egyenként maximálisan korrelálnak a másik változócsoportra kapott kanonikus változók valamelyikével.Diszkriminancia-elemzésben az objektumok csoportosulásait maximálisan magyarázó mesterséges változók. Canonical variates analysis diszkriminancia elemzés: Eleve adott objektumcsoportok (osztályok) legjobb elválasztására alkalmas ordinációs tengelyeket keresõ eljárás. Centered data centrált adatok: Centrálással (centring) átalakított adatmátrix. Centring centrálás: Az adatmátrixban minden értékbõl kivonjuk a megfelelõ változó középértékét. Centroid súlypont: Egy adathalmaz ~ját az egyes változók középértékei mint koordináták adják meg. E koordináták a ~ vektorba írhatók be. Centroid clustering súlypont módszer: Olyan numerikus osztályozó módszer, amelyben két osztály távolságát súlypontjaik távolságaként definiáljuk (=UPGMC, Unweighted Pair-Group Centroid Method). Chaining lánchatás: Egyes agglomeratív osztályozó módszerek (különösképpen az egyszerû lánc) hajlama arra, hogy a klasszifikáció során az új objektumokat már meglévõ osztályokhoz soroljon, s így láncszerûen építkezõ dendrogramot eredményezzen. Character karakter: Tulajdonság, amely végtelen számú (folytonos ~) vagy csak véges számú (diszkrét ~) lehetséges állapotot vehet fel. Character compatibility karakter kompatibilitás, összeférhetõség: Két karaktert akkor tekintünk kompatibilisnek, ha evolúciójukban nem jelentkezik homoplázia (pl. parallel evolúció
370
D függelék
vagy visszafordulás). Ez csak úgy valósulhat meg, hogy a vizsgált taxonokban nem fordul elõ minden karakterkombináció. Character state karakterállapot, kategória: Egy nominális vagy ordinális skálán kifejezhetõ tulajdonság lehetséges megvalósulásainak egyike. Pl. a virág színe (mint tulajdonság) felveheti a piros, kék, sárga, fehér stb állapotokat. (A valószínûségi változó egy lehetséges értéke.)
Characteristic root: Eigenvalue Characteristic vector: Eigenvector Chernoff faces Chernoff arcok: Több- (de rendszerint nem nagyon sok-) változós adatok képi
megjelenítésére, vizuális értékelésére alkalmas, emberi arcot idézõ ábrák, melyeken minden tulajdonság egy standardizált eredeti változónak felel meg. Chi-square χ (khi-) négyzet: k számú egymástól független, 0 várható értékû és 1-es szórású normális eloszlású változó négyzetösszegeként elõállítható mennyiség. Eloszlása a k szabadságfokú χ2 eloszlás, amely számos statisztikai próbában szolgál alapul. Chord distance húrtávolság: Két normált adatvektor különbsége. Az egységsugarú hipergömb felületére vetített két pont között húzható húr hosszával azonos. City block distance háztömb távolság: Két objektum közötti eltérések abszolút értékeinek összege. Cladistics kladisztika: Leszármazási viszonyokat fa-gráfok segítségével rekonstruáló taxonómiai/evolúció-biológiai irányzat. Cladistic biogeography kladisztikus biogeográfia: Vikariáló taxonok area-kladogramjainak összehasonlító értékelésével foglalkozó tudományterület, amely a taxonok közötti evolúciós viszonyok alapján hozza meg biogeográfiai következtetéseit. Cladogram kladogram: Filogenetikai leszármazás illusztrálására szolgáló fa-gráf, rendszerint szigorúan dichotomikus (villás) elágazásokkal. Lehet gyökér-nélküli vagy gyökeres, súlyozott (az élek mentén felmérve az evolúciós változás mértékét) vagy súlyozatlan (amikor is csupán az elágazási mintázat érdekel bennünket). Classification osztályozás: Folyamat, melynek révén objektumokat eddig még nem létezõû osztályokba csoportosítunk, ill. e folyamatnak az eredménye. Closure záródás: Az az eset, amikor egy adatmátrix sorai (vagy oszlopai) konstans összeget adnak, vagyis m1 érték ismeretében az utolsó automatikusan adódik. Ilyenek pl. a százalékos összetételi adatok. Clumping halmozás: 1. Átfedéses osztályozást eredményezõ klasszifikációs algoritmus. Maguk a csoportok az ún. clump-ok. 2. Olykor a ~ az agglomeratív módszerek szinonímája. Clustering számítógépes csoportosítás: Objektumok csoportosulásait, osztályait keresõ, a csoportszerkezet feltárására alkalmas numerikus eljárások gyûjtõneve. Cluster membership divergence osztálybatartozási divergencia: Két objektum dendrogram-beli relatív helyzetét kifejezõ mérõszám, az õket tartalmazó minimális méretû osztály elemszáma. Coefficient koefficiens, együttható: 1. Szorzószám. 2. Hasonlóságot vagy különbözõséget kifejezõ függvény. Collinearity kollinearitás: Multicollinearity. Combinatorial clustering kombinatorikus klasszifikációs algoritmus: A hierarchikus osztályozás olyan eljárásai tartoznak ide, amelyek a távolság (vagy különbözõség-) mátrix értékeinek és a csoportok méreteinek ismeretében kombinálják ki a fúziók során kapott új osztályok
Kisszótár és kislexikon
371
közötti távolság (különbözõség-) értékeket. A nyers adatokra tehát nincs szükség, miután a kiinduló mátrixot kiszámítottuk. Commensurability összemérhetõség: Különbözõ változók összemérhetõk egymással, ha mérési skálájuk mértékegysége azonos. Ilyen változók alapján standardizálás nélkül is végrehajtható a többváltozós elemzés. Az eltérõ mértékegységû változók nem összemérhetõk, ezek együttes értékelése csak standardizálás után valósítható meg.
Communality kommunalitás: A faktor analízis modelljében adott változó varianciájának a közös faktorok segítségével megmagyarázható része.
Complete enumeration teljes leszámlálás: 1. Olyan, viszonylag ritkán adódó adatgyûjtési mód,
amikor a statisztikai populáció összes egyedérõl felvesszük az adatokat. A populáció paraméterei ekkor pontosan kiszámíthatóak, szemben a mintavételezéses adatgyûjtéssel, amely csak becslésre alkalmas. 2. Minden lehetõség számbavétele, pl. az optimális eredmény kikeresésében.
Complete link teljes lánc módszer: A hierarchikus osztályozás egyik legismertebb módszere, melyben két osztály távolságát legtávolabbi objektumaik távolságaként definiáljuk.
Component loading komponens-súly: Változók és komponensek korrelációja, amely változók ordinációjában koordinátaként használható fel.
Components komponensek: 1. A fõkomponens elemzés során nyert új, mesterséges, egymással korrelálatlan változók. 2. A kladisztikus biogeográfiában az area kladogramok rész-fái, amelyek összesítõ értékelése adja a végsõ kladogramot.
Component score komponens-érték: Objektumok koordinátái a fõkomponens elemzésben. Computer intensive methods számításigényes módszerek: Olyan újramintavételezési vagy
(rendszerint iterációs) adatelemzési módszerek, amelyek jelentõs számítógépes ráfordítást igényelnek (idõben ill. memóriában), s elvégzésük számítógépek nélkül gyakorlatilag lehetetlen.
Consensus konszenzus: k darab eredmény (OUC, pl. ordináció, partíció, kladogram, stb.) szintézise egy k+1-ik eredmény formájában, amely a kiinduló OUC-k egyezéseit és esetleg eltéréseit is kifejezi.
Consensus index konszenzus index: Elsõsorban dendrogramok és kladogramok esetén a konszenzus fa valamely jellemzõje, melynek segítségével számszerû módon fejezzük ki a konszenzus mértékét.
Consistency index konzisztencia index: Egy kladogramra jellemzõ szám, amely megmutatja, hogy
adott karakter állapotváltozásainak száma hogyan viszonyul az elméletileg lehetséges minimumhoz. 1-nél kisebb érték homopláziára (homoplasy) utal.
Constrained classification kötött osztályozás: Olyan klasszifikáció, amelyben az egy csoportba tartozást nemcsak a hasonlóság, hanem bizonyos külsõ feltételek is megszabják (pl. az objektumok térbeli közelsége stb.)
Constrained ordination kötött ordináció: Az ordinációs tengelyek meghatározásában nemcsak az
adatmátrix belsõ struktúrája, hanem külsõ változók is szerepet játszanak. Így például a kanonikus korreszpondencia elemzésben a megszorítás: a tengelyek a környezeti változók lineáris kombinációi legyenek. A megszorítás miatt hatékonyságban (a sajátértékek nagyságában) elmaradnak a többi ordinációtól, viszont közvetlenebb interpretációt tesznek lehetõvé.
372
D függelék
Contingency table kontingencia-táblázat: Nominális (vagy esetleg ordinális) tulajdonságok asszociáltságának, hasonlóságának kiszámításához használt táblázat, melynek celláiba az egyes állapotkombinációk gyakoriságai kerülnek.
Contingency table analysis: Correspondence analysis. Convex hull konvex burok: Egy ponthalmazt körülvevõ minimális területû, rendszerint sza-
bálytalan sokszög (két dimenzióban), melynek egyik belsõ szöge sem nagyobb 180o-nál. Cophenetic correlation kofenetikus korreláció: Egy távolságmátrix és a belõle kapott dendrogram szintjei között számolt lineáris korreláció, amely a klasszifikáció jóságát méri: minél nagyobb a ~, annál hûségesebben reprezentálja a dendrogram a távolságokat. Cophenetic difference kofenetikus különbség: Dendrogramok jellemzésére alkalmas deszkriptor, megmondja, hogy adott j és k objektumok mely hierarchikus szinten tartoznak elõször egy csoportba (azaz az õket tartalmazó legkisebb osztályhoz tartozó szint).
Cophenetic level kofenetikus szint: Cophenetic difference. Correlation korreláció. Általában: változók közötti kapcsolat mértéke. Pontosabb specifikáció hiányában, a lineáris korrelációt (a Bravais Pearson féle szorzat-momentum korrelációt) értjük alatta. A ~ hiánya (korrelálatlanság) még nem utal függetlenségre (még association, rank correlation). Correspondence analysis korreszpondencia elemzés: Ordinációs módszer, amely az adattáblázatot kontingencia-táblaként fogja fel, és a sorok és az oszlopok együttes ordinációját állítja elõ. Covariance kovariancia: Két változó együttes változásának az abszolút mértéke: várható értéküktõl vett eltéréseik szorzatának várható értéke. Data (e.sz.: datum) adatok: Valószínûségi változók mért, vagy megfigyelt és kódolt formában rögzített értékei.
Data transformation: Transformation. DELTRAN (DELayed TRANsformation) késleltetett átalakulás: Alternatív kladogram rekonstrukciók közül az, amelyikben a karakter átmenetek a gyökértõl számítva a lehetõ legkésõbb következnek be. A parallel evolúciót emeli ki, szemben az ACCTRAN-nal. Dendrogram: Hierarchikus osztályozások szemléltetésére alkalmas gyökeres fa-gráf, amely alkalmas koordináta rendszerben elhelyezve a hierarchikus szintekrõl is tájékoztat. Detrending kiegyengetés: A patkó-jelenség (horseshoe effect) automatikus eltüntetésére, vagy legalábbis csökkentésére alkalmazott eljárások gyüjtõneve.
Direct gradient analysis: Gradient analysis. Dissection felszeletelés: Objektumok csoportokba sorolása valamely külsõ szempontrendszer, és nem az adatstruktúra alapján.
Dispersion szóródás: Általában egy változóra vonatkozó összes megfigyelésünknek az átlagtól vett
átlagos eltérésének a mértéke, mint pl. a szórás vagy a variancia. Dissimilarity különbözõség: Objektumok összehasonlítására alkalmas, a hasonlósággal ellentétpárba állítható függvény, amely teljesíti az elsõ három metrikus axiómát. Sok ~-nek 1 a maximuma, míg más esetekben nincs felsõ határ. Distance távolság: Objektumok olyan különbözõsége, amelynek geometriai interpretálhatósága is van pl. két pontot összekötõ szakasz hosszának formájában. Rendszerint a metrikákat tekintjük ~-nak.
Kisszótár és kislexikon
373
Distribution eloszlás: Egy valószínûségi változó (pl. tulajdonság, hasonlóság stb.) lehetséges
értékei ill. a hozzátartozó gyakoriságok (gyakoriságeloszlás) vagy elõfordulási valószínûségek (valószínûségeloszlás) együttese. Divisive divizív: Az objektumhalmaz szukcesszív feldarabolásán alapuló. Rendszerint minden lépésben két részre osztjuk valamely részhalmazt. Dollo character Dollo tulajdonság: Állapotai rendezettek, de a leszármaztatott állapot csak egyszer jelenhet meg az evolúció során, bár a törzsfa több ágán is visszaalakulhat az õsibbe. Double zero dupla nulla: Prezencia/abszencia adatok esetében egy változó hiánya mindkét összehasonlított objektumból, azaz együttes abszencia. Ennek a különbözõségi függvények más és más fontosságot tulajdonítanak. Edge él: Egy gráf két szögpontját összekötõ szakasz. Eigenanalysis sajátérték elemzés: Minden olyan ordináció alapja, amelyben a háttérdimenziók meghatározása sajátértékek és sajátvektorok felhasználásával történik. Eigenshape analysis alakkomponens elemzés: Körvonallal jellemezhetõ objektumok fõkomponens ordinációja az alak matematikai leírásával (pl. Fourier elemzés, alakfüggvény) elõállított koefficiensek alapján. Eigenvalue sajátérték: Szimmetrikus mátrixok karakterisztikus egyenletében szereplõ skalártípusú ismeretlen, amelynek megoldásai a háttérdimenziók fontosságát tükrözik (pl. a megmagyarázott variancia százalékában). Eigenvector sajátvektor: Szimmetrikus mátrixok karakterisztikus egyenletében szereplõ vektor típusú ismeretlen, melynek megoldásai a háttérdimenziók grafikus illusztrálásához szükséges koordináták kiszámítására alkalmasak. Entropy entrópia: Általánosságban a bizonytalanság, ill. a rendezetlenség mértéke valamely halmazban. Estimation becslés: A statisztikai populáció egy ismeretlen paraméterének (pl. várható értékének, varianciájának stb) közelítése a mintából számolt értékkel. EU (evolutionary unit) evolúciós egység: A kladisztikai vizsgálatokba bevont taxonok (pl. fajok, családok, akár törzsek) általános megnevezése. Euclidean euklidészi: Az euklideszi axiómáknak megfelelõ, pl. a köznapi távolságfogalom. Euclidean biplot euklidészi kettõs szórásdiagram: Objektumok és változók együttes ordinációja PCA révén, amelyben az objektumok koordinátái a komponens-értékek, a változóké pedig a sajátvektorok (még biplot). Exact randomization test pontos randomizációs teszt: Olyan randomizációs próba, melyben az adatok összes lehetséges átrendezését végrehajtuk, s ilymódon a keresett statisztika pontos eloszlását megismerjük. Exploratory analysis feltáró elemzés: Az adatainkban rejlõ mintázatok felderítését, kimutatását célzó, a formális statisztikára kevéssé vagy egyáltalán nem alapozó eljárás. Factor faktor: (Itt) A faktor elemzésben kapott tengely, amely a változókra együttesen ható háttértényezõket reprezentál. Nem tévesztendõ össze a komponensekkel. Factor analysis faktoranalízis: Olyan ordinációs eljárás, amely a változókra együttesen ható háttérdimenziókat fejezi ki hipotetikus faktorok formájában, míg a specifikus csak egy változóra ható - faktorokat mellõzi. Farthest neighbor legtávolabbi szomszéd módszer: Complete link.
374
D függelék
Fitch character Fitch-féle tulajdonság: Olyan tulajdonság, melynek állapotai bármely másik ál-
lapotba oda- és visszaalakulhatnak, így nem hordoznak ordinális információt. Flexible clustering flexibilis osztályozás: Kombinatorikus klasszifikációs algoritmus, melynek paraméterei szabadon változtathatók, így speciális esetekben jól ismert módszerekkel egyezik meg. Fourier analysis Fourier elemzés: (Itt) Valamely objektum körvonalának matematikai leírása trigonometrikus függvények alkotta sor segítségével. Four-point criterion négy-pont feltétel: Fák additivitásának feltétele, miszerint bármely négy pontra, ill. a közöttük lévõ hat távolságra felírható az additív egyenlõtlenség. Eszerint a négy pontra adódó hat távolságérték egy tetraéder éleinek felel meg úgy, hogy a szemben levõ élek összegei egy egyenlõ oldalú háromszöget adnak. Fuzzy clustering lágy osztályozás: Objektumok felosztása csoportokra olymódon, hogy minden egyes objektum viszonya minden egyes osztállyal egy 0-tól 1-ig terjedõ számmal, az osztályba tartozási súllyal fejezhetõ ki. Egy objektumra a súlyértékek összege 1. A partíciók a ~-ok speciális esetei. Fuzzy set lágy halmaz: A halmazba tartozás a hagyományos halmazelmélettel ellentétben nem igen/nem típusú kérdés, hanem az elemek halmazhoz tartozásának mértéke egy folyonos skálán változik. Gaussian Gauss-féle: (Itt) Az egy- v. többváltozós normális eloszlást követõ változó, vagy arra alapozó módszer. Generalized distance általánosított távolság: E megnevezés rendszerint a Mahalanobis-féle távolságra utal, amely a változók varianciájának a kiegyenlítésével fejezi ki az objektumok távolságát. Generalized Procrustes method általánosított Prokrusztész módszer: Kettõnél több ordináció összehasonlítására, illetve szintézisére kidolgozott iteratív eljárás. Generalized variance általánosított variancia: A variancia/kovariancia v. korrelációs mátrix determinánsa (=sajátértékeik szorzata). Genetic distance genetikai távolság: Biológiai populációk között értelmezhetõ távolságfüggvény, amely az allélgyakoriságokban mutatkozó eltéréseket fejezi ki. Geodesic distance geodéziai távolság: Egy gömb felületén lévõ két pont között húzható ív hossza. Gradient analysis grádiens elemzés: Objektumok ordinációja, melynek révén az elrendezõdésért felelõs háttérváltozókra próbálunk következtetni. A direkt ~ során a háttérváltozók maguk is szerepelnek az ordináció elállításában, míg az indirekt ~ a háttérváltozókat csak utólagosan veszi figyelembe. Pl. ökológiai ordinációk fajok ⎞ mintavételi egységek mátrixból, olymódon, hogy környezeti változók szerepelnek háttérváltozóként. Grid rács: Mintavételi egységek négyzethálós elrendezési módja a szisztematikus (szabályos) mintavételezés során. Az egységek lehetnek érintkezõek vagy adott térközzel elválasztottak. Group average clustering csoportátlag módszer: Hierarchikus osztályozó algoritmus, melyben két osztály távolságát az objektumaik közötti összes távolságérték aritmetikai átlaga fejezi ki (=UPGMA, Unweighted Pair-Group Method using arithmetic Averages). Hierarchical classification hierarchikus osztályozás: Partíciók egymásba ágyazott rendszere, ami lehetõvé teszi az osztályok közötti kapcsolatok tanulmányozását is. Holophyletic holofiletikus: OTU-k csoportja akkor ~, ha legközelebbi közös õsük minden leszármazottját tartalmazza.
Kisszótár és kislexikon
375
Homoplasy homoplázia: Minden olyan karakterállapotbeli egyezés, amely nem a közös leszár-
mazás, hanem parallel evolúció, konvergencia vagy visszafordulás eredménye. A kladogram rekonstruálását mindenfajta ~ jelentõsen megnehezítheti. Horseshoe effect patkó jelenség: Pontok ívszerû elrendezõdése egy ordinációban, ami nem-lineáris adatszerkezetre utal elsõsorban.
HTU, Hypothetical Taxonomic Unit hipotetikus taxonómiai egység: Egy adott rendszertani csoport evolúciójának megmagyarázásához szükséges, kihaltnak feltételezett taxon, amelyet a kaldogramban belsõ szögpontok reprezentálnak.
Identification azonosítás: Objektumok besorolása egy már létezõ osztályozás legmegfelelõbb csoportjába. Nem tévesztendõ össze az osztályozással.
Incremental sum of squares eltérésnégyzet-összeg növekedés: Egyes hierarchikus osztályozó módszerek optimalitási kritériuma, ezt igyekszenek minimalizálni (nem tévesztendõ össze a minimum varianciával).
Independence függetlenség: Változók közötti sztochasztikus kapcsolat hiánya. Két változó füg-
getlen, ha együttes eloszlásuk az egyes változók eloszlásainak szorzata. Egyben korrelálatlanságot is jelent (ez fordítva nem igaz: a korrelálatlanság nem mindig jelent függetlenséget).
Indirect gradient analysis: Gradient analysis. In-group method belcsoport módszer: Karakterek õsi állapotának kiválasztása aszerint, hogy a vizsgált taxonok között melyik állapot szerepel a leggyakrabban.
Interval scale intervallumskála: Változók mérési skálája, melyben az egyes értékek közötti különbségnek értelme van, de hiányzik a nullapont, s így az arányok már értelmetlenek.
Irreversible characters: Camin Sokal characters Iterative algorithm iterációs módszer: Közelítõ számítógépes módszer, amely a végeredményt ugyanazon eljárás többszöri, ismételt alkalmazásával adja meg. Konvergens ~ esetén a végeredmény tetszõleges pontossággal megközelíthetõ.
Jackknife: Az újramintavételezési eljárások egy csoportja, melynek révén adott paraméter (pl. varian-
cia) becslésére nyílik mód egyetlen mintából olymódon, hogy a kapott ún. ~ becslés kevéssé függ az eredeti mintavételezéstõl (jobb becslést ad, mint az eredeti). Technikailag ez rendszerint egy-egy mintaelem elhagyását jelenti (elsõrendû ~) a mintából. Az elnevezés a sok célra alkalmazható bicskára utal, jelezve a ~ módszer széleskörû felhasználhatóságát.
Joint plot együttes szórásdiagram: Objektumok és változók egyidejû ordinációjának ábrázolása a korreszpondencia-elemzésben. (vö. biplot)
Kleiner-Hartigan trees Kleiner-Hartigan-féle fák: Többváltozós adatok egyszerû szemléltetésére alkalmas ábrák, melyeken az ágak hossza arányos az egyes változók értékeivel.
Landmarks kulcspontok: Objektumok (pl. levelek, koponyák stb) egyértelmûen kijelölhetõ pontjai valamely struktúrák szélsõ helyzete v. keresztezése stb. szerint a morfometriában. Alkalmazásuknak akkor van csak értelme, ha egy adott ~ homológ (azonos értékû) minden objektumra.
Latent root: Eigenvalue Latent vector: Eigenvector
376
D függelék
Least squares fitting illesztés a legkisebb négyzetek elve alapján: Valamilyen pontkonfiguráció igazítása egy standard konfigurációhoz olymódon, hogy az összetartozó pontok közötti eltérések négyzetösszege minimális legyen (pl. Prokrusztész módszer, lineáris regresszió). Linear lineáris: 1) Egyenes vonalú. 2) Minden olyan függvény ~, amelyben az ismeretlenek az elsõ hatványon szerepelnek. Mahalanobis biplot Mahalanobis kettõs szórásdiagram: Objektumok és változók együttes ordinációja, melyben a pontok távolsága az általánosított távolság, a tengelyek varianciája azonos, a változók koordinátái pedig a komponensekkel adott kovarianciájukkal egyenlõ.
Mahalanobis distance Mahalanobis távolság: Generalized distance. Majority rule consensus többségi konszenzus: Olyan konszenzus eredmény, amely minden
részletében megegyezik a kiinduló eredmények több, mint 50 %-ával. Manhattan metric: City block metric MANOVA: A többváltozós variancia-analízis (multivariate analysis of variance) rövidítése. Mantel test Mantel próba: Permutációs teszt két távolságmátrix összevetésére olymódon, hogy az egyik mátrix sorait (s így oszlopait) random összekeverjük. Matrix mátrix: Valamilyen elemek (pl. számok) téglalapszerû elrendezése. Matrix correlation mátrixkorreláció: Két mátrix formális összehasonlítása a korrelációs formulával az egymásnak megfelelõ elemek alapján. Matrix plot mátrixdiagram: Két különbözõségi v. távolságmátrix grafikus összehasonlítására alkalmas koordináta-rendszeres ábrázolás, melyben a pontok az objektumpárokat képviselik, koordinátáik pedig a megfelelõ mátrixbeli értékek. Maximum likelihood method maximum-likelihood módszer: Általában egy keresett paraméternek azon értékeit megadó módszer, amelyre legvalószínûbb a minta létrejötte. Nemcsak paraméter, hanem pl. kladogram is meghatározható ilymódon. Median clustering medián módszer: Hierarchikus osztályozás, melyben egy új osztály súlypontját a két összevont osztály súlypontjainak egyszerû átlaga adja meg, vagyis az osztályok méretének nincs jelentõsége (=WPGMC, Weighted Pair-Group Centroid Method). Median consensus medián konszenzus: Konszenzus eredmény, melynek a kiinduló eredményektõl vett távolságátlaga minimális. Meta analysis meta-elemzés: (Itt) Egy objektumhalmaz különbözõ szempontú értékeléseibõl származó eredmények többváltozós elemzése, pl. osztályozások osztályozása. Metric metrikus: Függvény (vagy azt alkalmazó módszer) amely teljesíti a metrikus axiómákat. Minimum spanning tree minimális feszítõfa: Olyan fa-gráf (tree), amelynek minden szögpontja objektumot reprezentál, s az élek összhossza minimális. Minimum variance clustering minimális variancia módszere: Olyan osztályozó algoritmus, amely a csoportokon belüli variancia minimalizálását célozza. Nem tévesztendõ össze az eltérésnégyzet-összeget minimalizáló módszerekkel. Missing data hiányzó adatok: Hiányos mintavételezés vagy egyéb ok miatt elveszett értékek az adatmátrixban, melyek 0-val történõ kódolása félrevezetõ lenne. Bizonyos módszerekkel becsülhetõk, sokszor egy teljes adatsor vagy oszlop kihagyását teszik szükségessé, más esetekben pedig megtûrhetõk (pl. Gower index). Mixed data kevert adatok: Egy adatmátrixban többféle mérési skálájú változók együttesen jelentkeznek. E mátrixok feldolgozása csak speciális módszerekkel lehetséges.
Kisszótár és kislexikon
377
Monophyletic monofiletikus: Más szóval: egy õstõl származó. Szûkebb értelemben egy taxonómiai
csoport csak akkor ~, ha az adott õs összes leszármazottját tartalmazza (még: paraphyletic). Monothetic monotetikus: Osztályozás, mely egy vagy több, de azonosan megoszló tulajdonságon alapszik. E tulajdonság(ok) megléte ill. hiánya egyértelmûen eldönti az osztályba tartozást. (még: polythetic) Monte Carlo simulation Monte Carlo szimuláció: (Itt) Olyan az újramintavételezési technikákkal egyezõ céllal alkalmazott eljárás, amely nem meglévõ adatokat használ fel statisztikák becslésére, hanem valamilyen az adatatok létrejöttét feltételezhetõen jól magyarázó matematikai modellt alkalmaz adatok közvetlen szimulációjára. Bár nem mintavételrõl, hanem mintagenerálásról van szó, sokan együtt tárgyalják az újramintavételezés eljárásaival. Morphometrics morfometria: A biológiai objektumok formájának és méretének statisztikai és többváltozós elemzésével foglalkozó tudományág. Multicollinearity multikollinearitás: n számú változó közötti (nem 0) korrelációk háttérösszefüggése, melynek révén a korrelációs mátrix rangja jóval n alatti, azaz több 0-ás sajátérték is adódik. Ha csak 1-gyel csökken a rang, akkor kollinearitásról beszélünk. Multidimensional scaling többdimenziós skálázás: Szûkebb értelemben véve olyan módszer, amely a távolság v. hasonlóságmátrixból kiindulva állít elõ egy p-dimenziós, az adott mátrixnak legjobban megfelelõ ordinációt. A megfelelés mérése vagy metrikus információn alapszik, vagy csak az értékek sorrendiségét veszi tekintetbe. Multigroup discriminant analysis többcsoportos diszkriminancia elemzés: Ordinációs módszer, melyben a tengelyeket úgy határozzuk meg, hogy maximálisan magyarázzák az objektumok csoportjainak elválását. Multiple comparison többszörös összehasonlítás: (Itt) Több OUC összehasonlítása minden lehetséges párosításban, s az így kapott OUC-közötti távolságmátrix többváltozós elemzése. Multiple correlation coefficient többszörös korrelációs koefficiens: p független és egy függõ változó korrelációja, a kanonikus korreláció speciális esete (canonical correlation) Multiple regression többszörös regresszió: p független változó és egy függõ változó függvénykapcsolatának keresése.
Nearest neighbor legközelebbi szomszéd: Single link. Neighbor joining szomszéd összevonó módszer: Távolságokból kiinduló kladisztikai eljárás,
amely változó evolúciós változást tételez fel a kladogram egyes ágain, s végeredményben egy additív fához közelít. Nodum (t.sz. noda): 1. Szögpont egy gráfban (vertex). 2. Pontok sûrûsödési helye valamely absztrakt térben, pl. vegetációs nodum a fajok mint tengelyek alkotta térben. Felderítésük az ordinációs és klasszifikációs módszerek együttes alkalmazását igényli. Noise zaj: Egy függvénnyel leírható adatstruktúrára ráépülõ random (sztochasztikus) ingadozás, amely szélsõséges esetben teljesen elfedheti a függvénykapcsolatot. Nominal scale nominális skála: Változók mérési skálája, melyben csupán az egyes értékek (állapotok) megkülönbözthethetõsége a fontos. Nonhierarchical nem-hierarchikus: Olyan osztályozás, amelyben a csoportok nem ágyazódnak be növekvõ méretû osztályokba, vagyis partíció.
378
D függelék
Nonlinear nemlineáris: 1) Nem egyenes vonalú. 2) Függvény, melyben legalább egy ismeretlen
egynél magasabb hatványon szerepel. Nonmetric nem metrikus: A metrikus axiómák valamelyikét nem teljesítõ, pl. ~ különbözõség. Normalization normálás: Egy adatvektor egységnyi hosszúságúra történõ átalakítása. Numerical taxonomy numerikus taxonómia: A rendszerezést számítógépes klasszifikációs és ordinációs módszerek segítségével megvalósító irányzat, elsõsorban a fenetikai hasonlóságra alapoz. Célkitûzéseit tekintve kissé idejétmúlt, módszerei azonban továbbra is széles körben használatosak az adatfeltárásban. Ordered character rendezett karakter: Olyan tulajdonság, melynek állapotai leszármazási szempontból sorba rendezhetõk. Lehet reverzibilis vagy irreverzibilis. Ordinal scale ordinális skála: Olyan mérési skála, amelyben a szomszédos értékek közötti különbséget nem értelmezzük (pl. keménységi skála). Ebbõl következõen numerikus feldolgozásuk nehézkes. Ordination ordináció: Dimenzionalitás csökkentését célzó adatfeltáró módszer. Eredménye az ordinációs szórásdiagram, melynek tengelyei mint matematikai konstrukciók biztosítják a lehetõ leghatékonyabb dimenzió-redukciót. Orthogonal ortogonális: Egymásra merõleges (pl. ~ tengely). Orthonormal ortonormális: Egymásra merõleges és egyúttal egységnyi hosszúságú, pl. ~ vektor. OTU, Operational Taxonomic Unit taxonómiai alapegység: A numerikus taxonómiai vizsgálatok objektuma, amelynek konkrét rendszertani szintje (pl. család, faj, alfaj stb.) mindig az adott vizsgálat célkitûzésétõl függ. OUC, Operational Unit of Comparison összehasonlítási alapegység: Többváltozós módszerek eredményeinek összehasonlításában egy objektum, pl. dendrogram, partíció, ordináció, kladogram stb. (meta analysis). Out-group külcsoport: A kladisztikailag éppen értékelt taxonokhoz legközelebb álló csoport, amelyet egyes karakterállapotok polaritásának eldöntésére (vagyis az ~-ban gyakori karakterállapot tekinthetõ õsinek a vizsgált taxonok esetében), vagy a gyökér helyzetének a megállapítására alkalmazunk . Outlier kilógó, zaj-elem: Egyéni módon viselkedõ, a többváltozós struktúrába nem illeszkedõ objektum, mely jelenlétével megnehezíti az illetõ struktúra feltárását. Pl. osztályozás során egyik csoportba sem beosztható elem. Outline kontúrvonal: Biológiai objektumok, pl. fossziliák, levelek stb. külsõ körvonala, amely belsõ bélyegek híján az egyetlen alakbeli információ hordozója lehet. Overlapping classification átfedéses osztályozás: Objektumok olyan, rendszerint nem-hierarchikus csoportosítása, amelyben megengedett, hogy egy objektum egynél több csoportba tartozzon (clumping). Path difference él-eltérés: Egy fa-gráf két objektumát összekötõ út éleinek a száma. Path length úthossz: Egy fa-gráf két objektumát összekötõ út éleihez rendelt súlyok összege. Paraphyletic parafiletikus: Taxonok egy csoportja akkor ~, ha tartalmazza a legközelebbi közös õst de a tõle leszármazott összes taxont nem. Parsimony parszimónia: A kladisztika alapelve, miszerint a kladogramnak a minimális evolúciós utat (minimális evolúciós változásokat jelentõ elágazásrendszert) kell feltárnia.
Kisszótár és kislexikon
379
Partial analysis parciális elemzés: Többváltozós értékelés, pl. ordináció, melybõl bizonyos külsõ
változók hatását eleve kivonjuk, az eredmény tehát adataink szerkezetének ezektõl független részét magyarázza meg. Partition felosztás: Egy objektumhalmaz egymástól páronként diszjunkt részhalmazokra (osztályokra) történõ felbontása. Partition membership divergence partícióba-tartozási divergencia: Azt a tényt felhasználó deszkriptor, hogy egy dendrogram a különbözõ szintekhez tartozó partíciók sorozataként fogható fel. Két objektum közötti ~ azoknak a partícióknak a száma, melyekben ezek nem tartoznak egy osztályba. Patristic distance patrisztikus távolság: 1. A változás mértéke a kladogramok végágain (vagyis egy terminális szögpont és a legközelebb lévõ belsõ szögpont között), tehát egy OTU saját evolúciós elõrehaladásának a mértéke. 2. A változások összege két OTU között egy kladogramban (=path length). Pattern mintázat: (Itt) Biológiai objektumok relatív (valós v. absztrakt térbeli) pozíciójával értelmezhetõ, ill. leírható struktúra, kép, a legáltalánosabb felfogásban.
Permutation test permutációs próba: Randomization test. Phenetics fenetika: Taxonómiai irányzat, amely a (morfológiai v. más típusú) hasonlóság alapján, s nem a leszármazási viszonyok feltárásával osztályozza az objektumokat.
Planned comparison tervezett összehasonlítás: A többszörös összehasonlítások olyan esete, amikor elõre kiválasztott párokra szûkítjük le a szignifikancia tesztet, de ezen párok mindegyike független egymástól. Plesiomorph pleziomorf: Õsi karakterállapot. Plexus graph plexusgráf: Távolságmátrixok közelítõ grafikus megjelenítésének eszköze. Az objektumokat reprezentáló szögpontokat pl. a távolságukkal vagy az asszociáltságuk szignifikanciájával arányos szélességû vonalak kötik össze. Polar ordination polárordináció: Egyszerû ordinációs módszer, amely a legtávolabbi objektumpárok kiválasztásával definiálja a tengelyeket. A tengelyek közvetlen értelmezhetõsége miatt ma is alkalmazzák, bár a kötött ordináció módszerei jóval egyértelmûbbek. Polymorph character polimorf karakter: Kladisztikailag viszonylag nehezen kezelhetõ tulajdonság, amely egy EU-n belül többféle állapotot vehet fel. Polynomial ordination polinomiális ordináció: Dimenzió redukció, melynek során a háttér-dimenziók a pontoknak magasabb fokú egyenletekre való legjobb illesztésébõl adódnak. Polyphyletic polifiletikus: Taxonok egy csoportja, melyeknek közvetlen õsei nem azonosak. Polythetic politetikus: Olyan osztályozás, amelyben az osztályba tartozást egy tulajdonság sem dönti el egyértelmûen, s csak a tulajdonságok többsége a meghatározó. Principal axis fõtengely: Rendszerint a fõkoordináta-elemzés során kapott tengelyeket nevezzük így. Principal components fõkomponensek: A fõkomponens elemzés segítségével meghatározott, ortogonális dimenziók. Principal warps fõtorzulások: Kulcspontok alapján történõ alakelemzésben a nem-affin (nem uniform) alakváltozásokat magyarázó tengelyek. Probabilistic similarity index valószínûségi hasonlóság: Olyan hasonlósági függvény, amelyben a teljes objektumhalmaz alapján becsüljük, hogy egy változóra milyen valószínû az adott két objektum eltérése.
380
D függelék
Probability ellipse valószínûségi ellipszis: A változók normális eloszlása esetén meghatározható el-
lipszis, amely a statisztikai populáció 100(1α) százalékát tartalmazza, ahol rendszerint α=0,05 vagy 0,01. Procrustes analysis Prokrusztész elemzés: Ordinációk öszehasonlítása a két konfiguráció egymásra forgatásával olymódon, hogy a megfelelõ pontpárok közötti távolságnégyzetösszeg minimális legyen. Proximity közelség: Leginkább a pszichometriai irodalomban használatos gyûjtõfogalom a resemblance jelölésére. Quadrat kvadrát: Cönológiai mintavételi egységek általánosan alkalmazott, összefoglaló elnevezése (nem feltétlenül négyzet alakú egységekre is utalnak vele!). Q-type ordination Q-típusú ordináció: Objektumok ordinációja a közöttük számított távolság- v. más mátrix alapján. Randomization test randomizációs próba: Újramintavételezési technika, melynek alapja az eredeti minta adatainak véletlenszerû átrendezése, s valamely statisztika ebbõl történõ kiszámítása. Mindezt igen nagyszámban megismételve megvizsgáljuk, hogy az eredeti mintából kapott statisztika miképpen viszonyul az átendezett mintákból számított statisztikák eloszlásához. A pontos randomizációs próbától (exact randomization test) való megkülönböztetés céljából sampled (mintavételes) ~-nek nevezzük. Range terjedelem: Egy változó minimális és maximális értéke közötti különbség a mintában. Rank rang: 1) Egy mátrix háttérdimenzióinak száma, a pozitív sajátértékeik száma. 2) Többnyire nagyság szerint sorbarendezett értékek egyikének sorszáma. Rank correlation rangkorreláció: Változók kapcsolatának kifejezésére alkalmas mérõszám, amely az aktuális értékek helyett azok mintabeli rangszámát veszi csupán figyelembe. Ranking sorbarendezés: Változók fontosságbeli sorrendjének megállapítása pl. diszperziós vagy információ-elméleti kritériumok figyelembevételével. Ratio scale arányskála: Olyan mérési skála, amelyben az értékek arányossága is értelmezhetõ, mint pl. hosszúság, térfogat mérése esetén. Reciprocal averaging reciprok átlagolás: Iteratív módszer a változók és az objektumok együttes ordinációjára (correspondence analysis). Reconstruction rekonstrukció: (Itt) A karakterállapotok kiosztása a HTU-kra olymódon, hogy a fában minimális legyen az összváltozások száma. Redundancy analysis redundancia elemzés: Kötött ordinációs módszer, amely olyan fõkomponens elemzésnek tekinthetõ, ahol a tengelyek külsõ változók lineáris kombinációi. Regression regresszió: Egyenes vagy adott dimenzionalitású felület illesztése pontokra, egy független és egy v. több függõ változó kapcsolatának függvényszerû kifejezésére. Ha a függvény lineáris, akkor lineáris regresszióról beszélünk. Relative warp analysis relatív torzulások elemzése: Objektumoknak egy referencia-egyedhez viszonyított nem uniform alakváltozásait elemzõ többváltozós értékelés, pl. PCA. Resampling újramintavételezés: Egy mintát kiinduló populációnak tekintünk, s abból új mintát veszünk. Számítógépek intenzív alkalmazását igénylõ eljárások (randomization test, bootstrap, jackknife) gyûjtõneve. Resemblance function komparatív függvény: A távolság-, hasonlóság- és különbözõségi függvények viszonylag semleges hangzású gyûjtõneve.
Kisszótár és kislexikon
381
Retention index összetartási index: Tulajdonságok kladogram-beli viselkedését kifejezõ index,
amely annál magasabb értéket ad, minél kisebb a homoplázia részesedése a szünapomorfiák kialakulásában. Reversal visszafordulás: 1) Két osztály alacsonyabb hierarchikus szinten kapcsolódik egymáshoz, mint amelyiken ezek egyike vagy mindkettõ korábban létrejött. 2) Egy tulajdonság visszaalakulása a leszármaztatott állapotból az õsibbe. Robustness robusztusság: Bizonyos statisztikai (s így többváltozós) módszerek képessége, hogy elfogadható de legalábbis értékelhetõ eredményt produkáljanak akkor is, ha a módszer alkalmazásának feltételei nem teljesülnek. Általánosabban: érzéketlenség, sõt közömbösség bizonyos feltételek nem teljesülésével szemben. Rooted tree gyökeres fa-gráf: Olyan fa, amelyben az élek egy kitüntetett szögponttól futnak, azaz az irányított fa-gráf. Egy kladogramban a gyökér a közös õsnek, egy dendrogramban a legfelsõ hierarchikus szintnek felel meg. R-type ordination R-típusú ordináció: Objektumok ordinációja a változók között számított pl. korrelációk alapján. Sample minta: A stisztikai populációból megkapható összes lehetséges adat egy alkalmas módon, minmtavételezéssel kiválasztott részhalmaza. Sample size mintanagyság: A minta elemeinek a száma (nem a mintavételi egység mérete!). Sampling mintavétel: Eljárás a populációból származó minta elõállítására. Sampling unit mintavételi egység: A stisztikai alapsokaság egy egyértelmûen elhatárolt, a mintavételezés technikai megvalósításakor alkalmazott része. Scattergram szórásdiagram: Adatok ábrázolása koordináta-rendszerben elhelyezkedõ pontok segítségével. Scree plot lejtõdiagram: Sajátértékek relatív fontosságát illusztráló oszlop- (vagy hasonló jellegû) diagram. Seriation szeriálás: Adattáblázat sorainak és oszlopainak átrendezése olymódon, hogy a sorok sorrendisége a legjobban tükrözze az oszlopok sorrendiségét (pl. reciprok átlagolás révén).
Shear: Uniform transformation. Shepard diagram: A nem-metrikus többdimenziós skálázás eredményének jóságát illusztráló
szórásdiagram, amelyben egy pont egy objektumpárt reprezentál, ennek koordinátái pedig az ordináció-beli és az eredeti távolságértékek. Similarity hasonlóság: A különbözõséggel komplementer fogalom. Minden hasonlóság elõállítható valamely különbözõségbõl, ha a konkrét értéket a lehetséges maximumból kivonjuk. Simple average clustering egyszerû átlag módszer: Hierarchikus osztályozó módszer, melyben az osztályok méretüktõl függetlenül, azaz egyformán járulnak hozzá az átlagos hasonlóság kiszámításához (=WPGMA, Weighted Pair-Group Method using arithmetic Averages). Simple matching coefficient egyezési koefficiens: Az egyik legegyszerûbb hasonlósági index, amelyben a két objektum közötti megegyezést adó tulajdonságok számaránya fejezõdik ki. Single link egyszerû lánc módszer: Klasszifikációs algoritmus, amelyben két osztály távolságát a legközelebbi két objektum távolságaként definiáljuk. Space series tér(beli) sor: Valós vagy konceptuális terekben (pl. ordinációs vagy klasszifikációs tér) alkalmazott kismértékû változtatások logikailag elrendezett sorozata (primary series), ill. az ennek révén kapott eredmények sorozata (dependent series). Térbeli sor például a
382
D függelék
mintavételi terület nagyságának növelése, vagy egy dendrogram sorozat, amelyet a flexibilis technikával allítottunk elõ. Sphericity gömbalakúság: Egy pontfelhõ semleges szerkezete, mert nincsenek kitüntetett irányok. Pontosabban: a centroidtól vett maximális távolság minden irányban azonos.
Spurious correlation mesterséges v. hamis korreláció: Magas értékû, de jelentés nélküli, tehát
véletlenszerûen vagy a kísérleti, ill. mintavételi körülmények helytelen megválasztásából adódó korreláció. Tágabb értelemben a látszatkorreláció is ide tartozik, amikor is egy magas érték nem közvetlen ok-okozati összefüggésben álló változókra jelentkezik, mert ezek külön-külön egy harmadik magyarázó változóval korrelálnak voltaképpen. Ez utóbbira a többváltozós elemzésben rendszerint fény derül, az elsõ azonban mindig kerülendõ.
SSCP (sum of squares and cross-products) matrix négyzetösszegek és keresztszorzatok mátrixa: Egy adatmátrix megszorzása a transzponáltjával. Centrált és a szórással standardizált adatokból számítva ez a korrelációs mátrixot jelenti.
Stability stabilitás: (Itt:) Többváltozós módszerek ellenállóképessége az adatok megváltozásának hatására. Egy eredményt akkor nevezhetünk stabilisnek, ha az adatok kismértékû megváltoztatása csak ezzel arányosan kismértékû változást okoz.
Standardization standardizálás: Adatok átalakítása az összehasonlíthatóság (commensurability) elérése végett valamilyen, magukból az adatokból származó függvény segítségével. Legszûkebb értelemben csak centrált adatoknak a szórással való osztását tekintik ~-nak.
Stepwise discriminant analysis lépcsõzetes diszkriminancia elemzés: A diszkriminancia analízis olyan sokak által nem ajánlott válfaja, amikor lépésenként egy-egy változót kihagyunk vagy bevonunk az elemzésbe, hogy lehetõvé váljék a csoportok minél optimálisabb elkülönítése.
Stopping rule leállási szabály: Elõre megszabott feltétel egy számításmenet befejezésére. Stress stressz: Kénytelen-kelletlen elfogadott eltérés valamilyen hivatkozási alaptól. Nem-metrikus többdimenziós skálázásban annak mértéke, hogy mennyire kell a távolságokat megváltoztatni a monotonitás eléréséhez.
Strict consensus szoros v. szigorú konszenzus: Olyan egyesített (konszenzus) eredmény, amely
csak annyi részletet ábrázol, amennyiben minden kiinduló eredmény tökéletesen megegyezik.
Subtree membership divergence részfábatartozási divergencia: Egy fa olyan részfáinak a száma, amelyekben a kérdéses két objektum nem szerepel együtt.
Sum of squares négyzetösszeg: Egy minta elemeinek négyzetösszege. Synapomorphy szünapomorfia: Két vagy több EU megegyezése egy apomorf karakterben. Elsõdleges fontosságú az evolúciós utak feltárásában.
Symplesiomorphy szümpleziomorfia: Két vagy több EU megegyezése egy pleziopomorf karakterben. Nincs kladisztikai jelentõsége.
Ternary plot háromszögdiagram: Olyan háromváltozós esetek illusztrálására alkalmas speciális szórásdiagram, amikor az értékek összege 1 minden objektumra.
Thin plate spline vékonylemezes interpolációs függvény: Mérõpontokkal jellemzett alakok egymásba alakítására alkalmazható többváltozós függvény. Ennek segítségével választhatók szét a uniform és nem-uniform alakváltozások.
Kisszótár és kislexikon
383
Three-way matrix háromutas tömb: Olyan adattáblázat, amelyben az oszlopokon (pl. objektu-
mok) és a sorokon (pl. tulajdonságok) kívül egy harmadik tényezõ is szerepel, rendszerint az idõ. (Matematikailag nem mátrix, hanem mátrixok egy sorozata.) Tie egyezés: 1. Megegyezõ értékek egy rangsorban. 2. Egy algoritmikus keresés során a maximum (vagy a minimum) érték nem egy helyen jelentkezik, pl. a hierarchikus osztályozásban. Önkényes feloldása nem egyértelmû végeredményre vezet, ezért helyes, ha legalább a jelenlétükrõl v. hiányukról meggyõzõdünk. Topological difference topológikus eltérés: A dendrogramban két objektumot összekötõ út mentén megszámlálható belsõ szögpontok száma. Eggyel kisebb, mint a path difference. Transect transzszekt: Mintavételi egységek szabályos térközökben elhelyezett sora egy egyenes mentén (lehet idõbeli is). Rendszerint valamilyen grádiens vizsgálatában alkalmazzák. Transformation transzformáció: Adatok átalakítása valamilyen nem az adatokból számított függvény segítségével, pl. log vagy arc sin transzformáció (vö. standardization). Célja rendszerint a változó eloszlásának megváltoztatása, hogy ezáltal teljesítse az alkalmazandó módszer támasztotta feltételeket. Tree fa-gráf: Olyan gráf, amelyben nincsenek körök, vagyis bármely két objektum között egy s csak egy lehetséges út van. Triangle inequality háromszögegyenlõtlenség: A metrikus axiómák egyike, miszerint bármely három pontra nézve egyik távolság sem lehet nagyobb, mint a másik kettõ összege. Ultrametric inequality ultrametrikus egyenlõtlenség: A háromszög-egyenlõtlenségnél szigorúbb feltétel, miszerint bármely három objektumra nézve két távolságérték azonos, a harmadik pedig szükségképpen nem kisebb ennél (nevezhetnénk egyenlõszárú háromszög-egyenlõtlenségnek is). Uniform shape transformation uniform alakváltozás: Az alak olyan megváltozása, amikor a változás relatív mértéke csak a változás irányától függ, de független a helytõl (homogén alakváltozás). Szemléletesen: a párhuzamos vonalak párhuzamosak maradnak. Ha az aránybeli megváltozás már helyenként is más és más, akkor non-uniform (vagy non-affine) transzformációról beszélünk. Unipolar axis egypólusú tengely: Ordinációs tengely, amelyre minden objektum koordinátájának azonos az elõjele.
Unordered character rendezetlen karakter: Fitch character. Unplanned comparisons nem-tervezett összehasonlítások: A többszörös összehasonlítások olyan
esete, amikor minden párosítás érdekes, és a szignifikáns párokat utólag keressük ki. Mivel ezek nem feltétlenül függetlenek, a döntési kritérium szigorúbb a tervezett eseteknél. Unrooted tree gyökér nélküli fa-gráf: Fa-gráf, amelyben nem szerepel a gyökér, ezáltal az élek irányítatlanok. Variance variancia: Egy változónak a várható értékétõl vett négyzetes eltéréseinek várható értéke. Vertex szögpont: Egy gráfban az objektumokat reprezentáló csúcs (szögpont), amelyet a többivel él (edge) köthet össze. Wagner character Wagner-féle tulajdonság: Olyan tulajdonság, melynek lehetséges állapotai sorba rendezettek, és átalakulásuk mindkét irányban végbemehet. Wagner method Wagner-féle módszer: A kladisztika egyik távolság-alapú eljárása.
384
D függelék
Weighted averaging súlyozott átlagolás: Direkt ökológiai ordinációs módszer, amelyben az objek-
tumok (pl. helyek) pozícióját a bennük levõ fajok és egy indikátorváltozó súlyozott összege adja. Weighted tree súlyozott fa: Olyan fa-gráf, melynek éleihez értékeket (súlyokat) rendelünk; pl. a súlyozott kladogramok, amelyekben egy él a két evolúciós állapot közötti átmenet nagysága. Weighting súlyozás: Változók fontosságbeli eltérése (belsõ ~), ill. ennek mesterséges fokozása v. csökkentése (külsõ ~). Egy borításértékeket tartalmazó táblázatban a fás és lágyszárúak értékei eleve mások (belsõ ~), amely standardizálással kiegyenlíthetõ (külsõ ~). Wilks lambda Wilks-féle lambda: Statisztika annak kifejezésére, hogy adott csoportok származtathatók-e ugyanazon statisztikai populációból (pl. MANOVA, diszkriminanciaelemzés). Értéke 1, ha a csoportok centroidjai statisztikailag megkülönböztethetetlenek egymástól, míg 0-t kapunk maximális eltérés esetén. Zapping többváltozós struktúrakeresgélés: Kissé gúnyoros (de nem feltétlenül elítélõ) elnevezése annak a folyamatnak, amikor egy teljesen ismeretlen szerkezetû, többváltozós adathalmazt különféle módszerekkel megnézünk, pl. kívülálló objektumok (outlier) keresése céjából.