1
1. A Genom
A GENOM SZERKEZETE A mitokondriális genom Az eukarióta szervezetek sejtjeiben kétféle genom található: a sejtmagiés a citoplazmás genom; ez utóbbi mitokondriális és a kloroplasztisz DNS-t foglalja magába. A mitokondrium hozzávetőlegesen 1,5 milliárd éve keletkezett egy bíbor baktériumból, amely egy eukarióta sejttel lépett szimbiózisba. A mitokondrium bakteriális eredetére utaló sajátságok a következők: (1) a mitokondriális (mt)DNS megtartotta gyűrű alakját; (2) a mtDNS génjeiben nincs intron; (3) a riboszómák baktériumokra jellemzőek (a nagy alegység a baktériumok 70S, nem pedig az eukarióták 80S alegységéhez hasonlít); (4) a mtDNS saját transzfer RNS-eket kódol; és (5) a mitokondrium, a baktériumokhoz hasonlóan, ún. bináris osztódással szaporodik. Az emlős mitokondriumok génjeinek zöme elveszett, egy kisebb hányada pedig átkerült a kromoszómába. A következő gének maradtak meg a mitokondriumban: (a) 13 fehérjéket kódoló gén, melyek mindegyike az oxidatív foszforiláció enzimjeit kódolja; (b) egy-egy 12S és 16S rRNS-t kódoló gén, (c) 22 tRNS gén. Azért elegendő 22 tRNS a transzlációhoz, mert több ezek közül több nem csupán egy tripletet (antikodont) ismer fel az mRNS-en (lötyögés), hanem kettőt vagy hármat. Ez a jelenség azért nem okoz zavart a fehérjeszintézisben, mert az egy tRNS által felismert összes kodon ugyanazt az aminosavat kódolja. Mitokondriumokból sejtenként hozzávetőlegesen ezer darab található (nagy energiaigényű sejtekben több: pl. szívizomsejtek). A mtDNS-ből pedig 5-10 darab található mitokondriumonként. Tehát, egyetlen átlagos sejtben 5-10 ezer mtDNS található. A mtDNS-ben eltérések találhatóak az univerzális kódtól: kodon UGA AGA ACG AUA CUN CGG
az univerzális kódban a mitokondriumban stop Trp (emlős, rovar, élesztő, gomba) Arg stop (emlősök, rovarok) Arg stop (emlősök) Ile Met (emlősök, rovarok, élesztő) Leu Thr (élesztő) (N: bármilyen bázis) Arg Trp (kukorica)
Genom programok A DNS szekvenálás költségei rohamosan csökkennek, s egyre több faj genomjának meghatározása folyik a különböző laboratóriumokban. Eleinte a kis genommal rendelkező vírusok DNS-ét szekvenálták meg, később egy kisebb baktérium, a Haemophilus influenzae (korábban tévesen az influenza okának hitték, innen a név) genomja vált ismerté. Eddig főként olyan fajok DNS sorrendjét határozták meg, amelyek az ember számára valamilyen szempontból fontosak. Ilyenek a tudomány modell szervezetei (E. coli, egér, ecetmuslica, lúdfű, stb.), a mezőgazdasági haszonnövények és állatok (ló, szarvasmarha, búza), a házi kedvencek (kutya, macska), az emberszabásúak (rokonságunk okán; csimpánz, gorilla), kórokozók és terjesztőik (Plasmodium malariae és vektora a malária szúnyog). A Humán Genom Projekt (HGP) a legnagyobb tudományos vállalkozásnak bejelentett program, melynek deklarált célja az emberi genom megfejtése volt. A terv szerint 3 milliárd dollárból 15 év alatt szándékozták megvalósítani a projektet; tehát, bázispáronként egy dollár költséggel kalkuláltak. A program 1990-ben James Watson vezetésével indult. Több egyén genom-részleteiből akarták összerakni az emberi DNS-t (utólag kiderült, hogy az egyik maga J. Watson volt). Nyilvánosságra került, hogy Watsonnak érdekeltségei vannak bizonyos biotechnológiai cégekben, ezért, lényegében lemondatták (Megjegyzés: JW-t azóta az állásából is kirúgták rasszista és nőellenes megnyilvánulásai miatt). Francis Collins lett az új programvezető, aki egy nemzetközi konzorciumot toborzott a következő államok részvételével: USA, Kína, UK, Japán, Németország, Franciaország. 1998-ban Craig Venter kilépett az állami projektből, s saját céget alapított, Celera Genomics néven, amely versenybe szállt a konzorciummal. A Venter-féle projektben öt egyén genom-részleteit szekvenálták (a szekvenciák kb. ¾-e Venter DNS-e volt; megjegyzés: Venter nárcisztikus hajlama közismert). Venter egy új stratégiát alkalmazott, melynek lényege az volt, hogy véletlenszerűen előállított DNS szekvenciák sorrendjét állapította meg, melyeket a számítógép rendezett sorba az átfedő szekvenciák alapján (shot gun technika = sörét technika). Ezzel szemben az állami konzorcium a hagyományos megközelítést alkalmazta: először feltérképezte a genom nagyobb szegmenseit (megállapította, hogy a DNS darabok, milyen más szekvenciák szomszédságában helyezkednek el), majd csak ezután következett a szekvenálás. Venter megközelítése jóval hatékonyabbnak bizonyult: sokkal rövidebb idő alatt jóval kevesebb pénzből tudta ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
2
1. A Genom megszekvenálni az emberi DNS-t. A konzorcium felismervén, hogy vesztésre áll, tisztességtelen játszmákba kezdett. Többek között azt állította, hogy Venter szabadalmaztatni akarja az emberi genomot, s ezért az a szabad kutatás számára nem lesz hozzáférhető. Ez egy csúsztatás volt, mert Venter a szekvenciákat a kutatás rendelkezésére bocsátotta, csupán némi díjat kért a szekvenciákhoz való hozzáférhetőségért. Az ő rendszerében a cégeknek kellett volna fizetnie, ha használni akarják a DNS-t. A konzorcium teljesen szabad hozzáférést biztosított a szekvenciákhoz, melynek eredménye az lett, hogy egyes gyógyszer és biotech cégek ingyen jutottak hozzá a konzorcium által publikált szekvenciákhoz, melyeket ők maguk szabadalmaztattak. A humán genom nyers változatát (a DNS 90%-ának bázissorrendje) 2001-ben közölték. Bill Clinton, az USA akkori elnöke, az állami konzorcium kudarcait leplezvén, Venterrel és a Collinsszal az oldalán jelentette be a nagy eseményt. A genom teljes változatát (a genom 99%-a) 2004-ben tették közzé. A hiányzó 1%-ot a centromer környéki repetitív DNS szekvenciák teszik ki; ezek megszekvenálása a sok ismétlődés miatt nehézségekben ütközött.
Egy ember diploid genomja A humán genom szekvencia közzétételét követően, Craig Venter új vállalkozásba kezdett, a saját diploid genomjának megszekvenálását tűzte ki célul. A szekvencia eredményekből kiderült, hogy Venter anyai és apai kromoszómái között több mint 4 millió eltérés mutatható ki, melyek az egyetlen nukleotid (bázis) különbözősége (egy nukleotid polimorfizmus = single nucleotide polymorphism; SNP) és hosszabb-rövidebb DNS-szakaszok beépülése vagy kiesése (indelek: inszerciók és deléciók) voltak. Olyan géneket is felfedeztek, amelyek eltérő számú másolatban vannak jelen a kromoszómapár két tagján (kópiaszám variáció = copy number variation; CNV). Ez azt jelenti, hogy Venter génjeinek 44 százaléka különbözik valamennyire az anyai és az apai kromoszómáján. Korábban két tetszőleges egyén közötti különbséget 0,1%-ra becsülték, ez az érték azonban az új diploid szekvencia adatok alapján legalább 0,5%! Viszonyításképpen, az ember és a csimpánz 1,2%-ban különbözik a pont mutációk tekintetében (1% különbség a kódoló szekvenciákban). Összességében, a deléciók, inszerciók és kromoszóma átrendeződések figyelembevételével, a két faj 3%-ban különbözik egymástól. Rasszok diploid genomja Venter szekvencia adatainak közzétételét követően, még ugyanabban az évben (2007) James Watson genomszekvenciáját is közölték. Mivel mindketten az europid nagyrassz képviselői, ezért a humán genom könyvtár teljesebbé tételéhez szükség volt azt a többi nagyrasszokból származó géntérképekkel bővíteni. 2008-ban egy han nemzetiségű kínai és egy jorubaetnikumú, nigériai férfi teljes genetikai állományát határozták meg. A Humán Variom Projekt A különböző egyénekből származó változékony DNS szekvenciák összegyűjtése főként orvostudományi indíttatású, a deklaráció szerint az ún. személyre-szabott orvostudomány (personalized medicine) számára gyűjt hasznos információkat. A személyre-szabott orvostudomány koncepciója azon alapul, hogy az emberek között különbségek vannak, ezért mindenki egyedi gyógymódot igényel. Az egyedi gyógymódot a modern molekuláris biológia eszköztárával lehet majd megvalósítani. Ehhez azonban alapvetően át kell alakítani a gyógyszerkifejlesztés és engedélyezés jelenlegi gyakorlatát, melynek jellemzője a rendkívül hosszú klinikai tesztelési időtartamok és ennek elképesztő összegű finanszírozási igénye (több tízmillió dollár egyetlen gyógyszer kifejlesztésének költsége). Az USA-ban új megközelítéséken dolgoznak. A HapMap Projekt keretében az emberi SNP mintázatokat kutatták. Az 1000 genom projekt szintén a humán variom vizsgálatát tűzte ki célul. Szemben az előző megközelítéssel, amely az adatbázisokból nyer szekvencia információkat, az 1000 genom projekt keretében nagyszámú egyén DNS-ének szekvenálása folyik, deklaráltan az ember genetikai változékonyságának megismerése céljából. A projektet 2010-ben fejezték be. Ma már a nagyobb volumenű genom projektek futnak: Nagy-Britannia százezer, az USA sé Kína 1-1 millió emberi DNS megszekvenálásba kezdett bele. Dél-Afrika Projekt Jelenleg Venterék intézete a dél-afrikai populációk genetikai vizsgálatát végzi (Venter új vállalatának neve: J. Craig Venter Institute: JCVI). A csettintő nyelveket beszélő néptörzsek különböznek a leginkább a többi ember típustól. Az a helyzet, hogy nagyobb a genetikai variáció két busman között egy Afrikai faluban, mint egy magyar és egy kínai között. A legújabb eredmények szerint a modern ember (Homo sapiens) nem Kelet-Afrikában, hanem DélAfrikában jött létre. A bőrszínek alapján felállított rasszok nem helyes kategóriák, mert egy etióp fekete bőrű ember közelebb áll egy európaihoz, vagy egy ázsiaihoz, mint egy busmanhoz.
A gének szerkezetének ismerete – a betegségek felismerése és gyógyítása: a remény és annak korlátai A DNS szerkezetének megfejtését az a motiváció hajtotta, hogy ha megismerjük a DNS bázissorrendjét, akkor egyben azt is meg fogjuk tudni, hogy miként működik a genetikai anyagunk, s e tudás birtokában, többek között, képesek leszünk meggyógyítani a betegségeket. Igaz ez vajon? E remény korlátait a következő tények képezik: (1) A gén szerkezetéből nem vezethető le a gén működése, csupán a kódolt fehérje elsődleges szerkezete. Márpedig, a gének működésében nincs, vagy alig van különbség az emlősfajok között. A fenotípusbeli különbségekért elsősorban gének működésbeli különbségei felelősek. (2) Az összes betegség csak egy bizonyos (nem ismert) hányadát alkotják a genetikai
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
3
1. A Genom betegségek. (3) Szinte csak azoknak a genetikai betegségeknek a genetikai hátterét ismerjük, amelyeknél a gének fehérjét kódoló régióiban történt a mutáció, s a betegség kialakulásához egy gén mutációja elegendő. A monogénes betegségek* a genetikai betegségeknek csupán 2%-át alkotják, szemben a poligénes betegségekkel, melyek a genetikai betegségek 98%-áért felelősek. A genom szerkezetének megismerése, nem ad választ arra a kérdésre, hogy milyen gének játszanak szerepet az adott betegség kialakításában. Ha viszont, már ismertek ezek a gének, akkor a szekvenciális adatok hasznosak lehetnek a poligénes betegségek diagnosztizálásában (megállapításában), ill. prognosztizálásában (előrejelzésében). (4) A gének szabályozó régióiban történő változékonyság jelentőségét jelenleg alig ismerjük, sőt a legtöbb esetben azt sem tudjuk, hogy egy adott szekvencia részt vesz-e a génkifejeződés szabályozásában. Pedig valószínűsíthető, hogy a betegségek nagy többségét a gének szabályozó régióiban bekövetkező mutáció okozza. Tehát, nem elegendő a bázissorrend ismerete, tudnunk kell, hogy egy-egy változás a DNS-ben milyen szerepet játszhat egy adott betegség kialakításában. Reményre adhat okot az a tény, hogy az emberek közötti genetikai különbség kicsi, ezért, a szabályozó szekvenciák szerepének tisztázása, a jövőben lehetővé teheti a betegségek prognosztizálását pusztán szekvenciális adatokból (nem kell megvizsgálni, hogy az érintett szervekben hogyan fejeződnek ki az adott gének). Jelenleg azonban egyszerűbb a gének kifejeződését vizsgálni. A gén expressziós vizsgálatoknál azonban mindig az érintett szöveteket (mRNS és/vagy fehérje tartalmat) kell megvizsgálni, szemben a DNS szekvenciákkal, mely technikával bármilyen, könnyen hozzáférhető szövet (vér, bőr, nyálkahártya) vizsgálható. (5) Nem egyértelmű a gének és a környezet kapcsolata sem: a környezet a gének kifejeződésre hat, ez az információ azonban nincs benne a DNS bázis sorrendjében. A környezeti hatások sok esetben a DNS metilációs - és a hisztonok kémiai mintázatainak megváltozását okozzák, s ezek a génkifejeződést szabályozzák.
Az emberi genom 3,2 gigabázis párnyi (milliárd) DNS-e 23 kromoszómában helyezkedik el (haploid genom). Az emberi genom nagyobbik felét ismétlődő szekvenciák alkotják, melyek egy része (3%) egyszerű ismétlődés, egy másik része (5%) nagy kromoszómális szegmensek megkettőződése, a genom közel felét pedig ún. ugráló gének (transzpozonok, másnéven, mozgékony genetikai elemek) alkotják. Az ugráló gének egy kisebb hányadát (3%) az ún. DNS transzpozonok, a nagyobbik hányadát (~45%) pedig retrotranszpozonok alkotják. A régebbi kolonizáció eredményeként a genomba került transzpozonok már a felismerhetetlenségig megváltoztak, ezért valószínűsíthető, hogy az emberi DNS legalább 75%-a ugráló gén eredetű. Vannak, akik különbséget tesznek az alábbi két fogalom között: a retrotranszpozonok önállóan (autonóm módon) is képesek mozgásra, míg a retropozonok nem, vagy csak más mobilis elemek által kódolt enzimek révén. Autonóm retroelemekből (minden komponensük meg van a helyváltoztatáshoz) rendkívül kevés található az emberi genomban, a többi mobilizációra képes elem ezek enzimjeit használja. A fehérjéket kódoló exon szekvenciák csupán a genom 1,1%-át teszik ki, míg az intronok aránya 26% (legújabb becslések szerint több mint 30%). A genomban a nagyfokú evolúciós konzerváltságot mutató szekvenciák aránya 4%, melyből 1,1%-ot a kódoló szakaszok, a maradékot pedig szabályozó genetikai régiók és számos ún. RNS gén teszik ki. Az emberi genom háromféle szekvenciát tartalmaz: (1) kódoló (1,1%), (2) génekkel kapcsolatos (36%) és (3) intergénikus (gének közötti; 63 %) szekvenciákat. A génekkel kapcsolatos szekvenciák a következők: pszeudogének, génfragmensek, intronok és az ún. UTR-ek (ld. később). Az intergénikus szekvenciák ismétlődő (transzpozonok, ill. az egyszerű és nagy ismétlődések) és az egyéb DNS szekvenciákat foglalják magukba. Megjegyzés: a fenti rendszer nem tartalmazza az RNS géneket, mivel ezek feltérképezése még folyamatban van.
A. KÓDOLÓ SZEKVENCIÁK Természet kontra nevelés A genom szekvenciák ismerete előtt, kb. százezer gént jósoltak, a csupán 22,000 gén meglepetésként hatott. Craig Venter értelmezése szerint „Túl kevés génünk van ezért „a genetikai meghatározottság (az eszme, mely szerint egy egyén a génjei által meghatározott) - egy nagy tévedés”. Helyes vajon ez a felfogás? Ez az állítás ahhoz az érveléshez hasonlítható, mely szerint, mivel a DNS csak 5 féle atomból (C, N, O, H, P) épül fel, ezért nem hordozhat olyan komplex információt, mint pl. az emberi agy. Megjegyzés, a fehérjék száma hozzávetőleg 100,000, azaz jóval magasabb a génekénél (ennek okáról máskor). Megjegyzés: a fehérjéink száma valóban 100,000. Ennek oka az alternatív mRNS érési folyamatokban rejlik. Az ember génjei A diagramon az ismert funkciójú emberi gének (10-12 ezer) csoportosítása látható (funkció szerinti csoportosításban). (1) A gén expresszióval, a replikációval és a genom fenntartásával foglalkozó gének az összes ismert gén 23,2%-át alkotják. (2) A jelfolyamatokban résztvevő gének aránya 21,1%; (3) Az általános biokémiai funkciók (anyagcsere, sejtváz, stb.) ellátását a gének 17,5%-a végzi. (4) Az egyéb funkciójú (transzport, szerkezet, immunológiai) gének az ismert gének 38,2%-át
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
4
1. A Genom teszik ki. Az alacsonyabbrendű fajokhoz képest az emlősök génjeinek nagyobb hányada foglalkozik a genetikai szabályozással. A génfunkció evolúciója Bár a gének funkciója ritkán változik az evolúció során, az elsődleges szerkezetük (bázisösszetételük) változhat. Az esetek többségében nem tudjuk, hogy a megváltozott összetételű fehérje funkciója módosult-e. A konzervatív gének, mint a nevük is jelzi, nem változnak nagy evolúciós távolságokban sem. A következő géncsoportok tartoznak ide: (1) a sejt alapfunkcióit ellátó gének: a metabolikus enzimeket és a sejtváz elemit kódoló gének; (2) a szabályozó gének: Hox gének, szignál transzdukciós jelutak elemei, stb. A gyorsan változó gének az embernél a szexualitással, az immunvédekezéssel kapcsolatos gének, míg az egérnél ugyanezek, plusz a szaglással kapcsolatos gének. Az embernél, hasonlóan a majmokhoz, a szaglással kapcsolatos gének jelentős része degradálódott, sőt az ember feromonokat érzékelő ún. vomeronazális szerve hiányzik is (de azért bizonyos fokig érezzük a feromonokat a normál szagló receptorokkal). Vita folyik arról, hogy a fajon belüli fenotípusos változékonyságért a gének funkcióbeli vagy szabályozásbeli változékonysága felelős. A modern elképzelés szerint, szemben a gének szabályozásával, gének funkciója nem mutat jelentős változékonyságot egy fajon belül. Mi a gén? A genetika fejlődését egészen mostanáig a DNS kódoló részeinek, a géneknek, a vizsgálata jellemezte. A gén fogalma látszólag egyszerű, pontosan megfogalmazni azonban nehéz. Nézzük meg, hogy hogyan változott a génfogalom az idők során, a molekuláris biológia korszakára korlátozva az elemzést. (1) Az Egy gén, egy enzim hipotézis. Beadle és Tatum (1941) egy kísérleti rendszert állított fel, melynek segítségével kapcsolatot kerestek a gének és az enzimek között. Az volt a kutatók hipotézise, hogy a gének és az enzimek közötti kapcsolatra az egy-az-egyhez viszony jellemző, ezért lehetséges olyan mutánsok előállítása, amelyek nem képesek egy specifikus enzimreakció véghezviteléhez. A hipotézisük teszteléséhez egy élesztő fajt (Neurospora crassa) mutagenizáltak Röntgen vagy UV sugárzással, majd a keletkezett mutánsokat tanulmányozták. A mutáns gombáknak különféle speciális tápanyagokra (aminosavak, vitaminok) volt igényük, melyek, szemben a normál gombákkal, csak akkor éltek túl és szaporodtak, ha ezeket az anyagokat hozzáadták a táptalajhoz. A mutánsok genetikai analízise szerint ezek a szervezetek csupán egyetlen génben különböztek a nem-mutáns gombáktól. A biokémiai vizsgálatok azt mutatták, hogy a mutánsok a metabolikus útvonalak egy bizonyos lépésében blokkoltak, ezért a lebontásra képtelen anyag nagy mennyiségben halmozódott fel a sejtekben. A kutatók feltételezésének megfelelően, egyetlen génben sikerült mutációt generálniuk, mely egy enzimet képtelenné tett a feladata elvégzésre, ezért kellett külső tápanyagot adni a rendszerhez. A fenti eredmények alapján, a gén mibenlétének magyarázatára Beadle és Tatum az egy gén – egy enzim hipotézist állították fel, mely szerint egy gén egyetlen enzimet kódol. A kísérleteik megértéséhez tegyük fel, hogy az 5. enzim nem működik. Ekkor E szubsztrát felhalmozódik, s nem keletkezik F termék – ez biokémiai vizsgálatokkal (enzimreakciók mérése) kimutatható. Mint később kiderült, Beadle és Tatum a gén fogalmát illető meghatározása nem volt pontos, mert pl. nem minden fehérje enzim és egy fehérje több alegységből is állhat (pl. a hemoglobint 4 alegység szerkezetű). (2) Az egy cisztron, egy polipeptid hipotézis Seymour Benzer (1955) az E. coli T4 bakteriofágjának DNS-ében indukált mutációkat, s genetikai rekombinációval a gének szerkezetét vizsgálta. E kutatások eredményeinek alapján bevezette a cisztron fogalmát, mely szerint a cisztron a genetikai működés funkcionális egysége, s egy cisztron polipeptid molekula kódolásáért felelős. A későbbiek során a cisztron fogalma egyszerűen kiment a divatból, s helyette (3) az egy gén, egy polipeptid nevezéktant használták. (4) Egy gén, több fehérje A modern technikák alkalmazása révén olyan tények láttak napvilágot, mely szerint az RNS képzése során különféle alternatív folyamatok (alternatív promóter használat, alternatív splicing, - capping, poliadeniláció révén egy gén több fehérje információját hordozza. A gén szerkezete Egy gén leíródó és szabályozó régiókból áll. A leíródó rész a mRNS-ben is jelenlévő exonokból (kódoló és nem kódoló régiók) és a pre-mRNS-ekből kivágódó intronokból áll. A kifejezések onnan jönnek, hogy az intronok a sejtmagban benn maradnak (in the nucleus), míg az exonok eltávoznak onnan (exit the nucleus). Az emberi gének túlnyomó többsége intronokat tartalmaz. Néhány kivétel van azonban e szabály alól, pl. több G-fehérje-kapcsolt receptor és a hiszton gének nem tartalmaznak intronokat. Speciális kivételt jelentenek az ún. retrogének*. A fehérjék az RNS-hez hasonlóan, képződésüket követően, érési folyamatokon mennek keresztül. Az exonok eleje (5’-UTR, untranslated region; = leader) és vége (3’-UTR = trailer) aminosavakat nem kódoló szakaszokból áll. Ezek a régiók fontos szerepet játszanak a mRNS leolvasásának szabályozásában. Kódoló régión azokat az exon szakaszokat értjük, amelyek szekvenciája leolvasódik aminosav szekvenciákra. A mRNS kódoló szekvenciája rendszerint AUG (a metionin kódja) triplettel kezdődik, s a 3 stop kodon egyikével végződik (rendszerint több stop szekvencia követi egymást). A metionintól a stop kodonig tartó RNS szakaszt ORF-nek (open reading frame; nyílt leolvasási keret) nevezzük. A DNS-en csak azok a gének tartalmaznak ORF-eket, amelyek intron-mentesek. A géneket, különösen, ha a funkciójuk nem ismert, gyakran ORF-eknek nevezik. A gének szabályozó szekvenciái a promóterek és az enhanszerek, melyek serkentik-, ill. a silencer-ek, melyek gátolják a transzkripciót.
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
5
1. A Genom
A gének vizsgálata A molekuláris biológia fejlődésének korai szakaszában (alig több mint 10 éve, ami ezen a tudományterületen rendkívül hosszú időnek számít) a technikai akadályok miatt csupán egyetlen gén funkcióját tudták egyszerre vizsgálni. Egy gén vizsgálata Klasszikus (Mendeli) genetika – a XX. század első fele. A klasszikus genetika modellállatként az ecetmuslicát (gyümölcslégy, Drosophila melanogaster) használta. E korszak tipikus genetikai irányzata az ún. előre (forward) genetika volt, ami annyit jelentett, hogy mutációkat indukáltak, s ennek genetikai okát keresték kromoszómán a genetikai térképezés módszerének segítségével. A klasszikus genetika tipikus kérdése tehát az, hogy milyen gén, ill. kromoszóma régió felelős a mutáns fenotípus kialakulásáért. Molekuláris genetika - a XX. sz. 2. fele. E korszak modellélőlényei először a bakteriofágok, később a baktériumok (Escherichia coli), majd magasabbrendű élőlények Caenorhabditis elegans (hengeres féreg), ecetmuslica, egér) lettek. Megközelítési módszere miatt e genetikai irányzatot fordított (reverz) genetikának is nevezik, melynek lényege, hogy előre megtervezett genetikai változásokat (pl. célzott génkiütés) alkalmazunk a genomban, majd az így létrejött fenotípust keressük és jellemezzük. A reverz genetika kérdése tehát az, hogy egy ismert mutáció milyen fenotípusos változást okoz, ha egyáltalán van észlelhető fenotípusos hatása. Más szavakkal, a forward genetikában a megváltozott fenotípust okozó mutáns gént, a reverz genetikai megközelítésben pedig tervezett módon kiütünk egy ismert gént keressük, majd azt vizsgáljuk, hogy a génfunkció kiesése milyen észlelhető fenotípust okoz, ha egyáltalán. A reverz genetika a kiütött gén által okozott fenotípus változásból következtet a gén eredeti funkciójára. Sok gén vizsgálata Genomika – XXI. sz. A technológiai fejlődés eredményeként ma már egyszerre sok gén kifejeződését vizsgálhatjuk. A szervezet egy rendszer, így ha meg akarjuk ismerni a működését, akkor az összes fontos molekuláris komponens egyidejű működését kell tanulmányoznunk. 1. A strukturális genomika a DNS szerkezetének vizsgálatával foglalkozik, ami magában foglalja pl. a DNS bázissorrendjének-, vagy egy gén kromoszómán való elhelyezkedésének megállapítását. Jelenleg, a DNS szekvenálási technológiák gyors fejlődése következtében, egyre rövidebb idő alatt, s egyre olcsóbban végzik a különböző fajok genomjának meghatározását. 2. A funkcionális genomika: a poszt-genom (genom utáni) éra tudományának is nevezik, mert a DNS szekvenciák megismerése után a DNS funkciójának megállapítása következik: sok gén (akár a teljes genom összes génjének) kifejeződésének vizsgálata. A különféle chipek segítségével megállapítható, hogy mennyi RNS vagy fehérje képződik egy adott génből egy kezelt vagy egy beteg szövetből, összehasonlítva a nem-kezelt, ill. az egészséges szövettel. Azt a problémát, hogy a megváltozott aktivitású gének közül, melyek játszanak szerepet a megváltozott tulajdonság kialakításában hagyományos molekuláris biológiai technikákkal (pl. génkiütés) vizsgálják. 3. Az integratív genomika a molekuláris rendszerek komponensei közötti kölcsönhatásokkal foglalkozik. A genom annotáció nem más, mint biológiai információ hozzárendelése egy DNS szekvenciához (általában a génekre értik). A biológiai információ lehet strukturális, ill. funkcionális. A strukturális annotáció lehet egy szekvencia (1) kromoszómán való pontos elhelyezkedésének megállapítása; (2) az exonok és intronok azonosítása; ill. a (3) a szabályozó régiók elhelyezkedésének meghatározása. A funkcionális annotáció lehet: (1) biokémiai; (2) egyéb biológiai; (3) részvétel a szabályozásban, kölcsönhatásokban; (4) kifejeződés (mikor, milyen sejtekben, milyen mennyiségben). Az annotáció lépései mind biológiai (kísérletes), mind in silico (számítógépes) vizsgálatokat magukban foglalnak.
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
6
1. A Genom B. NEM-KÓDOLÓ SZEKVENCIÁK A nem-kódoló szekvenciák aránya a bonyolultabb testfelépítésű állatok felé haladva a törzsfán növekedést mutat. Érdekes, hogy a kutya genomja a tenyésztés során megszabadult az intergénikus szekvenciák egy tekintélyes részétől, melynek oka nem ismert.
B1. Génekkel kapcsolatos szekvenciák A génekkel kapcsolatos szekvenciák a pszeudogéneket, a gén fragmenseket, az intronokat és a nemleolvasódó szekvenciákat (UTR-ek) foglalják magukban. Az intronok olyan DNS szakaszok, amelyek kivágódnak a mRNS-ből az érés során. Az intronok átlagosan 30-35x hosszabbak, mint az exonok. Az intronok lehetséges szerepei a következők: (1) Nincs funkciója, csupán genetikai szemét. (2) A genetikai szabályozás: szabályozó elemeket tartalmazhat, vagy mint RNS lát el szabályozó funkciót. (3) A különféle sejtekben egyes intronok más kombinációban vágódnak ki a mRNS érés során (alternatív splicing). Ebben az esetben az intronok tk. exonok, csak bizonyos sejtekben nem kerülnek be a mRNS-ekbe, s így az mRNS-ekből képződő fehérjékbe sem. Ez azonban inkább kuriózum, az intronok túlnyomó többsége azonban nem hordoz fehérjékre vonatkozó információt. Az UTR-ek (untranslated region, nem leolvasott régió) a mRNS-ek 5’ és 3’ végein helyezkednek el; szerepük az mRNS leolvasásának és élettartamának szabályozása. Pszeudogének & génfragmensek A génfragmensek funkciónélküli géndarabok. Rendszerint egy gént tartalmazó DNS szakasz nem tökéletes kettőződése révén keletkeznek azáltal, hogy nem az egész gén, hanem annak csak egy szakasza duplikálódik. A pszeudogéneknek (pszeudo: ál, nem valódi) két típusa található az emberi genomban: (1) intronokat tartalmazók, melyek kromoszómális szegmensek megkettőződésével jöttek létre. Az így keletkezett pszeudogéneknek kétféle sorsuk lehet. Az esetek nagy többségében az egyik kópia mutációk révén inaktiválódik. A keletkezett gént ugyanis nem védi a negatív szelekció (melynek során a mutációt hordozó egyed elpusztul), mert a gén funkcióját a másik kópia elvégzi. A másik, sokkal ritkább folyamat során fokozatos mutációk révén egy új gén keletkezik (ld. Evolúció c. előadás). (2) A pszeudogének másik típusát az intron nélküli pszeudogének alkotják. Ezek úgy keletkeznek, hogy a genom retroelemei által kódolt reverz transzkriptáz enzimek a mRNS-ből cDNS*-t képeznek, amely az integrázok segítségével visszaépül a genomba. Az intron nélküli pszeudogének az esetek túlnyomó többségében inaktívak, melynek oka az, hogy a reverz transzkripció során a gén szabályozó szekvenciái nem íródnak át (a mRNS nem tartalmaz promótereket). Nagyon ritkán az intron nélküli gének egy promóter közelébe épülnek be a genomba, s így kifejeződhetnek; ezek a retrogének. Figyelem, a retrogéneknek át kell esnie a „szelekció rostáján” ahhoz hogy működőképes gének váljanak belőle, s elterjedjenek a populációban. Az emberi genomban kb. 15 ezer pszeudogén található, melyek fele intron nélküli. A legtöbb pszeudogén (13%) riboszómális fehérjék génjeiből származik, aminek valószínű oka az, hogy ezek a mRNS-ek nagyon nagy számban fordulnak elő a sejtekben.
B2. Intergénikus szekvenciák - transzpozonok Az intergénikus szekvenciák az ismétlődő és egyéb szekvenciákat foglalják magukba. Ismétlődő szekvenciák a transzpozonok (retro- és DNS transzpozonok), az egyszerű- és a nagy ismétlődések. A transzpozonok felfedezése Az ugráló géneket (pontosabban azok egyik típusát, a DNS transzpozonokat) Barbara McClintock fedezte fel 1951-ben a kukoricában. A kutató a kukoricacsövön található eltérő színű szemek megjelenését magyarázta a genetikai elemek DNS-en belüli mozgásával. A transzpozonok képesek beugrani a génekbe (pl. a kukorica magok színét meghatározó génekbe), inaktiválva ezáltal azokat, ill. képesek kiugrani a génekből, ami által ezek a gének visszanyerik a funkciójukat. McClintock jelentős késéssel, 1983-ban kapott Nobel díjat ezért a felfedezésért. A transzpozonokat osztályozhatjuk például a származásuk szerint. Eszerint, beszélhetünk (1) idegen behatolókról és azok genetikai fosszíliáiról, melyek a retrovírusokat és azok elkorcsosult maradványait, ill. a DNS transzpozonokat foglalják magukba. A DNS transzpozonokról nem tudjuk, hogy honnan és milyen vektor közvetítésével kerültek a DNS-ünkbe. (2) A másik transzpozon féleséget egyfajta „elszabadult” saját elemek alkotják, melyek közé Alu és a MIR szekvenciák (ld. később) tartoznak.
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
7
1. A Genom Retrovírus fertőzés általános sémája látható az ábrán. A retrovírusok köpenye egy receptor által közvetített folyamat révén a sejtfelszínhez tapad, majd összeolvad a sejtmembránnal. E folyamat eredménye, hogy a vírus nukleokapszid (kapszid + RNS) bejut a sejtbe, ahol az egyszálú vírus RNS-ből két lépésben kétszálú DNS keletkezik, amely beépül a gazdasejt genomjába. A DNS-be integrálódott vírus működésbe lép, s ezáltal előállítja a genetikai információját kódoló RNS molekulákat és a szerkezeti elemeit alkotó fehérjéket. A szerkezeti fehérjék maguktól összeállnak kapsziddá, majd a kapszidba beépül a vírus RNS-e. A nukleokapszid exocitózissal jut ki az extracelluláris térbe, úgy, hogy közben magára ölti a sejtmembránt, melyben a vírus által kódolt transzmembrán fehérjék is elhelyezkednek (ez a vírus köpeny). Az érett vírus kész az új fertőzésre. Ez a séma érvényes a HIV fertőzésre is, s így szaporodtak eredetileg a genomunkat ellepő retrovírusok is. Stabil retrovírus beépülés a genomba Azok a retrovírusok, amelyek a genomunkat alkotják őseink csíravonal sejtjeibe* épültek be, s nem okoztak sejtpusztulással járó fertőzést, azaz nem aktiválódtak. A lényeg az, hogy a retrovírus DNS a petesejt vagy a spermium genomjában legyen benne, a testi sejtekbe beépült vírusok ugyanis a test halálával együtt meg semmisülnek. Az emberi genom nem tartalmazza a HIV DNS-ét. Pontosabban, a HIV fertőzötteké igen, de a HIV ezeknek az embereknek a fehérvérsejtjeik DNS-ében van jelen, tehát, ha tovább is adják a vírust, azt új fertőzéssel, nem pedig a hagyományos öröklés útján teszik. DIA X A koala retrovírus (KoRV) Az ember esetében több független retrovírus általi kolonizáció (endogenizáció – belsővé válás) történt. Ezek a vírusok, hasonlóan a HIV fertőzéshez, valószínűleg, jelentősen lecsökkentették a populációnk létszámát, s csak a rezisztens kevesek élték túl. A járványok egy része esetében megtörtént az endogenizáció, másoknál nem. A HIV ennek az útnak az elején van, még nem épült be a csíravonalukba, s kérdés, hogy ez megtörténik-e egyáltalán. A koala esetében azonban éppen jelenleg folyik a genom kolonizációja a koala retrovírus által. Ausztrália bizonyos régióiban a vírus már öröklődik, más régiókban fertőzéssel terjed. A transzpozonok osztályozása: I. Osztály: retrotranszpozonok 1. LTR transzpozonok (LTR: long terminal repeat) 2. Nem-LTR transzpozonok - LINE-ok (long interspersed nuclear elements) - SINE-ok (short interspersed nuclear elements) II. Osztály: DNS transzpozonok Egy ép retrovírus szerkezete a következőképpen néz ki: az LTR (long terminal repeat, hosszú végi ismétlődés) a vírus DNS mindkét végén megtalálható, s többek között génexpresszió szabályozó (promóter) és termináló funkciót lát el. A gag DNS régió a kapszidot alkotó elemeket kódolja. A kapszid a vírus örökítő anyagát (egyszálú RNS-t) burkolja. A pol a retrovírusok enzimjeit kódolja: a reverz transzkriptáz írja át az RNS-t DNS-sé, az RNázH (ribonukleáz H) a második DNS szál átírásához szolgáltatja az RNS primereket: az első DNS szál képződését követően, részlegesen megemészti a DNS-sel kapcsolt állapotban lévő RNS-t, ami így primerként funkcionál a reverz transzkriptáz számára a 2. DNS szál megírásához. Az integráz a vírus DNS gazda genomba való beépüléséért felelős fehérje, a proteáz pedig a képződött vírus fehérjéket kisebb molekulasúlyú polipeptidekké vágja. Az env kódolja a vírus külső burkába (köpeny) beépülő glükoproteineket.
LTR retrotranszoponok (a genom 8%-át alkotják) olyan mobilis elemek, melyek definíció szerint LTR-el rendelkeznek. Azok az LTR retrotranszpozonok, melyek minden a retrovírusokra jellemző nukleinsav komponenst tartalmaznak a genom 1%-át teszik ki, s ezeket humán endogén retrovírus (HERV)-oknak nevezzük. A HERV-ek zöme különféle mutációk miatt nem képes a replikációjukhoz minden fehérjét megtermelni. A maradék (7%) LTR retroranszpozonok (retropozonok) egy-egy komponense (rendszerint az env gén) hiányzik. A nem-LTR retrotranszpozonok LTR régiója hiányzik. Egyik típusuk a LINE-ok degenerált retrovírusok; nagyobb DNS darabok hiányoznak a vírus őseikhez képest. A másik típusuk a SINE-ok, többségében a gazdaszervezet RNS génjeiből alakultak ki, de egyesek retrovírusok eredetűek, melyek
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
8
1. A Genom DNS-ei még a LINE-okétól is nagyobb mértékben degradálódták a vírus őshöz képest. A leggyakoribb SINE az Alu szekvencia, mely a gazdaszervezet egyik RNS-t kódoló génjéből származik. A DNS transzpozonok tipikus szerkezete a következőképpen néz ki: egy transzpozáz enzimet kódoló gént két fordítottan ismétlődő szekvencia (inverted repeat; IR: szemben állnak egymással) vesz közre. Normális esetben a transzpozáz enzim végzi a DNS szekvencia mozgását (kivágás, beépülés) a gazda genomban, az embernél azonban, a felhalmozott mutációk következtében, az összes transzpozon gén inaktív. Transzpozonok – összegzés Az emberi genom 20%-át alkotják a LINE szekvenciák, ami 850ezer kópiát jelent; a SINE-ok a genom 13%-át alkotják, amiből 11% Alu szekvencia, a maradék 2%-ot pedig tRNS gén eredetű szekvenciák (pl. MIR és MIR-3) és elkorcsosult retrovírus maradványok (SINE-R) teszik ki. Humán endogén retrovírusok (HERV) & LTR transzpozonok Az LTR transzpozonok a genom 8%-át teszik ki, de csak 1%-uk szerkezete olyan, mint egy komplett retrovírusé, a többi degenerált. Az emberi genomban a retrovírusokat pont mutációkkal és deléciókkal inaktiválta a szervezet, ezért pszeudogénekké váltak, habár egyesek mozoghatnak más elemek enzimjeinek a segítségével. Egészen a legutóbbi időkig úgy vélték, hogy csak közeli rokonunk a csimpánz genomja tartalmaz fertőzőképes retrovírusokat, az emberi DNS nem. Nemrégiben fedezték azonban fel, hogy a K-típusú HERV-ek (HERV-K) az embernél teljesen funkcióképesek, azaz elvileg képesek betegséget okozni, s más embereket megfertőzni. Ilyen esetet azonban még nem írtak le. Az ilyen fertőzések elkerülése a valószínű oka annak, hogy a más sejtek fertőzéséhez szükséges env gén inaktiválódott a legtöbb HERVnél. A felismerhető szekvenciával rendelkező HERV-ek elődje az egyik Óvilági (afrikai) majom ősünket fertőzte meg, s később, az emberszabásúak vonalán ismeretlen ok miatt felgyorsult a mobilizációjuk. A MaLR transzpozon az LTR-transzpozonokhoz tartozik, a HERV-ekhez képest erősen degenerált, nincs pol és env génje. Az endogén retrovírusok hatása az emberi sejtek gén expressziójára. A HERV-ek többféle hatással lehetnek az emberi gének kifejeződésére. (1) A leggyakoribb eset azonban az, hogy ezek a szekvenciák nincsenek semmilyen hatással a celluláris gének kifejeződésére. (2) A HERV LTR-e egy emberi gén aktivitását szabályozhatja. (3) Ha a génen belül van egy működő vagy rejtett splice akceptor hely, az a retrovírus DNS splice donor helyével együttműködve a közbeeső szakasz kiesését okozza, s ezáltal egy új splice variáns képződhet. (4) Az LTR aktivitása módosulhat: az LTR metilálódhat vagy mutáció léphet fel benne, s ezek megváltoztathatják az adott gén expressziós mintázatát. A további hatások a LINE-1 szekvencia mobilizálódásához hasonlóak (pl. transzdukció: DNS szakaszok beépítése idegen helyre).
Nem-LTR retrotraszpozonok. A LINE-okat és a SINE-okat foglalja magában. A LINE-okat gyakran autonóm transzpozonoknak nevezik, ami helytelen, hiszen csak nagyon kevés képes közülük önállóan mozogni. LINE-ok Az emberi genom 20-21%-át alkotják (~1 millió db), ebből 600 ezer Line-1 (L1; 17%); 370 ezer LINE-2 és 44 ezer LINE-3. Csupán tízezer L1 éri el a prototípus teljes hosszúságát (6,1 kb), s ebből is csak 50-100 funkcióképes. Tehát, a néhány L1 és HERV-K szekvenciák a valóban autonóm mobilis elemek a genomban, a többiek inaktívak (pszeudogének). A nem-autonóm mozgó elemek egy része is mobilizálható az autonóm elemek enzimjeinek segítségével. A működőképes L1 szekvenciák két gént tartalmaznak: a p40 (RNS-kötő) fehérjét kódoló ORF 1; és az ORF2, amely egy kettős funkcióval (endonukleáz és reverz transzkriptáz) rendelkező enzimet kódol. Az endonukleáz az L1 szekvencia DNS-be való beugrásához megemészti a gazda DNS-t. Ha kétszálú DNS törés egyébként is előfordul (pl. crossing over esetén), akkor ide is beugorhat ez a mozgó elem. A retroelemek nem csupán a retrovírusok degradációs termékei, hanem átrendeződnek és átalakul a szekvenciájuk, s ezáltal olyan új vagy kombinált funkciókkal rendelkező fehérjék jönnek létre, mint pl. az L1 ORF2 génje. Sok fiatal L1 elem csak most kezd el terjedni az emberi populációban, amit a „jelen van/hiányzik” (presence/absence) polimorfizmus jelez. A LINE-1 „szaporodása”A LINE-1 áthelyeződhet tökéletes másolatként, vagy csak egy része tevődik át más genomiális lokuszokba.
A LINE-1 hatása a genomra - pszeudogének képződése A LINE-1 enzimjei segítségével egy celluláris mRNS cDNS-é íródhat át, majd épülhet be a genomba s így intron nélküli gén jön létre. Ezek a gének rendszerint működésképtelen pszeudogének, mert nincs szabályozó régiójuk (a mRNS nem tartalmaz promótereket és enhanszereket).
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
9
1. A Genom Gyakori, hogy a LINE beépülés környezetében kisebb-nagyobb deléciók következnek be a DNS-en, melynek okát nem ismerjük.
A LINE-1 hatása a genomra - gén inaktiváció. A mozgékony elem beépülhet egy gén exonjába, ami a gén inaktivációját okozza. Az L1 intronokba épülve is módosíthatja a génfunkciót, pl. a splicing megváltoztatásával stop kodon jön létre, aminek eredményeként az eredeti fehérje lerövidülhet.
A LINE-1 hatása a genomra – transzdukció A LINE-ok áthelyeződésük alkalmával a szomszéd celluláris gének egy darabját magukkal vihetik. Ennek oka az, hogy a LINE-ok polyA szignálja gyenge, s így transzkripciókor az RNS polimeráz nem áll meg, hanem átírja a szomszéd gén egy darabját, akár egy teljes exonját is. Ezt követően a LINE/exon szekvencia beugorhat egy másik génbe. Kivételes esetekben, a gén darab (pl. exon) a LINE szekvencia nélkül ugrik be egy másik gén szekvenciájába. Sokan úgy gondolják, hogy ez a mechanizmus fontos szerepet játszik a magasabbrendű élőlények evolúciójában, mivel új gének keletkezéséhez vezethet. Megjegyzések: (1) A LINE-1általában nem egy teljes exont visz magával, hanem egy tetszőleges DNS darabot. (2) A DNS áthelyeződése általában testi sejtekben megy végbe, ezért nem öröklődik, ez a folyamat azonban tumor képződéshez vezethet. (3) Ha ivarsejtekben történik a DNS átrendeződés (az L1 ivarsejtekben nagyon aktív), ennek szelektív előnnyel kell rendelkeznie, hogy elterjedjen (kis populációkban véletlenül is elterjedhet).
A SINE-ok a genom 13%-át alkotják, melyből 11%-ot Alu szekvencia tesz ki. Az Alu szekvenciák nem kódolnak fehérjét, hanem a LINE-1 enzimjeit parazitálják. Az Alu szekvenciák AluI restrikciós endonukleáz felismerőhelyet tartalmaznak, innen a név. Egy SINE ismétlődő egység 100-400 bázispárból áll (Alu: 300 bp: 280 bp + 20 bp DNS polimeráz III promóter). A haploid emberi DNS-ben kb. 1,2 millió Alu kópia található, s ezáltal ez a genomunk legsikeresebb szekvenciája. Az SRP (signal recognition particle; szignál felismerő részecske, amely egy ribonukleoprotein*) RNS komponenséből (7SL RNS) keletkeztek. Az SRP eredeti funkciója a fehérjék szignál szekvenciájához kapcsolódva, azok membránok (pl. ER, plazma membrán) felé való irányítása. Az Alu családba sokféle Alu szekvencia tartozik, melyek közül egyesek erősen degradáltak, mások monomer szerkezetűek. Az Alu szekvenciák prototípusa dimer szerkezetű, egy Alu és egy S doménből áll. Több Alu szekvencia féleség jelen van/hiányzik polimorfizmust mutat, ami azt jelzi, hogy ez az elem nemrégen alakult ki, s elterjedőben van az emberi populációban. Az ember egy RNS génje, a BCYRN1 gén (BC 200 idegi citoplazmás RNS-t kódolja) Alu szekvenciából alakult ki. A mobilis elemek a genom eukromatikus régiójában* találhatók, mivel a terjedésükhöz transzkriptálódniuk kell, s ez a folyamat nem megy végbe a heterokromatikus régiókban*. Az Alu szekvenciák a genom G/C gazdag régiójában (R sáv a Giemsa festékkel jelölt metafázisos kromoszómán), míg a LINE-1 inkább az A/T gazdag (G sáv a kromoszómán) genomi régióban helyezkednek el. Érdekesség, hogy az egér B1 retropozonjai szintén a 7SL RNS-ből alakultak ki, függetlenül az Alu szekvenciáktól. A MIR (mammalian interspersed repeats; 450 ezer kópia/haploid genom) és a MIR-3 (85 ezer kópia/haploid genom) retropozon családok egy tRNS génből jöttek létre (az egér B2 transzpozonja is tRNS eredetű). A tRNS eredetű SINE molekulák csupán egy része áll tRNS-ből, a többit összelopkodták a genom egyéb részeiből. Valószínűleg azért tudtak átalakulni tRNS-ek transzpozonokká, mert ezek a molekulák képesek felismerni a reverz transzkriptázt kódoló mRNS-eket a riboszómákon, s így hasznosítani tudják ezt az enzimet a saját ugrálásukhoz. A SINE-R család erősen degradálódott retrovírusokból jött létre. Hiperparazita Alu szekvencia: Az Alu szekvencia saját promóterről (DNS polimeráz III) szintetizálódik, s felhasználja a LINE1 által termelt reverz transzkriptázt az RNS-ének DNS-é való átíráshoz. Az Alu szekvencia hiperparazitának nevezhető, mert az L1-en, a gazda DNS parazitáján élősködik. Alu szekvenciákhoz kapcsolható betegségek Az Alu szekvenciák mobilizációja sokféle betegséget okozhat, néhány az ismertek közül: mellrák, Ewing szarkóma, familiáris hipercholesterolemia, hemofilia, neurofibromatózis, II-es típusú diabetes mellitus.
A DNS transzpozonok egy transzpozáz génből és az azt körülvevő fordítottan ismétlődő (IR) szekvenciából állnak. Normálisan, a genetikai elemet a transzpozáz enzim vágja ki és építi be a genom más helyére a „cut and paste” (kivág és beilleszt) mechanizmussal (a retrotranszpozonok a ”copy and paste”, másol és beilleszt mechanizmussal terjednek e genomban). Más szavakkal, a retrotranszpozonok RNS intermediereken (köztes termékeken) keresztül mozognak, míg a DNS transzpozonok DNS kivágás és áthelyezés mechanizmus által. Nem teljesen világos, hogy ha egy transzpozon csak a helyét változtatja, de nem növekszik a kópiaszáma, akkor hogyan tud mégis elszaporodni a genomban. Ennek egyik valószínű mechanizmusa az, hogy a DNS transzpozonok kivágásakor kettős szálú DNS törés keletkezik, s ez a hiba a homológ kromoszóma, mint templát által javítódik ki (a homológ kromoszómából nem vágódott ki a transzpozon). Egy hasonló lehetőség az, amikor a sejtosztódás során történik a kivágás; ilyenkor a testvér kromatidáról pótlódhat a hiányzó DNS transzpozon. Nem ismert, hogy az DNS transzpozonok hogyan fertőzték meg a genomunkat; nem tudjuk, hogy milyen élőlények lehetettek a vektorok, azaz a DNS transzpozonok szállítói. Azt sem tudjuk, hogy milyen fajokból származnak a DNS transzpozonok, a legkézenfekvőbb feltételezés, hogy a vektor állat DNS-éből. Több mint 60 DNS transzpozon család található meg a genomunkban, pl. Charlie, Mariner, Tigger, THE1, stb. A Mariner család hasonlít a rovarok DNS transzpozonjaira, ami azt a lehetőséget vetette fel, hogy ezek az elemek esetleg egy rovar vektor (szúnyog, bolha, stb.) által kerültek az emberi genomba. A részletes genetikai vizsgálatok szerint ez a forgatókönyv azonban nem valószínű. Az emberi
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
10
1. A Genom genomban nincs működőképes DNS transzpozon, ezért helyesebb lenne a DNS transzpozon fosszília (ősmaradvány) elnevezés. A DNS transzpozon transzpozáz enzimje nem kötődik az őt kódoló DNS szakaszhoz, a sejtmagba „vakon” jön be, s ott gyakorlatilag az összes IR szekvenciát képes felismerni, s elvégezni a transzpozíciót. Lehet, hogy nem véletlen a genom azon „törekvése”, hogy működésképtelenné tegye az összes transzpozáz gént.
A gazdaszervezet védekezése a transzpozonokkal szemben A gazdaszervezet védekezése a következő stratégiákat foglalja magában: (1) Heterokromatinizáció (DNS metiláció), melynek eredményeként gátlódik a transzpozonokról a transzkripció. (2) RNS interferencia: a transzkripció és transzláció gátlásával jár. (3) A mutációs ráta lokális megemelése, mely inaktiválja a transzpozonokat. A gazdaszervezet haszna a transzpozonokból A gazdaszervezet hasznot is húzhat a transzpozonok jelenlétéből. Transzpozonból alakult ki pl. az antitest és B- és T-sejt receptor kódoló gének variabilitását eredményező mechanizmus. Továbbá, a transzpozonok a genom plaszticitását növelik, mivel az egyes DNS régió könnyebben átrendeződhetnek. Ez a mechanizmus káros hatással is járhat egy érintett egyén számára (betegséget okoz), de evolúciós távlatokban hasznos lehet.
B3. Intergénikus szekvenciák – kis és nagy ismétlődések A tandem ripítek (ismétlődések) egymást követő azonos, vagy közel azonos (degenerált) ismétlődő egységek. Változatosság lehet (1) az ismétlődő egységen belüli alegységek hosszában és (2) a teljes ismétlődő egység számában. Három osztályt különböztethetünk meg. (1) Makroszatellitek: 1 kilobázistól több százezer bázispárnyi ismétlődések alkotják Telomer: 15 kb: TTAGGG hexamer ismétlődik 2,500-szor Szatellit 2 és 3 ismétlődő egységei: GGAAT Alfa szatellit: 171 bp-os egység változó számú ismétlődései (2) Miniszatellitek VNTR: (variable number of tandem repeats), változó számú tandem ismétlődés STR: short tandem repeats, rövid tandem ismétlődések): rövidebbek a makroszatellitektől. Genetikai markerek (apasági vizsgálat, leszármazás); több betegséggel összefüggenek, pl. diabetes (3) Mikroszatellitek : kis 1-5 bázis páros ismétlődések (CA)n ripítek, a genom 0.5%-át alkotják – nincs ismert funkciójuk Trinukleotid ripítek: CAA (Gln), ACA (ala): idegrendszeri betegségek; kutyánál a transzkripciós faktorok változékonyságát növelik (embernél nincs adat erre vonatkozóan) A makroszatellitek főként a konstitutív (állandó) heterokromatinban fordulnak elő (centromerek és telomerek). A többi szekvencia-féleség pedig szétszórtan helyezkedik el a genomban.
B4. Egyéb intergénikus szekvenciák Egyéb intergénikus szekvenciák közé tartoznak a (1) felismerhetetlenségig degradált transzpozonok, pszeudogének; (2) szabályozó szakaszok: promóterek, enhanszerek, silencerek; (3) egyéb.
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
11
1. A Genom
Szótár cDNS (copy DNS): RNS-ről reverz transzkripcióval DNS-e alakított szekvencia. Az mRNS-rő képzett cDNS nem tartalmaz intronokat. C-érték: Az 1940-es években azt figyelték meg, hogy egy faj minden sejtjében, - szemben a fehérjékkel -, a DNS mennyisége állandó (= constant; innen a C érték), de különböző a fajok között. Ebből a megfigyelésből néhány kutató arra következtetésre jutott, hogy a DNS lehet az örökítő anyag. Csíravonal sejtek: azok a sejtek, amelyek az ivarsejtek (petesejt és hímivarsejt) képzésében vesznek részt. DNS szekvenálás: a DNS bázis sorendjének megállapítása speciális berendezések (szekventátorok) segítségével. Endonukleáz: A nukleinsavakat a molekulán belül vágja Eukromatin: a hisztonok lazábban kötődnek a heterokromatintól, ami lehetővé teszi a transzkripciót. Exonukleáz: A nukleinsavakat a molekula szélein vágja Fenotípus: egy egyed megfigyelhető jellegzetességei: morfológiai (anatómiai), élettani, biokémiai, viselkedésbeli, stb. Heterokromatin: az eukromatinhoz képest hisztonokkal erősen fedett. A konstitutív heterokromatin hiszton-DNS kapcsolata stabil; repetitív (szatellit) szekvenciákból áll, s a centromer és telomer régiókban található. A fakultatív heterokromatin hiszton fehérjéi eltávolíthatóak, s ilyenkor a génexpresszió megengedett. Intron: a génekben az aminosavakat kódoló részek (exonok) közötti szakasz, amely a mRNS érése folyamán eltávolítódik. Kinázok: enzimek, amelyek más fehérjéket foszforilálnak (PO4 csoportot raknak bizonyos aminosavakra). Knockout (= génkiütött) állat: olyan állat (rendszerint egér), melynek egy génjét molekuláris biológiai módszerekkel működésképtelenné tették („kiütötték”). Retrogének: hasonlóan a pszeudogénekhez, reverz transzkripcióval képződnek (tehát intront nem tartalmaznak), de önálló promóterrel rendelkeznek, s így funkcióképesek. Ribonukleoprotein: fehérjékből és RNS-ekből álló komplex molekula. SRP (signal recognition particle; szignál felismerő részecske): a kiválasztandó fehérjék szignál szekvenciájához kapcsolódik, s azokat a durvafelszínű endoplazmatikus retikulumhoz vagy a plazmamembránhoz szállítja a fehérjét. STR (short tandem repeat; rövid tandem ismétlődések) – a genomban szétszórtan helyezkednek el. Az emberi populációban polimorfizmus van ezekben a szekvenciákban (eltérő az ismétlődések száma egy lokuszban). Szubsztrát: kémiai anyag, melyre egy enzim hatással van (pl. elbont). VNTR (variable number of tandem repeats; változó számú tandem ismétlődések) – a genomban szétszórtan helyezkednek el. Az emberi populációban polimorfizmus van ezekben a szekvenciákban (eltérő az ismétlődések száma egy lokuszban).
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©
12
1. A Genom
Jegyzeteim:
ALAPKÖVETELMÉNY
7.Előadás
Boldogkői Zsolt ©