Strukturní biologie Vojtěch Spiwok
[email protected] http://web.vscht.cz/spiwokv/modelovani/
Domácí úkol: http://web.vscht.cz/~spiwokv/modelovani/instrukce.html Instrukce: Vytvořte obrázek prostorové struktury vylosovaného proteinu tak, aby z něj byla dobře patrná interakce proteinové části s ligandem nebo ligandy (kofaktory, inhibitory atd). Obrázek musí mít bílé pozadí. Pro proteinovou část použijte reprezentaci bez zobrazení jednotlivých atomů (např. ribon, cartoon a podobně). Pro neproteinovou část použijte zobrazení jednotlivých atomů (sticks, ball&sticks, spheres atd, ale ne lines). Pokud je to vhodné, je možné stejným způsobem zobrazit i atomy vybraných aminokyselinových zbytků. V případě vícepodjednotkových proteinů je možné zobrazit pouze jednu podjednotku, zvláště pokud se nejedná o biologický oligomer (např. je jejich interakce důsledkem krystalizace). V obrázku je možné popsat jednotlivé podjednotky, ligandy, rezidua a podobně. Pro tyto popisky použijte písmo Helvetica. Celý obrázek musí být ve formátu tiff, na šířku musí mít 6-8 cm a rozlišení 300 dpi. K obrázku připojte krátký popisek. V něm uveďte jaký software byl použit. Vhodný software: PyMol - www.pymol.org VMD - www.ks.uiuc.edu/Research/vmd/ UCSF Chimera - www.cgl.ucsf.edu/chimera/ nebo jiný
Domácí úkol: http://web.vscht.cz/~spiwokv/modelovani/instrukce.html 1e4v
1ffy
1gal
1ipw
1k22
1n2c
1u70
1upp
1v97
1w4w
1yq2
2fbw
2jhf
2r4f
2vk4
2x91
2xfu
3b7e
3div
3f0t
3g2h
3gzk
3ha1
3hw7
3i9v
3ihj
3jwq
3k4v
3lii
3lxe
3m8r
3maa
3n10
3n8v
3txt
4ake
4ea3 4k5y
4l0d
4l6r
4n6h
4oo9 4or2
8tim
Prostorové struktury proteinů http://ww.pdb.org
Prostorové struktury proteinů http://ww.pdb.org 4iy0 HEADER METAL TRANSPORT 28JAN13 4IY0 TITLE STRUCTURAL AND LIGAND BINDING PROPERTIES OF THE BATEMAN DOMAIN OF TITLE 2 HUMAN MAGNESIUM TRANSPORTERS CNNM2 AND CNNM4 COMPND MOL_ID: 1; COMPND 2 MOLECULE: METAL TRANSPORTER CNNM2; COMPND 3 CHAIN: A; COMPND 4 FRAGMENT: CBS DOMAIN, UNP RESIDUES 429584; COMPND 5 SYNONYM: ANCIENT CONSERVED DOMAINCONTAINING PROTEIN 2, CYCLINM2; COMPND 6 ENGINEERED: YES SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS; SOURCE 3 ORGANISM_COMMON: HUMAN; SOURCE 4 ORGANISM_TAXID: 9606; SOURCE 5 GENE: CNNM2; SOURCE 6 EXPRESSION_SYSTEM: ESCHERICHIA COLI; SOURCE 7 EXPRESSION_SYSTEM_TAXID: 562; SOURCE 8 EXPRESSION_SYSTEM_STRAIN: BL21; SOURCE 9 EXPRESSION_SYSTEM_VECTOR_TYPE: PLASMID; SOURCE 10 EXPRESSION_SYSTEM_PLASMID: PET101D/TOPO KEYWDS CBS, BATEMAN DOMAIN, MAGNESIUM TRANSPORTER, MAGNESIUM SENSOR, KEYWDS 2 CYTOSOL, METAL TRANSPORT EXPDTA XRAY DIFFRACTION AUTHOR M.A.CORRALRODRIGUEZ,M.STUIVER,J.A.ENCINAR,V.SPIWOK,I.GOMEZGARCIA, AUTHOR 2 I.OYENARTE,J.ERENOORBEA,H.TERASHIMA,A.ACCARDI,T.DIERCKS,D.MULLER, AUTHOR 3 L.A.MARTINEZCRUZ REVDAT 1 05MAR14 4IY0 0 JRNL AUTH M.A.CORRALRODRIGUEZ,M.STUIVER,J.A.ENCINAR,V.SPIWOK, JRNL AUTH 2 I.GOMEZGARCIA,I.OYENARTE,J.ERENOORBEA,H.TERASHIMA, JRNL AUTH 3 A.ACCARDI,T.DIERCKS,D.MULLER,L.A.MARTINEZCRUZ JRNL TITL STRUCTURAL AND LIGAND BINDING PROPERTIES OF THE BATEMAN JRNL TITL 2 DOMAIN OF HUMAN MAGNESIUM TRANSPORTERS CNNM2 AND CNNM4 JRNL REF TO BE PUBLISHED
Prostorové struktury proteinů http://ww.pdb.org 4iy0 ATOM 1 N LYS A 429 8.077 53.835 35.514 1.00 53.27 N ATOM 2 CA LYS A 429 8.517 54.000 34.098 1.00 49.08 C ATOM 3 C LYS A 429 8.467 52.688 33.305 1.00 50.86 C ATOM 4 O LYS A 429 7.475 51.912 33.321 1.00 53.92 O ATOM 5 CB LYS A 429 7.602 54.970 33.376 1.00 42.11 C ATOM 6 CG LYS A 429 8.387 56.024 32.621 1.00 38.05 C ATOM 7 CD LYS A 429 7.420 57.023 31.846 1.00 36.98 C ATOM 8 CE LYS A 429 6.352 57.598 32.869 1.00 36.13 C ATOM 9 NZ LYS A 429 5.039 57.990 31.976 1.00 40.10 N ATOM 10 N GLU A 430 9.559 52.463 32.556 1.00 52.53 N ATOM 11 CA GLU A 430 9.671 51.252 31.726 1.00 52.49 C ATOM 12 C GLU A 430 8.510 51.194 30.752 1.00 52.19 C ATOM 13 O GLU A 430 7.900 50.114 30.535 1.00 49.13 O ATOM 14 CB GLU A 430 11.060 51.267 31.000 1.00 52.63 C ... ATOM 1219 CD GLU A 580 2.214 43.829 35.098 1.00 78.34 C ATOM 1220 OE1 GLU A 580 2.630 43.732 33.920 1.00 78.71 O ATOM 1221 OE2 GLU A 580 1.313 43.084 35.529 1.00 81.53 O TER 1222 GLU A 580 HETATM 1223 PB ADP A 601 17.678 29.642 27.909 1.00 36.41 P HETATM 1224 O1B ADP A 601 17.847 30.324 29.192 1.00 43.11 O HETATM 1225 O2B ADP A 601 18.401 30.375 26.754 1.00 44.59 O HETATM 1226 O3B ADP A 601 18.025 28.203 27.758 1.00 35.60 O HETATM 1227 PA ADP A 601 15.149 30.924 27.443 1.00 35.34 P HETATM 1228 O1A ADP A 601 14.286 30.548 26.263 1.00 33.75 O HETATM 1229 O2A ADP A 601 15.896 32.187 27.543 1.00 34.01 O HETATM 1230 O3A ADP A 601 16.116 29.651 27.621 1.00 33.94 O HETATM 1231 O5' ADP A 601 14.191 30.825 28.734 1.00 31.13 O HETATM 1232 C5' ADP A 601 14.516 31.318 30.070 1.00 34.54 C HETATM 1233 C4' ADP A 601 13.648 30.514 31.070 1.00 34.58 C HETATM 1234 O4' ADP A 601 14.122 29.125 31.120 1.00 33.54 O
Prostorové struktury proteinů http://ww.pdb.org 4iy0 Pymol http://www.pymol.org
VMD http://www.ks.uiuc.edu/Research/vmd/
USCF Chimera https://www.cgl.ucsf.edu/chimera/
Předpověď prostorových struktur proteinů 1. Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. 2. Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. 3. Ab initio, de novo Nativní struktura proteinu má vlastnosti, které jí odlišují od ostatních struktur. 4. Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu.
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu.
Abl kinasa 1opl
p38 kinasa 1w84
insulinový receptor 1irk
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu.
Abl kinasa 1opl
>1OPLpdb, chain A/1537 MGQQPGKVLGDQRRPSLPALHFIKGAGKRDSSRHGGPHCNVFVEHEALQRPVASDFEPQG LSEAARWNSKENLLAGPSENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCE AQTKNGQGWVPSNYITPVNSLEKHSWYHGPVSRNAAEYLLSSGINGSFLVRESESSPGQR SISLRYEGRVYHYRINTASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAPKRN KPTVYGVSPNYDKWEMERTDITMKHKLGGGQYGEVYEGVWKKYSLTVAVKTLKE DTMEVEEFLKEAAVMKEIKHPNLVQLLGVCTREPPFYIITEFMTYGNLLDYLRE CNRQEVNAVVLLYMATQISSAMEYLEKKNFIHRNLAARNCLVGENHLVKVADFGLS RLMTGDTYTAHAGAKFPIKWTAPESLAYNKFSIKSDVWAFGVLLWEIATYGMSPYPGID LSQVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSFAEIHQAFETMFQESSISD EVEKELGKENLYFQ
>1IRKpdb, chain A/9781283 insulinový receptor VFPSSVFVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNE SASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPE 1irk AENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMT RDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLS NEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPKMRPTFLEIVNLLKDDLHPSFP EVSFFHSEENK
YGNLLDYLRECNRQEVNAVVLLY HGDLKSYLRSLRPEAENNPGRPPPTLQEMIQ
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. Swiss Model http://swissmodel.expasy.org/ Modeller https://salilab.org/modeller/ Postup: 1. nalezení sekvenčně podobného proteinu (proteinů) se známou prostorovou strukturou (např. BLAST) 2. zarovnání sekvencí (Clustal, NW) 3. vytvoření modelu (modeller) 4. kontrola modelu (Prosa, Verify3D)
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce Zarovnání sekvencí
Jméno souboru templátu číslo prvního residua číslo posledního residua
C; A sample alignment in the PIR format; used in tutorial >P1;5fd1 structureX:5fd1:1 :A:106 :A:ferredoxin:Azotobacter vinelandii: 1.90: 0.19 AFVVTDNCIKCKYTDCVEVCPVDCFYEGPNFLVIHPDECIDCALCEPECPAQAIFSEDEVPEDMQEFIQLNAELA EVWPNITEKKDPLPDAEDWDGVKGKLQHLER* >P1;1fdx sequence:1fdx:1 : :54 : :ferredoxin:Peptococcus aerogenes: 2.00:1.00 AYVINDSCIACGACKPECPVNIIQGSIYAIDADSCIDCGSCASVCPVGAPNPED *
řetězec posledního residua Jméno modelu
řetězec prvního residua
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce umístění templátu(ů)
Instrukce
# Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files']
název souboru zarovnání
a = automodel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling
index posledního modelu
název templátu(ů) název modelu
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce Vlastní spuštění: python modeldefault.py Vlastní spuštění: mod9.14 modeldefault.py
Modeller Co dál? fúzní protein Templát1 XXXXXXXXXXXXXXXXXX Templát2 XXXXXXXXXXXXXXXXXXXXXXX model XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX inzerce Templát1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX Templát2 XXXXXX model XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX indukované přizpůsobení Templát1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX Templát2 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX model XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
Modeller Co dál? Více řetězců C; A sample alignment in the PIR format; used in tutorial >P1;1XXX structureX:1XXX:1 :A:666 :C:::: XXXXXXXXX . . . XXXXXXXXXXXXX/ XXXXX . . . XXX* >P1;model sequence:model:1 :A:@ :C:::: XXXXXXXXX . . . XXXXXXXXX/ XXXXXXXXX . . . XXX*
Modeller Co dál
allhmodel
– přidá vodíky
# Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files']
('5fd1', '1xxx'),
více templátů
a = automodel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling 50
– 50 modelů
Modeller Co dál? Disulfidové můstky # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class # Redefine the special_patches routine to include the additional disulfides # (this routine is empty by default): class MyModel(automodel): def special_patches(self, aln): # A disulfide between residues 8 and 45: self.patch(residue_type='DISU', residues=(self.residues['8'], self.residues['45'])) log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] a = MyModel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling
Modeller Co dál? Vnucení sekundární struktury # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class class MyModel(automodel): def special_restraints(self, aln): rsr = self.restraints at = self.atoms rsr.add(secondary_structure.alpha(self.residue_range('20:', '30:'))) log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] a = MyModel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling
Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. triosafosfátisomerasa 7TIM
Aldolasa 3d0c
TIM ARTFFVGGNFKLNGSKQSIKEIVERLNTASIPENVEVVICPPATYLDYSVSLVKKPQVTV aldo MSLDYGEFSKRFSTISG TIM GAQNAYLKASGAFTGENSVDQIKDVGAKWVILGHSERRSYFHEDDKFIADKTKFA aldo INIVPFLEGTREIDWKGLDDNVEFLLQNGIEVIVPNGNTGEFYALTIEEAKQVATRVTEL TIM LGQGVGVILCIGETLEEKKAGKTLDVVERQLNAVLEEVKDWTNVVVAYEPVWAIGTGLAA aldo VNGRATVVAGIGYSVDTAIELGKSAIDSGADCVMIHQPVHPYI TIM TPEDAQDIHASIRKFLASKLGDKAASELRILYGGSANGSNAVTF aldo TDAGAVEYYRNIIEALDAPSIIYFKDAHLSDDVIKELAPLDKLVGIKYAINDIQRVTQ TIM KDKADVDGFLVGGASLKPEFVDIINSRN aldo VMRAVPKSSNVAFICGTAEKWAPFFYHAGAVGFTSGLVNVFPQKSFALLEALEEGNQEKI
12 % identity
Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. PHYRE2 http://www.sbg.bio.ic.ac.uk/phyre2/ Fold Recognition - UCLA-DOE http://www.doe-mbi.ucla.edu/Services/FOLD/ I-TASSER http://zhanglab.ccmb.med.umich.edu/I-TASSER/
Ab initio, de novo Nativní struktura proteinu má vlastnosti, které jí odlišují od ostatních struktur. FoldIT http://fold.it
Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu.
K. Lindorff-Larsen, S. Piana, R.O. Dror, D.E.Shaw: How Fast-Folding Proteins Fold. Science 2011, 334(6055) 517-520.
Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu.
VIDEO
CASP – Critical Assessment of protein Structure Prediction http://predictioncenter.org/
CASP – Critical Assessment of protein Structure Prediction http://predictioncenter.org/