Fizikai Szemle 2001/1 - Venetianer Pál: AZ EMBERI DNS TELJES NUKLEOTID-SORRENDJÉNEK MEGFEJTÉSE

AZ EMBERI DNS TELJES NUKLEOTID-SORRENDJÉNEK MEGFEJTÉSE

Venetianer Pál
Szegedi Biológiai Központ

2000. június 26-án, Clinton amerikai elnök és Blair brit miniszterelnök közös sajtóértekezleten jelentették be, hogy az ember öröklési anyagának teljes információtartalmát lényegében megfejtették, az a hárommilliárd dolláros tervezett költségvetésű kutatási program, amely 1990-ben ezt a célt tűzte ki: sikerrel járt. Noha sok szakember kissé csodálkozott, hogy mi indokolta a bejelentést (hiszen "lényegében" befejezni a programot bármikor lehet, nehéz megindokolni, hogy a nukleotid-sorrend 97%-a miért inkább befejezés, mint 96% vagy 98%), az azonban kétségtelen, hogy a nagyszabású vállalkozás sikeresnek bizonyult, a megszerzett információk hasznosítása folyik és a tényleges teljes befejezés látható közelségbe került.

Minthogy e programról és jelentőségéről sokat írt a világsajtó, - közte sok ostobaságot is - talán érdemes egy rövid cikkben összefoglalni a legfontosabb tudnivalókat a fizikus olvasók számára.

Az nyilván közismert, hogy az egész földi élővilágban az öröklött információk hordozója egy aránylag egyszerű szerkezetű (és szintetikusan is előállítható) makromolekula, a DNS. E polimért négy kisebb molekula (nukleotid) építi fel, szabálytalan sorrendben lineárisan összekapcsolódva, és e nukleotidok (rövidítésük: A, G, T, C) sorrendje testesíti meg az örökletes információt, amely a genetikai kódszótár által meghatározott módon, fehérjék aminosav-sorrendjére "lefordítva" határozza meg az életet, az élőlények valóságosan megjelenő tulajdonságait. A soksejtű élőlény minden egyes sejtjében ugyanaz a DNS-ben
kódolt információ. Az élőlények bonyolultsági fokával természetesen többé-kevésbé arányos ez az információmennyiség, a legegyszerűbb Vírusban mindössze néhány ezer, a baktériumokban néhány millió, a magasabb rendű élőlényekben több milliárd nukleotid. Az emberi DNS mintegy 3 milliárd nukleotid hosszúságú (azaz 750 megabyte-nyi információt tartalmaz).

A hetvenes évek közepén dolgozták ki azokat a szellemes biokémiai eljárásokat, amelyek lehetővé tették a DNS nukleotid-sorrendjének aránylag gyors és egyszerű meghatározását (kémiai Nobel-díj 1980-ban Frederick Sanger angol és Walter Gilbert amerikai kutatónak). 1977-ben Sanger munkacsoportja (11 kutató két évi munkájával) megfejtette a legkisebb ismert vírus körülbelül 5400 nukleotidnyi teljes DNS nukleotid-sorrendjét (szekvenciáját).

A következő években, ahogy tökéletesedett a szekvenálás technikája és egyre nagyobb DNS molekulák (még mindig csak vírusok) teljes nukleotid-sorrendjét sikerült megfejteni, egyre több kutató vetette fel, hogy érdemes volna egy nagyszabású organizált program keretében nekifogni a teljes emberi DNS-nukleotid-sorrend megfejtésének. Csaknem egy évtizedes intenzív vita, szakmai és politikai harc, kemény és céltudatos lobbyzás után (egy erről szóló kitűnő könyv címe: "A génháborúk"), 1990. október elsején hivatalosan megindult az USA-ban az a 15 évre tervezett, hárommilliárd dolláros program (HGP = Humán Genom Program), amely az Energiaügyi és az Egészségügyi Minisztérium finanszírozása mellett, egy újonnan létesült, James Watson (a DNS kettőscsavar szerkezetének egyik Nobel-díjas felfedezője) vezetésével működő programiroda irányításával, elindította a szervezett munkát. Később számos más tudományos nagyhatalom (Anglia, Franciaország, Japán, Németország) is csatlakozott a programhoz egy nemzetközi tanácskozó testület (HUGO = Humán Genom Organizáció) koordinálásával.

Anélkül, hogy a technikai részletekbe belemennénk, itt el kell mondani, hogy a szekvenálási módszer egy-egy kísérlettel átlagosan mintegy 500 nukleotid hosszúságú DNS-szakasz sorrendjét képes meghatározni. Az első - néhány ezer, vagy néhány tízezer nukleotidnyi hosszúságú - vírus-DNS-molekulák esetében a kutatók úgy jártak el, hogy többféle módon (a szekvenciát meghatározott elemeknél felismerő és hasító enzimek segítségével) kisebb darabokra vágták ezeket a DNS-eket, meghatározták az egyes darabok (azaz a hasítóhelyek) egymáshoz viszonyított helyzetét és távolságát. Az így kapott úgynevezett "fizikai térkép" jelentette azt a keretet, azokat a vonatkoztatási pontokat, amelyek között el tudták helyezni az egyes kísérletekben kapott, átlagosan 500 nukleotid hosszúságú, meghatározott szekvenciaelemeket.

A több nagyságrenddel nagyobb emberi DNS esetén ez a stratégia közvetlenül nem volt alkalmazható, de elvileg itt is csak az látszott járható útnak, hogy fokozatosan, felülről lefelé haladva próbálják megtalálni a tájékozódási pontokat az információk dzsungelében, egyre finomítva a térkép felbontását.

Ha a DNS-t szövegnek tekintjük, a teljes emberi genom mintegy 2000 vaskos kötetet kitevő könyvtár volna, azzal a különbséggel, hogy ez a hatalmas mennyiségű információ nem 2000, hanem csak 23 kötetbe zsúfolódik össze (23 kromoszóma). Ahhoz, hogy az átlag 500 betűs bekezdéseket (mint mondtuk, ekkora szövegdarabot tudunk egyszerre elolvasni) el tudjuk helyezni ebben az irdatlan tömegű szövegben, először meg kell próbálnunk a mega-köteteken belül fejezeteket, és alfejezeteket, majd oldalakat lokalizálni.

Visszatérve most már a DNS-re, először tehát ki kellett dolgozni, fel kellett fedezni olyan új módszereket, amelyek ezt a tájékozódást lehetővé tették a százezertől tízmillió nukleotidos nagyságrendben. E módszerek birtokában 1992-93-ban készültek el az első integrált térképek az emberi DNS-ről, amelyek a kitűzött stratégiai célnak megfelelően kitűzték ezeket az útjelző póznákat valamennyi kromoszómán, többé kevésbé megfelelő sűrűségben. Ez rendkívül nehéz feladatnak bizonyult, számos kudarccal és tévúttal járt. A program első ötéves periódusában szisztematikus szekvenciameghatározási munka voltaképpen nem is folyt; csak ez a térképezés. Illetve, pontosítsunk: emberi szekvenciameghatározás nem folyt. Ugyanis már a program indulásakor elhatározták tervezői, hogy az nem fog kizárólag az emberre összpontosítani, hanem kijelölt modellszervezetek DNS nukleotid-sorrendjét is meg fogja határozni. Egyrészt azért, hogy a módszereket tökéletesítsék, begyakorolják egyszerűbb terepen, másrészt azért, mert tudható volt, hogy ezek is fontos információkat szolgáltatnak majd az általános biológia és az orvostudomány számára. A kijelölt szervezetek: az Escherichia coli és a Bacillus subtilis nevű igen jól ismert biológiájú és genetikájú ártalmatlan baktériumok, az élesztő mint szintén jól ismert egysejtű magasabb rendű (eukaryota) gomba, a Caenorhabditis elegans nevű fonalféreg, mint primitív soksejtű állat, az Arabidopsis thaliana (lúdfű) nevű egyszerű növény és a Drosophila melanogaster (muslica), a genetika kedvenc állata.

Mindezen élőlények vizsgálata tehát megindult. Közülük elsőként, 1996-ban az élesztő teljes (12 millió nukleotid hosszúságú) DNS-nukleotid-sorrendje készült el, több mint hatvan kutatócsoport nagy nemzetközi összefogásával. Közben azonban történt egy váratlan és nagy horderejű esemény. Craig Venter, aki korábban a Nemzeti Egészségügyi Intézetben dolgozott, feleségével és néhány munkatársával magánvállalatot alapított, ennek keretében, a HGP programon kívül, 1995-ben meghatározta az első baktérium (Haemophilus influenzae) 2 millió nukleotidnyi teljes DNS-szekvenciáját. Ez az eredmény önmagában is szenzáció volt, de még inkább azzá tette, hogy Venter gyökeresen más stratégiát alkalmazott, mint addig mindenki. Abból indult ki, hogy a fizikai térképezés annyival idő- és pénzigényesebb, mint maga a szekvenálás, hogy érdemesebb az előbbit teljesen elhagyni és sokszoros (látszólag felesleges és redundáns) szekvenálással helyettesíteni. Venterék tehát nem készítettek semmiféle térképet, hanem a teljes DNS-t véletlenszerűen tördelték kis darabokra, és ezeket a kis darabokat - szintén véletlenszerűen - szekvenálták nyakra-főre. Azaz, a minimálisan feltétlenül szükséges 4000 (2 millió/500 = 4000) szekvenálási kísérlet helyett közel hússzor ennyit végeztek el, majd az egész adathalmazt betáplálták a számítógépbe, abban bízva, hogy a véletlenszerűen töredezett DNS darabok megismert szekvenciái jórészt átfedik egymást, és az átfedések alapján a komputer képes lesz hibátlanul összeállítani a teljes szekvenciát, illetve, ha mégis marad néhány hiány, azoknak a befoltozása tervszerű kereséssel még mindig könnyebb lesz, mint a teljes előzetes térképezés. A stratégia bevált, a következő években számos más baktérium teljes DNS-szekvenciáját határozták meg ugyanígy Venterék, majd más csoportok is.

A HGP keretében a hagyományos stratégiával dolgozó kutatók elismerték ugyan Venterék eredményeit, de módszerét az emberi DNS-re alkalmazhatatlannak tartották. Egyrészt azért, mert három nagyságrenddel nagyobb DNS esetében a nehézségek aránytalanul nagy mértékben nőnek, másrészt pedig a kétféle DNS között az is jelentős különbség, hogy míg a baktériumok DNS-e lényegében teljes hosszában egyedi szekvenciákból áll, addig a magasabb rendűek DNS-e - így az emberé is - igen nagy számban tartalmaz ismétlődő (olykor sokszázezer példányban ismétlődő) azonos szakaszokat, és ez lehetetlenné teszi Venter véletlenszerű stratégiájának sikerét. Ventert nem győzték meg az ellenérvek. Hatalmas mennyiségű vállalkozói tőkét gyűjtött, megnyerte a szekvenáló automatákat gyártó legnagyobb cég támogatását és 1997-ben bejelentette, hogy saját magánvállalata tizedannyi költséggel, feleannyi idő alatt elvégzi az emberi DNS nukleotid-sorrendjének megfejtését, mint az "állami" program.

Ez a bejelentés természetesen óriási vihart kavart. Az "állami" program kutatói egyrészt kételkedtek Venter ígéreteinek teljesíthetőségében, másrészt az aggasztotta őket, hogy ha Venter "győz" , az információ nem válhat közkinccsé, hasznosításának eredményei magánzsebekbe vándorolnak. Venter viszont azt állította, hogy a tiltakozók valójában csak egzisztenciájukat, állami támogatásukat féltik. Eme - olykor alpári hangú - vitáknak azonban volt egy mindenképpen pozitív hozadéka: a "hivatalos" program jelentősen felgyorsult. A venteri stratégia eredményessége pedig nemsokára látványosan bebizonyosodott a Drosophila-program sikeres befejezésével, amely igazolta, hogy az ismétlődő szekvenciák léte csak nehezíti, de nem lehetetleníti el a véletlenszerű szekvenálási módszer alkalmazhatóságát.

A június 26-i bejelentés tehát nem elsősorban annak Volt köszönhető, hogy a Humán Genom Program befejeződött, hanem annak, hogy a két felet sikerült összebékíteni, kompromisszum született arról, hogy mennyiben használhatják egymás eredményeit és Venter adatai mennyiben állnak ingyenesen a "köz" rendelkezésére. A tényleges helyzet pedig a következő: a két programban együttesen, a szekvencia 97%-a készült el (nem számítva a biztosan nem-információhordozó, úgynevezett heterokromatikus régiókat), természetesen igen sok hézaggal megszakítva. A meglévő szekvenciák pontossága, megbízhatósága még nem éri el az előírtat (a kívánatos szint legfeljebb egy hiba 10000 nukleotidonként). Ez a tényállás természetesen kijelöli a legfontosabb hátralévő teendőket: a lyukak befoltozása, a szekvencia teljessé tétele és pontosítása.

Kérdés: ha ez meglesz (várhatóan egy éven belül), vajon mondhatjuk-e, hogy megismertük az emberi öröklés összes titkát, teljes információtartalmát? Természetesen nem. A baktériumoknál és vírusoknál a DNS funkcionális egységei, az egyes tulajdonságokat meghatározó gének, többé-kevésbé szorosan egymáshoz illeszkedve lefedik a DNS teljes hosszát, a gének között, vagy azokon belül alig van információhordozó funkció nélküli DNS. A magasabb rendűeknél és így az embernél is viszont a helyzet ennél lényegesen bonyolultabb. A teljes DNS-nek kevesebb, mint 5%-a tekinthető aktív, működő génnek. A többi szinte biztosan funkciónélküli vagy esetleg csak szerkezeti szerepet játszó ismétlődő szekvencia, ismeretlen funkciójú, de biztosan nem fehérjét-kódoló DNS, evolúciós maradvány (valaha gén volt, de ma nem működik), szóval sok minden, amit olykor "szemét DNS" néven tisztelnek a kutatók. Ebből a helyzetből következik, hogy ha egy baktérium-DNS szekvenciáját megfejtik, akkor azon kiváló algoritmusok, komputerprogramok segítségével nagy biztonsággal kijelölhetők a kódoló, információhordozó DNS-szakaszok, a gének, azok kezdete és vége. Ugyanez magasabb rendűeknél nehéz, jelenleg megoldatlan. A Drosophila esetén a szekvencia megfejtése után Venter cége 40 kiváló bioinformatikust és Drosophila genetikust hívott össze, akik egy hétig éjjel-nappal összezárva lényegében elvégezték az annotációt, vagyis a muslica mintegy 13 000 génjének többé-kevésbé pontos kijelölését a szekvenciában. Ugyanez a feladat a hússzor nagyobb emberi genom esetén sokkal nehezebb lesz. Olyannyira, hogy az emberi gének számára nézve a legvalószínűbbnek látszó 70000 mellett jelenleg forgalomban vannak a legkülönbözőbb becslések 25000 és 180000 között. Erre a számra manapság a szakemberek körében fogadni is lehet.

Az annotáció sikeres megoldása - ami még messze van - még mindig nem jelenti azt, hogy minden fontosat tudunk. A genetikailag, biokémiailag kimagaslóan legjobban ismert élőlények, például a coli-baktérium vagy az élesztő esetén is, a kijelölt, megismert géneknek csak mintegy egyharmadáról tudjuk biztosan, hogy milyen feladatot látnak el. Egy másik harmadukról a szerkezet ismeretében, más szervezetek génjeihez vagy más ismert funkciójú fehérjékhez való hasonlóság alapján sejthető a funkció. A gének mintegy harmada esetében azonban sejtelmünk sincs arról, hogy azok milyen szerepet játszhatnak a sejt életében. Mindez az embernél természetesen sokkal több ismeretlen gént jelent. Feltehetően a következő évtizedekre elegendő feladatot kínál az úgynevezett funkcionális genomika, azaz az egyes gének feladatának, szerepének teljes megismerése.

További fontos kérdés az emberi genom individualitása. Az emberiség különböző egyedei közti különbség a nukleotid sorrend szintjén elég csekély, nagyságrendileg 0,1%, átlag 1000 nukleotidonként egy eltérés. Ez nem teljesen véletlenszerű, vannak szakaszok, ahol biztosan nincs különbség, másutt az átlagosnál gyakoribb az eltérés. A következő évek kutatásainak egyik súlyponti kérdése lesz az ilyen egyedi különbségek feltérképezése, azok esetleges jelentőségének, szerepének feltárása.

Ugyancsak fontossá fog válni az ember szempontjából a legközelebbi jövőben az egér teljes DNS nukleotid sorrendjének a megfejtése. Ennek az a jelentősége, hogy az egér a genetikailag legjobban ismert emlősállat és a nukleotid-sorrend szempontjából meglepően közel áll az emberhez. Remélhető, hogy ezért az egérszekvencia ismeretében számos funkcionális kérdésre az embernél könnyebben fogunk tudni válaszolni. Az egér azért is fontos, mert számos emberi betegség kutatásában az egérmodell alkalmazása igen nagy segítséget jelent.

A genomprogram befejezésének bejelentése természetesen alkalmat adott számos optimista - olykor lelkendező - jóslatra arról, hogy micsoda változást jelent majd ez az orvostudomány szempontjából, milyen új gyógyítási lehetőségek nyílnak meg szinte azonnal. Ebben sajnos sok a túlzás. A program eredményei inkább csak hosszabb távon fognak hasznosulni. A következőkben megkíséreljük - szükségképpen igen vázlatosan - áttekinteni ezeket a perspektívákat.

1. Egyes kórokozó baktériumok DNS-nukleotid sorrendjének megfejtése lehetővé teszi e baktériumok elleni új vakcinák és antibiotikumok kifejlesztését (például az agyhártyagyulladást okozó Neisseiria meningitis ellen).
2. A modellszervezetekben megtalálhatók egyes betegségokozó emberi gének hasonmásai, ezek támpontul szolgálhatnak e betegségek új terápiáinak kidolgozásához. Például az Alzheimer-kór kialakulásában szerepet játszó egyik génhez hasonlót találtak fonalféregben, ennek segítségével remélik új gyógyszer kifejlesztését.
3. Egyes emberi hormonok, citokinek használatosak gyógyszerként is (például inzulin, interferon). Az emberi DNS nukleotid sorrend alapján már több új, eddig ismeretlen emberi hormonjellegű anyagot azonosítottak és állítottak elő, ezek klinikai vizsgálata folyamatban van.
4. Az ember több mint ezer genetikai betegsége közül néhány száz esetében volt eddig pontosan ismert a betegségokozó gén és annak szerkezete. Ez előfeltétele minden lehetséges oki terápiának. A jövőben ez minden ilyen betegség esetében hamarosan ismert lesz.
5. Az embert sújtó legfontosabb betegségek (például rák, magas vérnyomás, érelmeszesedés, cukorbaj, skizofrénia, Parkinson-kór stb.) a szó szoros értelmében nem örökletes betegségek. Mai tudásunk szerint azonban kisebb nagyobb mértékben örökletes tényezők, egyes gének eltérő működése is szerepet játszik e betegségek kialakulásában (például a cukorbaj esetében eddig 17 különböző gént azonosítottak, amelyek közreműködhetnek e kórképben). A terápia szempontjából e tényezők tisztázása sokat jelenthet, elsősorban azért, mert a betegek csoportosíthatók genetikai alapon, és a különböző csoportokba tartozó páciensek mind életmódban, mind gyógyszerezésben más-más elbánást igényelhetnek.
6. Az ismert emberi gyógyszerek többnyire valamilyen emberi fehérjével (a gyógyszer célpontja) való kölcsönhatás révén hatnak. A jelenleg ismert összes célpontok száma 4-500. A teljes DNS-szekvencia ismeretében elvileg valamennyi (többszázezer) emberi fehérje megvizsgálható a gyógyszerkutatók számára, mint potenciális célpont.
7. A farmakogenomika nevű új tudomány azt vizsgálja, hogy az emberi DNS nukleotid-sorrendben meglévő egyedi különbségek hogyan befolyásolják a gyógyszerekre való érzékenységet. Az USA-ban évente mintegy 100 000 ember hal meg helytelen gyógyszeralkalmazás következtében. Ez a szám nem műhiba vagy hanyagság miatt ilyen riasztóan magas, hanem azért, mert minden gyógyszerrel kapcsolatban léteznek egyének, akik számára a szokásos adagban az adott gyógyszer mérgező és más egyedek, akikre a gyógyszer egyáltalán nem hat. A farmakogenomika célja az, hogy megvalósulhasson az egyedre, az egyed genetikai "alkatára" szabott gyógyszerrendelés.
8. A már megvalósult, de nyilvánvalóan rohamosan terjedő alkalmazások között kell említeni az örökletes betegségek DNS-diagnosztikáját. Itt tulajdonképpen nem is helyes a betegség diagnosztikájáról beszélni, hiszen többnyire arról van szó, hogy egészséges emberekről lehet megállapítani azt, hogy látens hordozói-e egy betegségokozó génnek, amelynek családtervezési szempontból van jelentősége, vagy azt, hogy később ki fog-e náluk alakulni a betegség, esetleg azt, hogy az átlagosnál hajlamosabbak-e valamely nem örökletes betegségre (például rák). Ez különösen akkor lehet fontos, ha életmóddal, megelőző műtéttel lehetséges lépéseket tenni a betegség későbbi kialakulásának megelőzésére.
9. A genetikai betegségek gyógyításának potenciálisan legfontosabb eszköze az úgynevezett génterápia, azaz ép gén működőképes bevitele a beteg egyén sejtjeibe, szervébe. Noha ez az eljárás számos nehézséggel küzd és alkalmazása néhány bíztató kezdeti eredménnyel még csak kísérleti stádiumban van, nyilvánvalóan a gének teljes megismerése az előfeltétele minden sikeres jövőbeli alkalmazásnak.

A fenti - nyilvánvalóan felületes - összefoglalás talán alkalmas arra, hogy az olvasó megértse, hogy egyfelől miért indokolt az a lelkesedés, amellyel Clinton és Blair méltatták a genomprogramot, mint az emberi tudomány fejlődésének egyik fordulópontját, másfelől miért szükséges hangsúlyozni, hogy az alkalmazások többsége jelenleg kezdetleges kutatási stádiumban van, az igazi eredményekre évekig, esetleg évtizedekig kell még várni. Azt is látni kell, hogy a lehetséges (és valószínűleg kívánatos) alkalmazások némelyike súlyos etikai problémákat vet fel, olyan problémákat, amelyeknek kezelésére a társadalom, a törvényhozás, a jog és a mindennapi orvosi gyakorlat nincs kellőképpen felkészülve. Emiatt fogadja gyakran félelemmel és elutasítással az emberek egy része a humángenetika új fejleményeit. Ezért volna fontos, hogy minél többen világosan megértsék ezeket az eredményeket.

Fizikai Szemle honlap

Tartalomjegyzék

AZ EMBERI DNS TELJES NUKLEOTID-SORRENDJÉNEK MEGFEJTÉSE