Fizikai Szemle 2007/6 216.o.
HÁLÓZATOK MINDENÜTT
Karinthy Frigyest legtöbben humoros és más szépirodalmi
írásai révén ismerik. Talán kevesen tudják
róla, hogy már középiskolás korában élénken érdeklődött
a matematika és a természettudományok iránt.
Ez az érdeklődése megmaradt később is, és 1929-ben
a Minden másképpen van gyűjteményben egy kimondottan
matematikai kérdésről írt Láncszemek
címmel. Vajon hány közvetlen ismeretségi kapcsolaton
keresztül lehet összekötni valamelyikünket egy
távoli helyen élő másik emberrel? Másképpen megfogalmazva:
az emberek ismeretségi hálójában maximum
hány lépésen keresztül lehet két, véletlenszerűen
kiválasztott embert összekapcsolni? A példa kedvéért
próbálja meg az Olvasó saját maga és egy eszkimó
között megtalálni a legrövidebb utat közvetlen
ismerősökön (és barátokon, családtagokon) keresztül.
Könnyen lehet, hogy az Olvasónak van egy sokat
utazó ismerőse, akinek az egyik munkatársa járt
messze északon és találkozott az adott eszkimóval.
1. ábra. Az úthálózatot városok alkotják és egy városnak általában
3-4szomszédja van, de 10 vagy több szomszéddal rendelkező várost
nem találunk. Az internet egymással összekötött számítógépekből
áll, és gyakoriak a kiugróan sok szomszéddal rendelkező pontok,
az ábrán világosabb színnel. (Az ábrák forrása a Google Maps,
illetve a http://www.caida.org
weboldal.)
Így az Olvasótól az utazó ismerősén és annak munkatársán
keresztül három lépés vezet a kiválasztott
eszkimóhoz. Karinthy becslése szerint az összes (akkoriban
másfél milliárd) ember közül bármelyik kettő
összeköthető legfeljebb 5 lépésben. Frissebb becslések
szerint napjainkban ez a szám valahol 6 és 9 között
van, azaz az ismeretségi hálóban két résztvevő
között a távolság (a legrövidebb úthossz) jóval kisebb,
mint az összes résztvevő száma. Általánosságban
az ilyen tulajdonságú hálózatokat - az ismeretségi
háló alapján - kis világnak hívjuk.
Karinthy példája csupán egy a sok hálózat (gráf) közül,
amely körülvesz minket. Mindannyian ismerjük a
világméretű számítógép-hálózatot, az internetet, és a
számítógépeken tárolt weboldalak hálóját, a www-t.
Legtöbben naponta telefonálunk, és ha a telefonhívásokat
ábrázoljuk, akár csak egyetlen telefontársaság előfizetői
között, akkor is több millió pontból álló gráfot
kapunk. Ennek a gráfnak a (csúcs)pontjai az előfizetőket
jelölik, a csúcsokat összekötő vonalak (élek) pedig
azt, hogy két előfizető között volt-e hívás. Hosszabb
időszak alatt természetesen többször is telefonálhat
egymásnak két ember, ilyenkor az adott kapcsolatot
ábrázoló élnek nagyobb súlyt adhatunk. A felsorolt példák
közül a www és a telefonhívások gráfjában is rendelhetünk
irányt az élekhez, ezekkel a nyilakkal a hiperlinkek,
illetve a hívások irányát tudjuk jelölni.
Az emberi kapcsolatok és az elektronikus rendszerek
mellett a biológiában is számos hálózat ismert. A
legtöbb biológiai hálózat azt összegzi, hogy egy rögzített
sejttípusban a különböző molekulák (például fehérjék
és anyagcseretermékek) a reakcióik során milyen
más molekulákkal lépnek kapcsolatba. Egy ilyen
"kölcsönhatási térkép" tartalmazza például azt, hogy a
vizsgált sejttípusban a víz- és a glükózmolekula között
van-e kölcsönhatás. Ha igen, akkor a két molekulát
ábrázoló egy-egy pont össze van kötve. Az emberi
nyelvek és maga az emberi gondolkodás is sok hálót
produkál. Könyvespolcokon gyakran megtalálható a
magyar és az angol nyelvű szinonimaszótár; az ebben
lévő kapcsolatok definiálják a szinonimahálózatot.
Szintén hasznos eszköz a könyvtárak által a könyvek
osztályozásához, besorolásához használt egységes
tizedes osztályozás (ETO). Az ETO-ban minden témanevet
egy számsor jelöl, amelynek az elemeit tizedespontok
választják el. Ha ezt lerajzoljuk, akkor egy
nagy elágazó fát kapunk (szintén hálózat), amelynek
a legalsó csúcspontjain általános címszavak találhatók,
például 1. szépirodalom, 2. történetírás, majd
ezek felett a fa kisebb ágain egyre speciálisabbak a
témanevek: 1.1. regény, 1.2. vers stb. A közlekedésből
is ismerünk hálókat, például a közúti hálózatban
mindegyik város egy pont és két pontot összekapcsolunk,
ha a két város egy főút mentén szomszédos. A
légi közlekedésben szintén a városok a pontok (bár
egy városnak több repülőtere is lehet), és két várost
összekötünk, ha van köztük közvetlen repülőjárat.
A matematikusok a gráfokat több száz éve vizsgálják,
és a gráfelmélet a matematika egyik igen jelentős
ága. Azonban az utóbbi egy évtizedben a hálózatokról
rendelkezésre álló adatok mennyisége és részletgazdagsága
ugrásszerűen megnőtt. Ezt a jelentős változást
felerősítette az internet fejlődése, amely korábban nem
látott mennyiségű mérési adatot tett ingyenesen elérhetővé
bárki számára. Emiatt a matematikusokon kívül a
fizikusok, biológusok, szociológusok és más kutatók is
egyre intenzívebben kapcsolódnak be a hálózatok kutatásába.
Ezen belül a fizikusok a nagy és összetett
(komplex) rendszerek megfigyelése során mindig az
egyszerű, közös tulajdonságokat keresik. Sokszor nem
a pontos egyezést vizsgálják, hanem csak a gyakran
előforduló (statisztikai értelemben vett) hasonlóságot.
Ezért a 90-es évek végétől kezdődően a fizikusok, más
kutatókkal együtt, meglepve és örömmel tapasztalták,
hogy a sokféle komplex hálózatban több egyszerű, hasonló
tulajdonság található. Az egyik legkorábbi ilyen
eredmény, hogy a nagy hálózatok közül sok rendelkezik
az ismeretségi hálózatban már látott kisvilág - tulajdonsággal.
Szintén kis világ az internet és a www, viszont
nem kis világ egy pókháló és a közúti hálózat. A
legkisebb számú lépést, amellyel egy gráfban két csúcs
az éleken haladva összeköthető, a két pont közötti legrövidebb
úthossznak nevezzük. A kisvilág-tulajdonság
matematikai megfogalmazásban azt mondja ki, hogy ha
növeljük egy hálózat méretét, akkor a benne mérhető
legrövidebb úthosszak a hálózat méreténél jóval lassabban
(legfeljebb logaritmikusan) nőnek. Azaz, ha egy
kisvilághálózatban a csúcsok (résztvevők) száma tíz- vagy
százszorosára nő, a legrövidebb út bármely két
pont között akkor is csak egy vagy két lépéssel lesz
hosszabb.
2. ábra. A gyümölcslégy (Drosophila melanogaster) fehérjéinek
kölcsönhatási hálózatára
vonatkozó első részletes "térkép" 2004-ben készült el. Az emberi sejtek fehérjéi
közötti kölcsönhatások térképe ilyen részletességgel még nem ismert. Azonban
a gyümölcslégy fehérjéi között talált kölcsönhatások segítségével, szekvenciahasonlóság
alapján az emberi fehérjék kölcsönhatásai is pontosabban jósolhatóak.
(Az ábra forrása: Giot et.al., Science, 302 [2004] 1727-1736.)
A legrövidebb utak vizsgálata után most nézzük
meg azt, hogy vajon egy kiválasztott csúcspontból
nézve másmilyennek látjuk-e a www-t és az úthálózatot
(1. ábra). A www-n és az úthálózatban is sok
olyan pont (weboldal, város) található, amelyiknek
kevés kapcsolata van (hiperlinkkel kapcsolt másik
weboldal, illetve szomszédos város). Azonban, ha a
sok kapcsolattal rendelkező pontokat vizsgáljuk,
akkor a két hálózatban jelentős eltérést tapasztalunk.
Egy városnak általában 3-4közúti szomszédja van, de
10-nél semmiképp sem több. Viszont a weboldalak
között soknak van ezernél is több kapcsolata és néhánynak,
mint a Google és a Yahoo, több millió. Egy
csúcs szomszédainak számát az adott csúcs fokszámának
nevezzük. A különböző fokszámok
eloszlásfüggvénye, p (k ), megmutatja, hogy
ha az összes csúcs közül véletlenszerűen
kiválasztunk egyet, akkor annak a fokszáma
p (k ) valószínűséggel lesz k. Az úthálózatban
nagyon kis eséllyel találunk olyan
csúcsot, amelynek a fokszáma az átlagos
értéknél jóval nagyobb; az útvonalak gráfján
és a hasonló hálózatokban végzett mérések
szerint ez a valószínűség a k értékkel
exponenciálisan csökken:
Putak(k) ~ e-k.
A www-n és a biológiai hálózatokban gyakoriak az átlagosnál jóval több kapcsolattal
rendelkező csúcsok. A mérések szerint
ezekben a hálózatokban a fokszámeloszlás
a nagy fokszámoknál hatványfüggvény
szerint csökken:
Pwww(k) ~ k-.
Itt általában 2 és 3 közötti szám. Ha
például = 3, akkor a k = 10 fokszámú csúcs
előfordulási valószínűsége 8-szor kisebb,
mint a k = 5 fokszámú csúcsé. Ezzel szemben
az exponenciális esetben a k = 10-es
csúcs e5-szer (körülbelül 150-szer) kevésbé
gyakori, mint a k = 5-ös. A nagy fokszámú
csúcsok előfordulási valószínűsége alapján
a hálózatokat két fő csoportba szokás sorolni.
Az exponenciális hálózatokban az
átlagosnál jóval több kapcsolattal rendelkező
csúcsokat nem találunk (az exponenciális
függvény nagyon gyorsan csökken),
míg a hatványfüggvény szerinti fokszámeloszlású,
más néven skálafüggetlen hálózatokban
ehhez képest gyakoriak a kiugróan
sok szomszéddal rendelkező csúcsok.
A fokszámeloszlás és a kisvilág -tulajdonság sok
alkalmazásban igen fontos szerephez jut. A www-n és
a légi közlekedésben alapvető, hogy néhány lépéssel
(kattintással, illetve átszállással) a hálózatban bárhová
eljuthassunk. De ezért a jó tulajdonságért mindkét
esetben árat kell fizetnünk. A www-n gyakran előfordul,
hogy a legtöbb kapcsolattal rendelkező oldalakat
egyszerre próbálja sok felhasználó letölteni, a légi
közlekedés pedig lehetőséget ad arra, hogy távoli
vidékek fertőző betegségei gyorsan eljussanak mindenhová.
Érdekes, hogy az elmúlt években az ezekkel
kapcsolatos jelenségekre a statisztikus fizika elméleti
eszközeivel igen pontos leírásokat és javaslatokat
sikerült adni.
Napjainkban az egyik legaktívabban kutatott hálózat
az élő sejtek fehérjéinek kölcsönhatási hálózata.
Sok ismert szekvenciájú és szerkezetű fehérjéről még
nem vagy csak részben ismert, hogy milyen feladatot
végez a sejtben. A hálózatban vele kölcsönható más
fehérjék (szomszédok) segítségével azonban ez a
funkció jósolható. További érdekesség, hogy a fehérjék
általában csoportosan, összekapcsolódva végeznek
el egy-egy feladatot. A fehérje-fehérje kölcsönhatási
hálózat segítségével új fehérjecsoportokat találhatunk,
és jobban megismerhetjük, hogy ezek a csoportok
(fehérjemodulok) hogyan működtetik az emberi,
állati és növényi sejteket (2. ábra).
Farkas Illés
MTA-ELTE Biológiai Fizika Kutatócsoport