A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak

A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak
A biológiai kutatás forradalmát éljük: a hatalmas, éveken át gyűjtött genomikai adatbázisok most a legújabb mesterséges intelligencia modellek alapját adják. Ennek legfrissebb példája a Google DeepMind új fejlesztése, az AlphaGenome, amely egyedülálló módon igyekszik megjósolni, hogy a genetikai variánsok miként befolyásolják azt, mikor, hol és hogyan kapcsolódnak be a gének szervezetünkben. Ez a modell túlmutat az AlphaFold (AlfaHajtogatás) sikerein, amely a fehérjék hajtogatódását, szerkezetét vizsgálja: az AlphaGenome (AlfaGenom) már az örökítőanyag szabályozását próbálja feltérképezni.

A genom nyelvének feltörése

A gépi tanulási modelleket szerteágazó, óriási mennyiségű adattal táplálják: két emblematikus forrás az ENCODE (A DNS-elemek enciklopédiája – Encyclopedia of DNA Elements) és a GTEx (Genotípus–szövet expresszió – Genotype-Tissue Expression) projekt, amelyek maguk is áttörést hoztak a humán genom megértésében. Az ENCODE célja eredetileg az volt, hogy feltérképezze, pontosan mely szakaszai “működnek” genomunknak: 20%-ukról már tudjuk, hogy szabályozó vagy egyéb biológiai funkcióval rendelkeznek, szemben a korábban “szemét-DNS”-nek hitt nagy többséggel. Lényeges, hogy ezek a régiók döntő szerepet játszhatnak abban, hogyan alakulnak ki betegségek, hiszen a genetikai eltérések többsége éppen itt található.

A GTEx erre az alapra épített – egyre több olyan génvariánst találtak, amelynek nem ismerték a szerepét, hiszen nem a kódoló génekben fordultak elő, hanem az ismeretlen tartományokban. Ezért kezdte el a projekt feltérképezni, hogy egyes variánsok hogyan befolyásolják a génkifejeződést különböző szövetekben vagy sejttípusokban, vagyis működésbe lépnek-e, aktívak maradnak-e vagy éppen lezáródnak.

Az adatkincsek továbbfejlesztik az MI-t

Az ENCODE és a GTEx szabadon hozzáférhető, közösségi adatbázisokként születtek, amelyek immár évtizedekkel az indulásuk után is új MI-modellek kibontakozásához vezetnek. Ezek a hatalmas, megbízható adathalmazok tették lehetővé, hogy az AlphaGenome-hoz hasonló modern modellek egyre pontosabb előrejelzéseket adjanak arra vonatkozóan, miként szabályozódnak a gének. Mindazonáltal minél mélyebb, sejtszintű és zavaró (perturbációs) adatokat szerzünk, annál pontosabbá válhatnak ezek az előrejelzések.

Számos új projekt, például az Emberi Sejtatlasz (Human Cell Atlas) vagy a Génszabályozási Megfigyelő (Gene Regulation Observatory), éppen abban segít, hogy részletesen feltérképezzük, hogyan működnek a sejtek és szövetek egészséges és beteg állapotban.

Az MI szerepe a genom szabályozásának feltárásában

Ma már vezető laboratóriumok dolgoznak azon, hogy MI segítségével megfejtsék a génszabályozás “forráskódját”. Ilyen például a Broad Intézet Epigenomika Programja, ahol kizárólag gépi tanulással elemzik, hogy a génekhez közel eső szabályozó elemek (mint a promoterek) mikor és milyen sejtdifferenciáció során aktiválódnak. A kutatók ma már a 3D-s genomstruktúra elemzésére is MI-t alkalmaznak, hogy jobban megértsék a génkifejeződést távolról irányító kapcsolatrendszereket. Mindezt azért, hogy minél többféle sejttípusban, akár mutációkkal mesterségesen megzavart genomokon is tudják tesztelni és tanítani a modelleket.


A következő lépések: még több és még részletesebb adat

Ahhoz, hogy az MI teljes kapacitását kiaknázzuk a genomika területén, új típusú, célzott adatokat kell létrehoznunk. Például nemcsak arra van szükség, hogy tudjuk, hol milyen génszabályozó fehérjék kötődnek a DNS-hez, hanem arra is, hogy a különböző variánsok és zavaró hatások (pl. betegségek) milyen folyamatokat indítanak el egy-egy sejttípusban vagy szövetben.

Fontos, hogy ezeknek az adatforrásoknak együttesen kell kiszolgálniuk az MI-modellek igényeit, hogy ne csak önálló variánsokat elemezzünk, hanem átfogó, rendszerszintű szabályokat alkothassunk a génkifejeződésről és az öröklődő betegségek hátteréről is.

Az MI a pontosabb genetikai diagnózisok kulcsa lehet

Az elérhető, egyre pontosabb adatok és a csúcskategóriás MI-modellek lehetőséget teremtenek arra, hogy a genetikai szűrések során talált, eddig megmagyarázhatatlan variánsokat is jobban megértsük. Ez segíthet a súlyos betegségek gyorsabb felismerésében és személyre szabottabb kezelésében. Az AlphaGenome-hoz hasonló rendszerek révén végre közelebb kerülhetünk egy évtizedes vitához: vajon egyedi variánsokat érdemes vizsgálni, vagy inkább átfogó MI-modellekre bízzuk a szabályok feltárását?

Mindezt figyelembe véve a genomika jövője a minél részletesebb, nyíltan hozzáférhető adatbázisokon, valamint a fejlődő mesterséges intelligencián múlik. Ha jól használjuk ezeket, teljesen új dimenziókat tárhatnak fel előttünk az emberi egészség és betegségek megértésében.

2025, adminboss, phys.org alapján


Legfrissebb posztok

Mesterséges intelligencia hozhat áttörést a segélyhívóknál

MA 21:26

Mesterséges intelligencia hozhat áttörést a segélyhívóknál

Az amerikai 911-es segélyhívó központokban a mesterséges intelligencia (MI) már nem sci-fi: az Aurelian nevű digitális asszisztens valós időben segíti a híváskezelőket több mint egy tucat nagyvárosban. Milyen...

Rejtélyes múlt, aszteroidák után maradt troilitport keresnek

MA 21:02

Rejtélyes múlt, aszteroidák után maradt troilitport keresnek

🚀 A Naprendszer mintegy 4,6 milliárd évvel ezelőtt keletkezett, amikor a Nap körül örvénylő hatalmas gáz- és porfelhőből alakultak ki a bolygók, valamint az aszteroidák is. Az égbolton keringő...

Kutatók szerint a pollen lehet a jövő papírja és szivacsa

MA 20:52

Kutatók szerint a pollen lehet a jövő papírja és szivacsa

🌱 A Szingapúri Nanyang Műszaki Egyetem laboratóriumában látszólag szokványos kutatás zajlik, egészen addig, amíg meg nem pillantjuk a narancssárga-sárga foltokat a köpenyeken – ezek pollenből származnak. A pehelyszerű pollen...

Az Ars Technica cikke olvashatatlan – de miért?

MA 20:25

Az Ars Technica cikke olvashatatlan – de miért?

🔎 Internetezés közben bosszantó technikai akadályokba is ütközhetünk. Az Ars Technica oldal esetében sokan tapasztalják, hogy a böngésző túl sokáig várakozik, az oldal pedig egyszerűen nem tölt be. A...

Malac tüdővel élő férfi, sikeres Starship-küldetés

MA 20:02

Malac tüdővel élő férfi, sikeres Starship-küldetés

Külön figyelmet érdemel, hogy Kínában orvostörténelmet írtak: először sikerült genetikailag módosított sertés tüdejét emberbe ültetni úgy, hogy a szerv kilenc napig életben maradt. Bár a kilökődés tünetei hamar...

Amerikában munkaszüneti nap van, mi tart nyitva, mi zár be

MA 19:52

Amerikában munkaszüneti nap van, mi tart nyitva, mi zár be

2025-ben szeptember 1-jére esik az Egyesült Államokban a Munkaszüneti nap (Labor Day), amely az év egyik legjelentősebb munkavállalói ünnepe. Ez a nap hivatott elismerni a dolgozók, az egyszerű...


MA 19:30

Ősi vírusok élnek bennünk, ők az agyunk valódi ellenségei

Egyáltalán nem hagyható figyelmen kívül, hogy génjeink 40 százaléka lényegében ősi vírusmaradványokból, úgynevezett retrotranszpozonokból áll. Ezek az „ugráló gének” képesek helyet változtatni a genomban, sőt, amikor aktiválódnak, idegsejtkárosodást...


MA 19:01

Az újabb váratlan Stardew Valley-frissítés mindent felkavar

A Stardew Valley ismét meglepetés-frissítést kap, amelyet maga a játék fejlesztője, Eric Barone (ismertebb nevén ConcernedApe) jelentett be egy seattle-i koncerten. Bár sem pontos dátumot, sem részleteket nem...


MA 18:50

Az egyetemisták titkos MI-mániája

A generatív MI mára szinte teljesen beépült az egyetemisták mindennapi tanulási rutinjába. Már 85% használ ilyen megoldásokat, főként ötletelésre, korrepetálásra vagy vizsgára készülve, nem feltétlenül a házi feladatok...