A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak

A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak
A biológiai kutatás forradalmát éljük: a hatalmas, éveken át gyűjtött genomikai adatbázisok most a legújabb mesterséges intelligencia modellek alapját adják. Ennek legfrissebb példája a Google DeepMind új fejlesztése, az AlphaGenome, amely egyedülálló módon igyekszik megjósolni, hogy a genetikai variánsok miként befolyásolják azt, mikor, hol és hogyan kapcsolódnak be a gének szervezetünkben. Ez a modell túlmutat az AlphaFold (AlfaHajtogatás) sikerein, amely a fehérjék hajtogatódását, szerkezetét vizsgálja: az AlphaGenome (AlfaGenom) már az örökítőanyag szabályozását próbálja feltérképezni.

A genom nyelvének feltörése

A gépi tanulási modelleket szerteágazó, óriási mennyiségű adattal táplálják: két emblematikus forrás az ENCODE (A DNS-elemek enciklopédiája – Encyclopedia of DNA Elements) és a GTEx (Genotípus–szövet expresszió – Genotype-Tissue Expression) projekt, amelyek maguk is áttörést hoztak a humán genom megértésében. Az ENCODE célja eredetileg az volt, hogy feltérképezze, pontosan mely szakaszai “működnek” genomunknak: 20%-ukról már tudjuk, hogy szabályozó vagy egyéb biológiai funkcióval rendelkeznek, szemben a korábban “szemét-DNS”-nek hitt nagy többséggel. Lényeges, hogy ezek a régiók döntő szerepet játszhatnak abban, hogyan alakulnak ki betegségek, hiszen a genetikai eltérések többsége éppen itt található.

A GTEx erre az alapra épített – egyre több olyan génvariánst találtak, amelynek nem ismerték a szerepét, hiszen nem a kódoló génekben fordultak elő, hanem az ismeretlen tartományokban. Ezért kezdte el a projekt feltérképezni, hogy egyes variánsok hogyan befolyásolják a génkifejeződést különböző szövetekben vagy sejttípusokban, vagyis működésbe lépnek-e, aktívak maradnak-e vagy éppen lezáródnak.

Az adatkincsek továbbfejlesztik az MI-t

Az ENCODE és a GTEx szabadon hozzáférhető, közösségi adatbázisokként születtek, amelyek immár évtizedekkel az indulásuk után is új MI-modellek kibontakozásához vezetnek. Ezek a hatalmas, megbízható adathalmazok tették lehetővé, hogy az AlphaGenome-hoz hasonló modern modellek egyre pontosabb előrejelzéseket adjanak arra vonatkozóan, miként szabályozódnak a gének. Mindazonáltal minél mélyebb, sejtszintű és zavaró (perturbációs) adatokat szerzünk, annál pontosabbá válhatnak ezek az előrejelzések.

Számos új projekt, például az Emberi Sejtatlasz (Human Cell Atlas) vagy a Génszabályozási Megfigyelő (Gene Regulation Observatory), éppen abban segít, hogy részletesen feltérképezzük, hogyan működnek a sejtek és szövetek egészséges és beteg állapotban.

Az MI szerepe a genom szabályozásának feltárásában

Ma már vezető laboratóriumok dolgoznak azon, hogy MI segítségével megfejtsék a génszabályozás “forráskódját”. Ilyen például a Broad Intézet Epigenomika Programja, ahol kizárólag gépi tanulással elemzik, hogy a génekhez közel eső szabályozó elemek (mint a promoterek) mikor és milyen sejtdifferenciáció során aktiválódnak. A kutatók ma már a 3D-s genomstruktúra elemzésére is MI-t alkalmaznak, hogy jobban megértsék a génkifejeződést távolról irányító kapcsolatrendszereket. Mindezt azért, hogy minél többféle sejttípusban, akár mutációkkal mesterségesen megzavart genomokon is tudják tesztelni és tanítani a modelleket.


A következő lépések: még több és még részletesebb adat

Ahhoz, hogy az MI teljes kapacitását kiaknázzuk a genomika területén, új típusú, célzott adatokat kell létrehoznunk. Például nemcsak arra van szükség, hogy tudjuk, hol milyen génszabályozó fehérjék kötődnek a DNS-hez, hanem arra is, hogy a különböző variánsok és zavaró hatások (pl. betegségek) milyen folyamatokat indítanak el egy-egy sejttípusban vagy szövetben.

Fontos, hogy ezeknek az adatforrásoknak együttesen kell kiszolgálniuk az MI-modellek igényeit, hogy ne csak önálló variánsokat elemezzünk, hanem átfogó, rendszerszintű szabályokat alkothassunk a génkifejeződésről és az öröklődő betegségek hátteréről is.

Az MI a pontosabb genetikai diagnózisok kulcsa lehet

Az elérhető, egyre pontosabb adatok és a csúcskategóriás MI-modellek lehetőséget teremtenek arra, hogy a genetikai szűrések során talált, eddig megmagyarázhatatlan variánsokat is jobban megértsük. Ez segíthet a súlyos betegségek gyorsabb felismerésében és személyre szabottabb kezelésében. Az AlphaGenome-hoz hasonló rendszerek révén végre közelebb kerülhetünk egy évtizedes vitához: vajon egyedi variánsokat érdemes vizsgálni, vagy inkább átfogó MI-modellekre bízzuk a szabályok feltárását?

Mindezt figyelembe véve a genomika jövője a minél részletesebb, nyíltan hozzáférhető adatbázisokon, valamint a fejlődő mesterséges intelligencián múlik. Ha jól használjuk ezeket, teljesen új dimenziókat tárhatnak fel előttünk az emberi egészség és betegségek megértésében.

2025, adminboss, phys.org alapján


Legfrissebb posztok

Az MI lett a gyógyszerek varázspálcája: megtámadja a kezelhetetlen betegségeket

MA 23:51

Az MI lett a gyógyszerek varázspálcája: megtámadja a kezelhetetlen betegségeket

Egy újonnan kidolgozott MI-eszköz, a PepMLM forradalmasítja a gyógyszerfejlesztést azzal, hogy képes olyan betegségek fehérjéit is célba venni, amelyeket eddig lehetetlen volt gyógyszerrel kezelni. A módszer lényege, hogy...

Veszélyben van Északnyugat, jönnek a villámok és a tűzvészek

MA 23:26

Veszélyben van Északnyugat, jönnek a villámok és a tűzvészek

Az Egyesült Államok északnyugati térségében a következő évtizedekben jelentősen nőni fog a felhőből földre lecsapó villámcsapások száma, ezzel együtt pedig a villámok okozta erdőtüzek kockázata is – derül...

Az új mobiltrükk, amivel láthatatlanul visszavetnek a 4G-re

MA 23:01

Az új mobiltrükk, amivel láthatatlanul visszavetnek a 4G-re

🔑 2023 végén figyelemre méltó sebezhetőséget fedeztek fel több nagy chipgyártó, köztük a MediaTek és a Qualcomm 5G modemjeiben, amelyet 5Ghoul néven emlegetnek. A Szingapúri Műszaki és Dizájn Egyetem...

Az apró kvantumpöttyök új szintre emelik a feltörhetetlen titkosítást

MA 22:51

Az apró kvantumpöttyök új szintre emelik a feltörhetetlen titkosítást

🔒 A fizikusok egy forradalmi újítással közelebb hozták a gyakorlatban is használható, valóban biztonságos kvantumkommunikációt. Nem elhanyagolható szempont, hogy ehhez már nincs szükség tökéletes, extrém drága és bonyolult optikai...

Az univerzum első mágneses mezői gyengébbek voltak, mint gondolnánk

MA 22:26

Az univerzum első mágneses mezői gyengébbek voltak, mint gondolnánk

💫 Új számítógépes szimulációk szerint az ősrobbanás után kialakult első mágneses mezők jóval gyengébbek voltak, mint korábban gondoltuk, erejük pedig csupán az emberi agyban mérhető mágnesességgel vetekszik. Míg a...

Az MI-sztárok botrányos magánélete a Facebookon

MA 22:01

Az MI-sztárok botrányos magánélete a Facebookon

👀 Meta MI-botjai visszaéltek ismert sztárok nevével és arcával anélkül, hogy erre engedélyük lett volna, derült ki nemrég. Ezek az MI-csevegőrobotok gyakran flörtöltek a felhasználókkal, és kihívó képeket is...

Az elveszett bolygók nyomai: titokzatos foltok a Mars belsejében

MA 21:51

Az elveszett bolygók nyomai: titokzatos foltok a Mars belsejében

🚀 Több tucat rejtélyes foltot fedeztek fel a Mars belsejében a NASA InSight űrszonda által gyűjtött marsrengés-adatok elemzésével. Ezek a sűrű, eddig sosem látott struktúrák akár 4,5 milliárd évesek...

A formaldehidmentes hajkiegyenesítők is árthatnak az egészségnek

MA 21:01

A formaldehidmentes hajkiegyenesítők is árthatnak az egészségnek

Veszélyek a formaldehiden túl A formaldehidmentes hajkiegyenesítőket gyakran biztonságosabb alternatívaként hirdetik, de friss izraeli esettanulmányok alapján komoly egészségügyi kockázatot jelenthetnek a vesére nézve. Fontos kiemelni, hogy ezeknek a...

Az MI-csodacég, amely most éppen 66 billióval ér többet

MA 20:51

Az MI-csodacég, amely most éppen 66 billióval ér többet

Az Anthropic nevű MI-startup újabb óriási befektetést szerzett, miután egy 13 milliárd dolláros (kb. 4680 milliárd forintos) tőkebevonással több mint kétszeresére növelte értékét, és most már 183 milliárd...