A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak

A hatalmas biológiai adatbázisok mostantól mesterséges intelligenciával dolgoznak
A biológiai kutatás forradalmát éljük: a hatalmas, éveken át gyűjtött genomikai adatbázisok most a legújabb mesterséges intelligencia modellek alapját adják. Ennek legfrissebb példája a Google DeepMind új fejlesztése, az AlphaGenome, amely egyedülálló módon igyekszik megjósolni, hogy a genetikai variánsok miként befolyásolják azt, mikor, hol és hogyan kapcsolódnak be a gének szervezetünkben. Ez a modell túlmutat az AlphaFold (AlfaHajtogatás) sikerein, amely a fehérjék hajtogatódását, szerkezetét vizsgálja: az AlphaGenome (AlfaGenom) már az örökítőanyag szabályozását próbálja feltérképezni.

A genom nyelvének feltörése

A gépi tanulási modelleket szerteágazó, óriási mennyiségű adattal táplálják: két emblematikus forrás az ENCODE (A DNS-elemek enciklopédiája – Encyclopedia of DNA Elements) és a GTEx (Genotípus–szövet expresszió – Genotype-Tissue Expression) projekt, amelyek maguk is áttörést hoztak a humán genom megértésében. Az ENCODE célja eredetileg az volt, hogy feltérképezze, pontosan mely szakaszai “működnek” genomunknak: 20%-ukról már tudjuk, hogy szabályozó vagy egyéb biológiai funkcióval rendelkeznek, szemben a korábban “szemét-DNS”-nek hitt nagy többséggel. Lényeges, hogy ezek a régiók döntő szerepet játszhatnak abban, hogyan alakulnak ki betegségek, hiszen a genetikai eltérések többsége éppen itt található.

A GTEx erre az alapra épített – egyre több olyan génvariánst találtak, amelynek nem ismerték a szerepét, hiszen nem a kódoló génekben fordultak elő, hanem az ismeretlen tartományokban. Ezért kezdte el a projekt feltérképezni, hogy egyes variánsok hogyan befolyásolják a génkifejeződést különböző szövetekben vagy sejttípusokban, vagyis működésbe lépnek-e, aktívak maradnak-e vagy éppen lezáródnak.

Az adatkincsek továbbfejlesztik az MI-t

Az ENCODE és a GTEx szabadon hozzáférhető, közösségi adatbázisokként születtek, amelyek immár évtizedekkel az indulásuk után is új MI-modellek kibontakozásához vezetnek. Ezek a hatalmas, megbízható adathalmazok tették lehetővé, hogy az AlphaGenome-hoz hasonló modern modellek egyre pontosabb előrejelzéseket adjanak arra vonatkozóan, miként szabályozódnak a gének. Mindazonáltal minél mélyebb, sejtszintű és zavaró (perturbációs) adatokat szerzünk, annál pontosabbá válhatnak ezek az előrejelzések.

Számos új projekt, például az Emberi Sejtatlasz (Human Cell Atlas) vagy a Génszabályozási Megfigyelő (Gene Regulation Observatory), éppen abban segít, hogy részletesen feltérképezzük, hogyan működnek a sejtek és szövetek egészséges és beteg állapotban.

Az MI szerepe a genom szabályozásának feltárásában

Ma már vezető laboratóriumok dolgoznak azon, hogy MI segítségével megfejtsék a génszabályozás “forráskódját”. Ilyen például a Broad Intézet Epigenomika Programja, ahol kizárólag gépi tanulással elemzik, hogy a génekhez közel eső szabályozó elemek (mint a promoterek) mikor és milyen sejtdifferenciáció során aktiválódnak. A kutatók ma már a 3D-s genomstruktúra elemzésére is MI-t alkalmaznak, hogy jobban megértsék a génkifejeződést távolról irányító kapcsolatrendszereket. Mindezt azért, hogy minél többféle sejttípusban, akár mutációkkal mesterségesen megzavart genomokon is tudják tesztelni és tanítani a modelleket.


A következő lépések: még több és még részletesebb adat

Ahhoz, hogy az MI teljes kapacitását kiaknázzuk a genomika területén, új típusú, célzott adatokat kell létrehoznunk. Például nemcsak arra van szükség, hogy tudjuk, hol milyen génszabályozó fehérjék kötődnek a DNS-hez, hanem arra is, hogy a különböző variánsok és zavaró hatások (pl. betegségek) milyen folyamatokat indítanak el egy-egy sejttípusban vagy szövetben.

Fontos, hogy ezeknek az adatforrásoknak együttesen kell kiszolgálniuk az MI-modellek igényeit, hogy ne csak önálló variánsokat elemezzünk, hanem átfogó, rendszerszintű szabályokat alkothassunk a génkifejeződésről és az öröklődő betegségek hátteréről is.

Az MI a pontosabb genetikai diagnózisok kulcsa lehet

Az elérhető, egyre pontosabb adatok és a csúcskategóriás MI-modellek lehetőséget teremtenek arra, hogy a genetikai szűrések során talált, eddig megmagyarázhatatlan variánsokat is jobban megértsük. Ez segíthet a súlyos betegségek gyorsabb felismerésében és személyre szabottabb kezelésében. Az AlphaGenome-hoz hasonló rendszerek révén végre közelebb kerülhetünk egy évtizedes vitához: vajon egyedi variánsokat érdemes vizsgálni, vagy inkább átfogó MI-modellekre bízzuk a szabályok feltárását?

Mindezt figyelembe véve a genomika jövője a minél részletesebb, nyíltan hozzáférhető adatbázisokon, valamint a fejlődő mesterséges intelligencián múlik. Ha jól használjuk ezeket, teljesen új dimenziókat tárhatnak fel előttünk az emberi egészség és betegségek megértésében.

2025, adminboss, phys.org alapján

Legfrissebb posztok

MA 20:48

A Spotifyt is támadás érte: ellopták óriási zeneadatbázisát

A Spotify könyvtárát radikális, szerzői jogot sértő aktivisták teljes egészében letöltötték: összesen 256 millió sor zenei metaadatot és 86 millió audiofájlt szereztek meg, mintegy 300 TB terjedelemben...

MA 20:33

A táplálkozásunkon múlik, mennyire veszélyes a nanoműanyag

Az elmúlt években egyre nyilvánvalóbbá vált, hogy a műanyagok nem maradnak érintetlenek: apró, végül nanoszkopikus részecskékre esnek szét, amelyek már a csapvízben és szinte minden, műanyagba csomagolt ételben jelen vannak...

MA 20:17

Az álommeló korszaka lejárt: már nem menő a tech

💼 Az Apple tavaly novemberben váratlanul elbocsátásokat jelentett be, ami meglepte a dolgozókat, különösen azokat, akik évtizedek óta a cégnél dolgoztak...

MA 20:03

Az Ark EL íróasztal: stílusforradalom vagy giccsparádé?

A home office berendezésében mindenki szeretné megtalálni azt a bútordarabot, amely egyszerre mutatós és funkcionális, ugyanakkor elég strapabíró is, hogy bírja a mindennapi használatot...

MA 19:50

Az evolúció bajnokai: hogyan diadalmaskodtak az önfeláldozó hangyák?

A hangyák világa legalább annyira izgalmas, mint egy népszerű sci-fi, hiszen ezek az apró rovarok – amelyek akár néhány tucatnyi, de akár többmilliós kolóniákban is élhetnek – sikerüket nem az egyének erejének, hanem a számosságnak és a közösség hatékonyságának köszönhetik...

MA 19:34

A HPE súlyos sérülékenysége miatt azonnal frissítsen mindenki

⚠ A HPE OneView rendszerében felfedezett, maximális súlyosságú sebezhetőség súlyos gondokat okozhat a cégeknek, ha nem lépnek időben...

MA 19:16

Az Amazon-üzlet bukása pecsételte meg az iRobot sorsát

Colin Angle, az iRobot alapítója a cégét a nappalijából indította, és több mint 35 éven át építette, miközben 50 milliónál is több Roomba robotporszívót adott el világszerte...

MA 19:04

Az apák fittsége formálja a gyerekek jövőjét? A sperma-RNS a kulcs

Nem csak az anya, hanem az apa életmódja is – étrendje, testmozgása, stresszszintje, nikotinhasználata – képes hatni a születendő gyermekekre, méghozzá nem kizárólag genetikai úton...

MA 18:49

Az egyetem, ahol 3,5 millióan lettek adatlopás áldozatai

🔒 Majdnem 3,5 millió jelenlegi és volt hallgató, alkalmazott és beszállító adata szivárgott ki, miután a hírhedt Clop zsarolóvírus-csoport behatolt a Phoenix Egyetem (University of Phoenix) rendszerébe augusztusban...

MA 18:33

Az egészség titka: sejtjeink így zárják ki a szabadgyököket

🧠 A svédországi Lund Egyetem kutatói először rögzítették azt a pillanatot, amikor egy sejt képes lezárni a membránjában futó csatornákat, hogy megvédje magát a káros szabadgyököktől...

MA 18:17

Az olaszok lecsaptak az Apple-re: gigabírság az App Store miatt

Az olasz versenyhatóság közel 99 millió eurós, azaz mintegy 38 milliárd forintos bírságot szabott ki az Apple-re, mert visszaélt a piaci fölényével az App Store-ban...

MA 17:49

A Samsung beelőzi az összecsukható iPhone-t: érkezik az új kihívó

Az Apple hajlítható iPhone-ját még be sem jelentették, de a Samsung máris egy újabb versenytárs fejlesztésén dolgozik...

MA 17:18

Az iRobot Roomba megmenekült: minden marad a régiben

🚽 A Roomba porszívók tulajdonosai aggódva figyelték a fejleményeket, miután a gyártó iRobot csődeljárása során a kínai Picea kezébe került...

MA 17:02

Az ukrán hacker bukása: súlyos csapás a Nefilim zsarolóbandára

🔒 Egy 35 éves ukrán férfi, Artem Alekszandrovics Sztrizsak beismerte, hogy részt vett a Nefilim nevű zsarolóvírus-banda támadásaiban, amelyek főként nagy bevételű amerikai, norvég, francia, svájci, német és holland vállalatokat céloztak...

MA 16:49

Az Xbox válságban? Közeleg a forradalmi átalakulás

A Microsoftnál az utóbbi időben tömeges elbocsátások és stúdióbezárások rázták meg az Xbox-részleget, többen már le is írták a konzolt...

MA 16:34

Az új RAM-átverések tarolnak – így védekezz ellenük

Érdekes jelenség, hogy a dráguló rendszermemóriák miatt egyre gyakoribbak a RAM körüli csalások...

MA 16:17

Az NHS egyik kulcsbeszállítóját súlyos zsarolóvírus-támadás érte

💉 Anglia Nemzeti Egészségügyi Szolgálatának (NHS) egyik kulcsfontosságú technológiai beszállítója, a DXS International december közepén zsarolóvírus-támadást szenvedett el...

MA 16:03

A tengeri rózsa ősi titka: az állati sejttípusok eredete

🐬 Minden állat testében azonos a genetikai állomány, mégis rendkívül változatos sejttípusok és szövetek alakulnak ki...

MA 15:34

Az új ChatGPT-arcok: vállalati robot vagy zabolátlan haver?

🤖 A karácsony előtti fejlesztéshullám a ChatGPT-nél idén is folytatódik. Az OpenAI bevezette a vadonatúj személyiségbeállításokat, amelyeket a Characteristics menüpont alatt érhetsz el...