MA 07:02

Az MI IQ-láz: emberi skálán mérik, a techvilág szétszakad

Az MI IQ-láz: emberi skálán mérik, a techvilág szétszakad
Megemlíthető továbbá, hogy évtizedeken át az IQ-teszt számított az egyik legismertebb – és egyben legvitatottabb – mérőszámnak az emberi intelligencia terén. Most pedig egy új startup, az AI IQ felrázza a mesterséges intelligencia mezőnyét: több mint 50 világelső nyelvi modellt helyez el egy klasszikus eloszlási görbén, és minden modellt egyetlen számmal, egy becsült intelligenciahányadost (IQ) rendel hozzá. Az új platform interaktív vizualizációi villámgyorsan terjedtek a közösségi médiában. A vállalati szakemberek üdvözölték az átláthatóságot, sok kutató viszont veszélyesen félrevezetőnek tartja a kezdeményezést.

Hogyan működik az MI IQ? Pontszámok, dimenziók, metodika

Az AI IQ alapját egy első pillantásra egyszerű képlet adja: 12-féle benchmarkot négy különféle gondolkodási dimenzióba sorol (absztrakt, matematikai, programozási és akadémiai). Az egyes modellek végső IQ-értékét a négy dimenzióban elért eredmények átlaga adja. Az absztrakt gondolkodást például mintafelismerési tesztek mérik, a matematikait standardizált matekfeladatok, a programozásit kódolási kihívások, míg az akadémiait tudományos kérdések. A nyers pontokat kézi kalibrációval beállított nehézségi görbék segítségével vetítik át IQ-skálára.

Fontos, hogy az AI IQ módszere óvatosan kezeli a hiányzó, bizonytalan adatokat: a modell csak akkor kap érvényes IQ-t, ha legalább két dimenzióban van eredménye, és ahol hiányosak az adatok, ott inkább lefelé korrigálják a pontszámokat, nehogy elfedjék a hiányosságokat.

Elit klub az élmezőnyben – sosem voltak ennyire közel egymáshoz a legjobb MI-k

Nem elhanyagolható tényező, hogy mára a legfejlettebb MI-modellek közötti különbség összezsugorodott. Jelenleg az OpenAI legújabb verziója vezeti a görbét, becsült IQ-ja 136, de közvetlenül mögötte található az Anthropic és a Google fejlesztése is (131–132 között). Egyes összehasonlítások szerint még szorosabb a verseny: például a Grok-4.20 Expert Mode és a GPT-5.4 Pro is 145-nél jár egy másik, Mensa-alapú rangsorban.

A középkategória is egyre izgalmasabb, főleg a kínai laborok (mint a SenseTime, Zhipu vagy a Baidu) modelljei feszes, 112–118 közötti tartományban helyezkednek el. Ez növekvő versenyhelyzetet teremt azoknak a cégeknek, amelyek nem akarnak, vagy nem tudnak mindig a drágább, elitszintű MI-re támaszkodni.

Az összesített fejlődési pálya lenyűgöző: 2023 októberétől 2026 közepéig egyes modellek becsült IQ-ja 60 ponttal nőtt alig 30 hónap alatt.

Amikor az érzelmi intelligencia lesz a döntő

A legtöbb benchmarkkal szemben az AI IQ újdonsága az „EQ” – az érzelmi intelligencia – mérése. Itt két teszteredményt (EQ-Bench és Arena Elo) dolgoznak össze. Az EQ-eredmények gyakran teljesen más sorrendet adnak, mint az IQ-alapú ranglista: például az Anthropic egyik modellje közel 132-es EQ-t ér el, míg az OpenAI változatai némileg lemaradnak ezen a területen. Így kiderül, hogy a legokosabb MI-k nem feltétlenül a legempatikusabbak.

Szokatlan lépés, hogy az EQ-t többek közt egy Anthropic-modell minősíti, ezért az összes Anthropic-fejlesztéshez mínusz 200 Elo-pontot adnak korrekcióként. Az emberi zsűrit alkalmazó résznél ilyen torzítás nincs, így összességében reálisabb a kép.


Teljesítmény kontra ár: Megéri a legnagyobb MI-re költeni?

Az egyik leghasznosabb vizualizáció a költséghatékonysági ábra: itt az egyes modellek becsült IQ-ját az effektív árral (egy 2 millió input- és 1 millió output-tokenes feladat költségével) ábrázolják.

Jól látható, hogy a legtöbb esetben nem éri meg mindig a csúcskategóriára költeni. Egyetlen feladat költsége a GPT-5.5 vagy az Opus 4.7 esetében már 10 800–18 000 forint is lehet, de középkategóriában 360–1800 forintos költséggel is találni megfelelő teljesítményű MI-t. Egy nyílt forráskódú modell már 72 forintért is elérhető lehet, igaz, alacsonyabb, 107 körüli IQ-ért.

A háromdimenziós grafikon (IQ, EQ, ár) átláthatóvá teszi, melyik modell kínál kiegyensúlyozott, minden szempontból optimális kompromisszumot.

Az MI IQ-kritika: veszélyes leegyszerűsítés vagy piaci áttörés?

A legnagyobb vita az MI IQ körül, hogy egyetlen számmal veszélyesen leegyszerűsíti az egyes modellek rendkívül „cakkos”, hullámzó képességeit. Vannak modellek, amelyek egyes területeken kitűnően teljesítenek, máshol teljesen elbuknak. Egy összesített pontszám könnyen elfedheti ezeket az ellentmondásokat.

Többen sérelmezik azt is, hogy az AI IQ módszertana, kalibrációs görbéi nem teljesen nyilvánosak, pedig a kutatói közeg átlátható, újraellenőrizhető módszertanokat kedvel. Megjegyzendő, hogy a Mensa-stílusú, emberek számára készült IQ-tesztek is legfeljebb az absztrakt minták felismerésére koncentrálnak, szemben az AI IQ átfogóbb, programozási, matematikai, tudományos mérésével.

A lényeg: Egyre közelebb egymáshoz a modellek

Ma több mint 50 élvonalbeli MI-modell közül választhatnak a cégek. Mindegyik fejlesztő saját kedvenc mérőszámait használja, ami egyre átláthatatlanabbá teszi az összehasonlítást. Az AI IQ által használt megközelítés nem tökéletes – részben átláthatatlan, néhol torzíthat –, mégis kevésbé kaotikus, mint a szétaprózott, nem összevethető adathalmaz.

Az MI IQ legnagyobb tanulsága talán nem is egy konkrét győztes modell, hanem a piac változása: már nemcsak az számít, melyik az „okosabb” gép, hanem az, mennyire ügyesen tudunk a célhoz legjobban illeszkedő MI-t választani. Ez az intelligencia egy új szintje. És erre egyelőre nincs mérőszám.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 08:56

Az Anthropic visszahozza az OpenClaw-t és a külső ügynököket – de komoly kikötésekkel

🔔 Többek között izgalmas bejelentés rázta meg az MI-fejlesztők világát: ismét lehetőség van az OpenClaw és más, harmadik féltől származó autonóm MI-ügynökök használatára az Anthropic népszerű Claude-előfizetéseinek keretében...

MA 08:46

A 395 ezer dollárnyi bitcoin visszatér: Claude kiszabadítja a gép fogságából

🔑 Majdnem 140 millió forint értékű bitcoin ragadt egy régi számítógépen, de egy váratlan fordulat mindent megváltoztatott...

MA 08:37

A legfejlettebb MI nemcsak töröl, át is ír – és észrevétlenül hibázik

💡 Ahogy a nagy nyelvi modellek egyre okosabbá válnak, egyre többen bízzák rájuk tudásalapú feladatok elvégzését: a gép átnézi, rendszerezi, szerkeszti a dokumentumokat, majd leteszi elénk a kész eredményt...

MA 08:29

A mindennapi kávé 35%-kal csökkentheti a demencia esélyét

Amerikai kutatók több mint 130 000 egészségügyi dolgozót követtek 43 éven át, hogy felmérjék a kávé és tea hosszú távú hatásait az agy egészségére...

MA 08:19

A Warhammer 40,000: Mechanicus 2 jövő héten, a leleplezésekkel teli Skullson debütál

🥂 Erre utal többek között az, hogy a legendás Warhammer Skulls rendezvény idén nemcsak visszahozza a már megszokott izgalmakat, hanem váratlan meglepetéssel is szolgál: a nagy sikerű, körökre osztott taktikai játék, a Warhammer 40,000: Mechanicus 2 már május 21-én, a Skulls eseményén megjelenik...

MA 08:02

Az eddigi legnagyobb és legerősebb Starship indítására készül a SpaceX

🚀 Az űrhajózás történetében ritkán születik akkora izgalom, mint amikor egy vadonatúj, gigászi rakéta készül elhagyni a Földet...

MA 07:46

A Metaplanet halasztja az elsőbbségi részvények tőzsdei debütálását Japánban

A Metaplanet, amely Japán legnagyobb vállalati bitcoin-tulajdonosa és világviszonylatban is a harmadik legnagyobb bitcoin-vagyonkezelő, kénytelen elhalasztani a tervezett Mars és Mercury nevű örökjáradékos preferált részvényeinek tőzsdei bevezetését...

MA 07:38

Az óriás Sony 200–600 G OSS: csoda vagy kompromisszum?

📷 Különösen említést érdemel, hogy a Sony FE 200–600mm f/5.6–6.3 G OSS objektív új szintre emeli a természetfotózást: ha korábban akadály volt a nagy távolság vagy a váratlan mozgás, ezzel az objektívvel minden esélyed megnő az akció tökéletes elkapására...

MA 07:29

A Homo erectus genetikai anyagát először szekvenálták: mély genetikai kapcsolat velünk

🔬 Lényeges, hogy a 400 ezer éves Homo erectus-maradványok elemzése forradalmi áttörést hozott – most először sikerült genetikai anyagot szekvenálni ebből a fajból...

MA 07:19

A gondolkodók játéka: Connections – lásd meg a rejtett kapcsolatokat

Ha szereted a kihívásokat, a Connections nevű szókirakó minden nap új fejtörőt készít neked...

MA 07:10

A Consensys visszakozik: őszre tolódik a tőzsdei debütálás

Felmerül a kérdés, hogy mikor léphet végre tőzsdére a kriptovilág egyik legismertebb szereplője, hiszen a Consensys, a Joe Lubin vezetésével működő Ethereum-alkalmazásfejlesztő vállalat ismét elhalasztotta az amerikai tőzsdére lépését...

MA 06:56

Az Alpenglow új korszakot nyithat: már tesztelhető a Solanán

🌅 A Solana hálózat történelmének legnagyobb változása érkezett el az új Alpenglow-frissítéssel, amely mostantól tesztelhető a közösségi teszthálózaton...

MA 06:46

A neandervölgyiek már fogorvoskodtak: 60 ezer éves, fúrt fog Szibériából

Nemcsak az emberiség legkorábbi egészségügyi beavatkozásának, hanem az első, szinte modernnek mondható fogászati kezelésnek a nyomait is felfedezték Szibériában, egy Neander-völgyi ősember hátrahagyott fogán...

MA 06:29

A hadiipar rémálma: ukrán dróngyilkos lézer fillérekből, három mérföldről

Az ukrán Celebra Tech új fejlesztése, a Trident névre keresztelt lézerfegyver forradalmi áttörést ígér a modern hadviselésben...

MA 06:20

Az USA egyre védtelenebb a járványokkal szemben – ki védi az amerikaiakat?

Egy újonnan felbukkant hantavírusos megbetegedés az amerikai közegészségügy védelmi rendszereinek gyengeségeire világított rá...

MA 06:05

Történelmi események a mai napon (Május 14.)

Válogatás a történelem májusi napjának nagy pillanataiból: királygyilkosságok, forradalmi csaták és államalapítások formálták Európát és a világpolitikát...

MA 06:02

A légszennyezés súlyosbíthatja a depressziót és szorongást – kutatások szerint

A világ egyre több pontján derül ki, hogy a szennyezett levegő nemcsak a testnek, hanem az elmének is árt...

szerda 21:56

A tudósok végre megfejtették az abroncsok százéves rejtélyét

A mindennapok egyik legfontosabb anyaga a megerősített gumi, amelynek köszönhetően az autó- és repülőgépgumik elviselik a hatalmas terhelést, ráadásul megtalálható ipari gépekben, egészségügyi eszközökben, sőt, a kerti locsolótömlőkben is...

szerda 21:45

Az MI költözik a kurzor mögé – kell ez nekünk?

🧠 A jól megszokott egérkurzor az évtizedek alatt alig változott, mégis tökéletesen működik – legalábbis eddig így hittük...

szerda 20:22

A telekomóriás KDDI 14,9%-ot vesz a Coincheck Groupban, 65 millió dollárért

💰 A japán KDDI 14,9%-os részesedést szerez a Coincheck Groupban, miután 65 millió dollárért – közel 23,2 milliárd forintért – 28,5 millió új részvényt vásárol részvényenként 2,28 dolláros (kb...

szerda 19:56

Az iPhone Ultra lehet a meglepetéssiker: milliók vennének hajlítható iPhone-t

📱 Az Apple hamarosan piacra dobhatja első hajlítható iPhone modelljét, amit iPhone Ultra néven emlegetnek, és úgy tűnik, ezzel új fejezetet nyithat a mobiltechnológiában...

szerda 19:45

A Surfshark Alternative ID felturbózza az Android 17 hívásvédelmét

📱 Az Android 17 hívószám-hamisítás elleni védelme (Spoofing Protection) váratlanul hasznosnak bizonyul: képes felismerni a csalókat és megszakítani a hívásaikat, még mielőtt megszereznék az érzékeny adatokat...

szerda 19:34

A jégkorszak után 500 évvel korábban tértek vissza Britanniába, mint hittük

🦾 Több mint 15 000 évvel ezelőtt, az utolsó nagy jégkorszak után az emberek a korábban véltnél jóval előbb tértek vissza a brit szigetekre...

szerda 19:23

A bitcoin az aranyhoz képest még mindig 26%-kal alulértékelt

Az elmúlt években a piacok régóta birkóznak azzal, hogyan értelmezzék a bitcoint: részvény helyett inkább kockázatos vagyontárgynak tartják, amely felfelé repül, ha bő a likviditás, és zuhanni kezd, ha eluralkodik a védekező hangulat...

szerda 19:12

Német 1,5 millió dollár a Steam Deck asztali környezetére – vége a kémprogramoknak

Tipikus eset, amikor a nyílt forráskódú közösség jelentős elismerésben részesül. Németország Szuverén Technológiai Alapja (Sovereign Tech Fund) 1,3 millió euróval (kb...

szerda 19:01

A BioShock legendás nyitányainak titka: Ken Levine hitvallása

A játékvilágban az első benyomás kíméletlenül dönthet sorsokról. A BioShock-sorozat ennek ékes példája: már az első percek beszippantanak, elég csak Rapture városába alászállni, miközben Andrew Ryan szónokol a szabadságról és a kemény munkáról...

szerda 18:56

A bitcoinban hívők száma 300%-kal ugrott, a friss vevők nyerőben

2025 vége óta soha nem látott mértékben nőtt a bitcoin hosszú távú tulajdonosainak száma...

szerda 18:44

A Halley-üstökös talán rossz emberről kapta a nevét

🚀 A híres üstököst, amelyet ma Halley-üstökös néven ismerünk, évszázadokkal Edmond Halley előtt már ismétlődő égi jelenségként ismerhették fel...

szerda 17:01

A Trump–Hszi-csúcs árnyékában is 81 ezer dollár alatt a Bitcoin

💰 Noha az elmúlt időszakban a pénzügyi piacok gyakran kilengtek a geopolitikai események hatására, az utóbbi napokban a legnagyobb kriptovaluta szinte mozdulatlanul őrzi értékét...