Az új Gemini 3 tényleg varázsol: játékokat épít egy szuszra
A Google Gemini 3 végre megérkezett, és lenyűgöző teljesítményt mutat, különösen egyszerű játékok létrehozásában. A Gemini 3 Pro új mércét állít fel: 1501 Élő-ponttal vezeti az LMArena ranglistáját, és kitűnő eredményeket ér el az emberi szintű érvelést mérő teszteken is, mint például a Humanity’s Last Exam (37,5% eszközök használata nélkül) és a GPQA Diamond (91,9%).
Egy korszakváltás kezdete a játékfejlesztésben
A MagicPath fejlesztője, Pietro Schirano szerint a Gemini 3-mal teljesen új korszak kezdődik: a modell egyetlen utasítással képes 3D LEGO-szerkesztőt létrehozni. Ez hatalmas előrelépés, hiszen eddig a nagy nyelvi modellek (LLM-ek) kifejezetten rosszul teljesítettek játékok fejlesztésében. A Google által közölt tesztek is ezt igazolják: a Gemini 3 Pro 81%-ot ér el az MMMU-Pro és 87,6%-ot a Video-MMMU teszteken. A pontosság sem elhanyagolható, hiszen a SimpleQA Verified teszten 72,1%-ot ér el, vagyis tudományos és matematikai kérdésekben is megbízható megoldásokat kínál.
Miben jobb a konkurencia?
Saját tesztjeim alapján a Gemini 3 valóban lenyűgöző, de van, amiben lemarad: az utasítások pontos követésében még mindig a Claude Code vezet. Bár a Gemini 3 Pro szinte mindenben túlszárnyalja a Claude Sonnet 4.5-öt, ha pontos utasításvégrehajtás kell, vagy parancssoros feladatokban szeretnél újítani, a Claude továbbra is verhetetlen. Ám összetettebb lekérdezésekhez vagy játékfejlesztéshez mostantól érdemesebb a Gemini 3 Pro-t választani.
👀 A kutatók felfedezték, hogy mindössze egyetlen DNS-bázispár módosítása elegendő ahhoz, hogy nőstény egerek embrionális fejlődése során hím nemi szervek és herék fejlődjenek ki...
Péntek este valóban új korszak kezdődött az űrkutatásban: a NASA négy űrhajóst vitt a Hold körül, több mint 1,1 millió kilométert megtéve, majd sikeresen visszahozta őket a Csendes-óceánba, Kalifornia partjai közelében...
A hadseregek és hírszerző szervezetek egyre gyakrabban támaszkodnak mesterségesintelligencia-rendszerekre, például az információk gyorsabb feldolgozásában vagy válsághelyzetek tervezésében...
📌 Különösen igaz ez akkor, ha Amerika nyugati felét vizsgáljuk: a mai Észak-Amerika számos tájegysége nem létezne a valaha volt Farallon-lemez nélkül...
Ilyen eset például, amikor a Microsoft minden lehetséges helyre betuszkolja a Copilotot a Windows rendszerben, anélkül hogy erről a felhasználók szabadon dönthetnének...
💰 Egyetlen virális X-poszt miatt robbant fel a net: Phoebe Gates, Bill Gates és Melinda French Gates legfiatalabb lánya épp egy startupról tárgyalt egy influenszerrel...
Érdemes megvizsgálni, hogy miként sikerült az Intuit fejlesztőcsapatának néhány hónapnyi adótörvény-feldolgozást néhány órába sűríteni, miközben olyan munkafolyamatot dolgoztak ki, amelyből bármelyik szabályozott iparág profitálhat...
🛩 A légiforgalmi irányítók hiánya egyre nagyobb problémát jelent az Egyesült Államokban, ezért most a Szövetségi Légügyi Hivatal szokatlan módszerhez nyúl: kifejezetten játékosokat szólít meg új kampányában...
🚀 Péntek este látványos vízreszállással ért véget az Artemis II küldetés, amikor az Orion űrkapszula mintegy 15 perces, izzó légkörön való áthaladás után biztonságosan a Csendes-óceánba csapódott San Diego partjainál...
A digitális vagyonok világa napjainkra túllépett a kezdeti hype-on. Ami decentralizált értékátviteli kísérletként indult, mára komoly átalakulásokat ígér a tőkepiacok, letéti rendszerek, elszámolás és tulajdonjog terén...
🕵 Több kaliforniai beteg most jogi eljárást indított, mert egyes kórházak állításuk szerint bármiféle beleegyezés nélkül rögzítették a velük folytatott orvosi beszélgetéseket egy MI-alapú szoftverrel...
Egyre többet tudunk arról, hogy a mindennapi zöldségekben megtalálható zeaxantin nemcsak a látás egészségét óvja, hanem a daganatok elleni harcban is kulcsszerepet játszhat...
Mit hozott ez a nap a történelemben? A mongol hódítástól és brit koronázástól kezdve az Apollo 13 (Apollo–13) drámai startján, Idi Amin bukásán és az algíri merényleteken át egészen a szumátrai nagy földrengésekig sorakoznak a mérföldkövek...
Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...
💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...
⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...