2026. 06. 09., 06:46

A Harness-1 lenyomja a GPT-5.4-et, és nem felejt

Egy lényeges szempont, hogy a fejlett MI-alapú keresőügynökök csak addig tűnnek félelmetesen hatékonynak, amíg nem kell összetett, mély összefüggéseket keresniük óriási dokumentumtömegekben. Míg a régi rendszerek folyton elfelejtették, mit kutattak éppen, a most bemutatott Harness-1 teljesen új szemléletet hoz ebbe a zsákutcába taszított fejlesztési irányba: végre nem az MI-nek kell minden apró részletet fejben tartania, hanem egy okosabb környezetre bízhatja az unalmas „adminisztrációt”.

Lenyomta a nagyokat, mégis kicsi és nyitott

Tipikus eset, amikor egy úttörő technológia kis mérettel, de forradalmi szemlélettel nagyokat előz le. A Harness-1 20 milliárd paraméterrel működik, vagyis töredéke a hatalmas, százmilliárdokat mozgató konkurenseknek, mégis több mint 73%-os pontossággal idézi fel a keresett információkat egy gondosan válogatott adathalmazon. Ez nemcsak az eddigi legpontosabb nyílt forráskódú keresőügynököt körözi le 11 százalékponttal, hanem az irdatlanul drága, óriási GPT-5.4-et (70,9%) is maga mögé utasítja. Egyedül az Opus-4.6 nagyvállalati óriásmodell ér el nála csekély mértékben magasabb átlagos eredményt.

A kutatók teljesen nyílt, Apache 2.0 licenc alatt tették elérhetővé a Harness-1-et, vagyis szabadon felhasználható, módosítható, üzleti célra is bevethető.

Miért volt eddig kudarc a kereső MI-k többsége?

Az MI-vel támogatott keresőügynökök sokáig úgy működtek, mintha egy zárkózott kutatósegédet ültettünk volna egy üres szobába, iratok nélkül, és elvártuk volna, hogy fejből, hibátlanul jegyezzen meg minden hivatkozást, mondattöredéket, elvetett fonalat. Nincs az a zseni, aki ebbe hosszú távon ne fáradna bele, főleg, ha a kutató folyamatosan bővülő jegyzeteiben elveszik.

Korábbi MI-modelleknél ezért próbálták meg erőből felszámolni az úgynevezett „keresési amnézia” problémát: a modellt arra kényszerítették, hogy minden olvasását, döntését beírja egy egyre növekvő jegyzettömbbe (kontextusablakba), hogy mindig vissza tudjon keresni, mit csinált eddig. Ez az irgalmatlan adattorlódás lassú, drága és gyakran eredménytelen volt. A modellek túl sokat „emésztettek”, nem eleget „kutattak”. Ez a fő oka annak, hogy az MI-alapú keresés komoly vállalati igényeknél rendre elvérzett.

Áttörés: a „harness” rendszer és az igazi autonóm keresés

A Harness-1 paradigmaváltás lényege, hogy átadja ezt az unalmas, de kulcsfontosságú adminisztrációt egy külső szoftveres környezetnek – tipikusan egy adatbázisszerű „harness”-nek (magyarul: keretnek vagy hevedernek), amely önállóan végzi a rendszerezést, a dokumentumok címkézését, az állítások igazolását és a találatok fontossági sorba állítását. A modell innentől csak azzal foglalkozik, amiben igazán jó: keres, dönt, szelektál, és eldönti, mikor kell továbblépni. Az MI dolgozik, a papírmunkát egy digitális titkárság végzi.

A tréning is merőben eltér a korábbiaktól: a rendszer nem maga próbált ki minden keresést, hanem egy már meglévő GPT-5.4 „tanár” segítségével mutattak példát arra, hogyan kell egy ilyen strukturált, jól szervezett keresési folyamatot vezetni. Az első, felügyelt finomhangolási körhöz csupán 899 keresési folyamatot készítettek, melyeket követett egy 3453 példányos megerősítéses tanulási szakasz. Ezer dokumentumnál kevesebb is elegendő volt, mert maga a keret végzi a tényleges adminisztrációt, az MI pedig csak a lényegi döntéseket igazítja hozzá. Más, konkurens rendszerekhez képest ez az adatigény minimális.

Miért csoda ez cégeknek és fejlesztőknek?

A Harness-1 nemcsak a keresési pontosságban, de költségben és gyorsaságban is veri a nagyokat. Mivel a kontextust a keret szelektíven, tervszerűen menedzseli, nem eszik feleslegesen tokeneket (és így forinttízezreket) feldolgozandó karakterekre, mint a legtöbb hosszú távú MI-feladatnál szokott, hanem olcsón, gyorsan fut. Ez rengeteg lehetséges alkalmazási területet nyit meg a vállalati adattárolástól az intelligens belső keresésen át a vállalati jelentések feldolgozásáig.

A Harness-1 bizonyítja, hogy elegendő egy okosabb működési közeg az MI köré, nem pedig egyre nagyobb, drágább modellek. Egyetlen megkötés: a licenc megköveteli az eredeti szerzők feltüntetését és a módosítások kiemelését – de ezt leszámítva bármilyen üzleti célra szabadon használható.

Fejlesztői tapasztalat: végre nem felejt az MI

Az új ügynökrendszer fejlesztésének híre gyorsan körbejárta a szakmát. A Harness-1 kirobbanó sikert aratott a programozók és adattudósok körében, akik végre egy olyan eszközt kaptak, amely nem felejti el az utasításokat a keresési folyamat közepén, nem veszik el a friss információkban, hanem szisztematikusan, átláthatóan kezeli az egész keresési folyamatot. Ez különösen fontos, amikor az MI-nek bonyolult, többlépéses kérdésekben kell naprakész, igazolt válaszokat találnia.

Az MI-k jövője – mint az évek óta csak tuningolt óriásmodellek döbbenetesen drága kudarcai mutatják – nem feltétlenül a paraméterszám bővítésében rejlik. A Harness-1 példája azt bizonyítja, hogy egy okosabb „asztal” biztosítása, egy jól szervezett adminisztráció lényegesen hatásosabb és költséghatékonyabb, mint egy irdatlanul nagy agy felesleges hajszolása. A jövő MI-ügynökei okos keretek között dolgoznak majd, nem pusztán saját „fejükre” – így a kisebb, szorgalmas rendszerek is könnyedén lekörözhetik az amúgy súlyos „óriásokat”.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

Tudomány

MA 09:49

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

💨 A Microsoft károsanyag-kibocsátása tavaly 25%-kal nőtt, ami főleg az adatközpontok gyors terjeszkedésének köszönhető...

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

MI Hírek

MA 09:37

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

📱 A Google ismét újat mutat a Pixel okostelefonok világában – mostantól az eszközökön futó mesterséges intelligencia még erősebbé teszi a mobilokat, úgy, hogy közben védi a felhasználók adatait...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás egyszerű és gyors megoldást kínál két dátum közötti napok kiszámítására...

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Színes

MA 09:01

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Az Észak-Minnesotában pusztító erdőtüzek füstje hamarosan elérheti az Egyesült Államok északkeleti nagyvárosait, többek között Detroitot, Milwaukee-t, Clevelandet, Philadelphiát és New Yorkot...

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

Tudomány

MA 08:49

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

A Minnesotai Egyetem laboratóriumában újszerű biológiai eredmény született: egy aprócska SpudCell nevű képződmény képes táplálkozni, növekedni, versengeni, osztódni és lemásolni önmagát – vagyis szinte mindent tud, amit egy élő sejt is...

MI Hírek

MA 08:36

Az új Google Képek Pinterest-szerű, felfedezésre kihegyezett átalakítást kapott

A Google Képek (Google Images) megújult külsőt kapott: mostantól személyre szabott galériákat kínál a felhasználóknak, így még könnyebben fedezhetik fel az őket érdeklő képeket...

MI Hírek

MA 08:12

A Google DeepMind az USA-t tenné az MI-szabványok élére

A Google DeepMind vezére, Demis Hassabis szerint az új generációs mesterséges intelligencia egyre komolyabb veszélyeket rejt magában, például a kiberbiztonság és a biológiai fenyegetések terén...

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

Tudomány

MA 08:01

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

💊 Fontos kérdés, hogy meg lehet-e állítani vagy lassítani az Alzheimer-kór lefolyását, hiszen a demencia legfőbb oka, az Alzheimer-kór, világszerte rengeteg embert érint...

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

Tudomány

MA 07:49

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

🚀 Sikeresen megérkezett kedden a Nemzetközi Űrállomásra egy amerikai–orosz személyzet, miután a kazahsztáni Bajkonurból indultak a Roszkoszmosz által üzemeltetett Szojuz MS-29 fedélzetén...

Tudomány

MA 07:37

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

🔒 Az informatika egyik legfontosabb biztonsági eleme, a Secure Boot, már csaknem tíz éve lényegében védtelenné vált – és ezt eddig senki sem vette észre...

A csípős paprika növelheti egy halálos rák kockázatát?

Tudomány

MA 07:24

A csípős paprika növelheti egy halálos rák kockázatát?

Bár a csípős paprika számos kultúra elválaszthatatlan része, és egyes laboratóriumi kísérletek a bennük található vegyületeket, például a kapszaicint gyulladáscsökkentőnek vagy akár daganatellenesnek mutatják, az utóbbi évek humán kutatásai nem ennyire egyértelműek...

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Tudomány

MA 07:02

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Április 6-án négy űrhajós indult el az Artemis II misszió keretében az Orion űrhajóval, és körülbelül 40 percig teljesen eltűntek a Föld látóteréből...

Színes

MA 06:38

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

🔧 Szinte példátlanul nagy frissítési csomagot adott ki a Microsoft a 2026...

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

MI Hírek

MA 06:25

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

💼 Májusban a Meta megvált dolgozóinak 10 százalékától, közel 8 000 alkalmazottat küldött el, ami jelentős átszervezéssel járt a vállalat MI-re és adatközpontokra irányuló fejlesztései miatt...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 15.)

Időutazás egyetlen napon: Jeruzsálem falainak áttörésétől 🏰 a Rosetta-kő 🗿 megtalálásán és Napoleon 🚢 megadásán át a Grunwaldnál vívott döntő ütközetig ⚔️, sőt a modern korszakban a törökországi puccskísérletig 🇹🇷 és a Mozilla alapításáig 🦊...

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tudomány

kedd 18:31

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tipikus eset, amikor egy ismert gyógyszer egészen váratlan előnyöket kínál. A GLP-1 típusú szerek, mint az Ozempic, a Wegovy vagy a Rybelsus, eredetileg a fogyás, a jobb vércukorszint-szabályozás és a szívbetegségek kockázatának csökkentése miatt váltak népszerűvé...

Tudomány

kedd 17:30

Az indiai tudósok megalkották az emberi agytörzs eddigi legrészletesebb 3D-atlaszát

Indiai kutatók a világ eddigi legrészletesebb, háromdimenziós agytörzs-atlaszát hozták létre, amelyben MRI-felvételeket több mint 500 mikroszkópos szövetrészlettel kapcsoltak össze...

Tudomány

kedd 17:01

A Tejútrendszer mélyén cukrot találtak a kutatók

Többek között különleges eredményre jutottak a kutatók: a Tejútrendszer középpontjához közel egy óriási gázfelhőben felfedeztek egy ritka cukorfélét, az eritrózt, amely nemcsak málnában, hanem barnító krémekben is megtalálható...

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Kriptó

kedd 16:01

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Ami kezdetben ártalmatlannak tűnt, végül az IBM történetének egyik legsötétebb napjához vezetett a tőzsdén...

A NASA Perseverance-je célba ért: megvan a marsi maraton

Tudomány

kedd 15:01

A NASA Perseverance-je célba ért: megvan a marsi maraton

🚀 Történelmi teljesítmény született a Marson: a Perseverance marsjáró öt év és négy hónap után elérte a 42,195 kilométeres maratoni távot...

Színes

kedd 12:01

A régi T‑Mobile-csomagoknak vége: kényszerváltás már ezen a héten

Ami kezdetben ártalmatlannak tűnt, most minden régi T-Mobile-előfizető számára valódi változás: a társaság e héttől kezdve automatikusan átsorolja a 10–15 éves tarifákat – például a Simple Choice, T-Mobile One, One Plus, a Magenta családhoz tartozó, valamint a Sprintből áthozott régi csomagokat – modernebb tarifákra...

Az inflációs adat előtt megroggyan a Bitcoin

Kriptó

kedd 11:31

Az inflációs adat előtt megroggyan a Bitcoin

A legnagyobb kriptovaluták teljesítménye az elmúlt 24 órában jelentősen visszaesett, miután egyre többen valószínűsítik, hogy az amerikai jegybank akár már júliusban kamatemelés mellett dönt...

Színes

kedd 11:02

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Az elmúlt pár évben váratlan fordulat történt a fotózás világában: a fiatal generáció újra felfedezte a filmes fényképezőgépeket...

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

MI Hírek

kedd 10:49

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

🤔 A mesterséges intelligencia kutatása 75 éve követi Alan Turing útmutatását, aki két alapvető feltételezést tett: az intelligencia létrehozható szoftverből, függetlenül a testtől, és hogy egy gép intelligensnek számít, ha sikerrel utánozni tudja az embert, például egy beszélgetés során...

Az MI átírja a marketinget: a régi szabályoknak befellegzett

MI Hírek

kedd 10:37

Az MI átírja a marketinget: a régi szabályoknak befellegzett

💡 A Fortune 500 cégek vezető marketingesei kénytelenek szembenézni azzal a ténnyel, hogy a korábbi, jól bevált módszerek egyszerűen elavultak...

Színes

kedd 10:25

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

🚀 A legújabb Google System-frissítés idén nyáron ismét ráncfelvarrást hoz az Android-felhasználóknak...

Színes

kedd 10:01

Végre itt a hideg vízzel elkészíthető Cup Noodles!

🍹 Lényeges szempont, hogy az instant tészták villámgyors megoldást kínálnak, legyen szó egyetemista vacsoráról vagy gyors munkahelyi ebédről...

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

Színes

kedd 09:48

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

A Google a Pixel telefonokon jelentősen megkönnyíti a csengőhangok, az ébresztők és az értesítések hangerejének szabályozását...

Színes

kedd 09:37

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Felmerül a kérdés, hogy mi történik egy nagyvállalattal, ha leáll a teljes informatikai rendszere?..