
Lenyomta a nagyokat, mégis kicsi és nyitott
Tipikus eset, amikor egy úttörő technológia kis mérettel, de forradalmi szemlélettel nagyokat előz le. A Harness-1 20 milliárd paraméterrel működik, vagyis töredéke a hatalmas, százmilliárdokat mozgató konkurenseknek, mégis több mint 73%-os pontossággal idézi fel a keresett információkat egy gondosan válogatott adathalmazon. Ez nemcsak az eddigi legpontosabb nyílt forráskódú keresőügynököt körözi le 11 százalékponttal, hanem az irdatlanul drága, óriási GPT-5.4-et (70,9%) is maga mögé utasítja. Egyedül az Opus-4.6 nagyvállalati óriásmodell ér el nála csekély mértékben magasabb átlagos eredményt.
A kutatók teljesen nyílt, Apache 2.0 licenc alatt tették elérhetővé a Harness-1-et, vagyis szabadon felhasználható, módosítható, üzleti célra is bevethető.
Miért volt eddig kudarc a kereső MI-k többsége?
Az MI-vel támogatott keresőügynökök sokáig úgy működtek, mintha egy zárkózott kutatósegédet ültettünk volna egy üres szobába, iratok nélkül, és elvártuk volna, hogy fejből, hibátlanul jegyezzen meg minden hivatkozást, mondattöredéket, elvetett fonalat. Nincs az a zseni, aki ebbe hosszú távon ne fáradna bele, főleg, ha a kutató folyamatosan bővülő jegyzeteiben elveszik.
Korábbi MI-modelleknél ezért próbálták meg erőből felszámolni az úgynevezett „keresési amnézia” problémát: a modellt arra kényszerítették, hogy minden olvasását, döntését beírja egy egyre növekvő jegyzettömbbe (kontextusablakba), hogy mindig vissza tudjon keresni, mit csinált eddig. Ez az irgalmatlan adattorlódás lassú, drága és gyakran eredménytelen volt. A modellek túl sokat „emésztettek”, nem eleget „kutattak”. Ez a fő oka annak, hogy az MI-alapú keresés komoly vállalati igényeknél rendre elvérzett.
Áttörés: a „harness” rendszer és az igazi autonóm keresés
A Harness-1 paradigmaváltás lényege, hogy átadja ezt az unalmas, de kulcsfontosságú adminisztrációt egy külső szoftveres környezetnek – tipikusan egy adatbázisszerű „harness”-nek (magyarul: keretnek vagy hevedernek), amely önállóan végzi a rendszerezést, a dokumentumok címkézését, az állítások igazolását és a találatok fontossági sorba állítását. A modell innentől csak azzal foglalkozik, amiben igazán jó: keres, dönt, szelektál, és eldönti, mikor kell továbblépni. Az MI dolgozik, a papírmunkát egy digitális titkárság végzi.
A tréning is merőben eltér a korábbiaktól: a rendszer nem maga próbált ki minden keresést, hanem egy már meglévő GPT-5.4 „tanár” segítségével mutattak példát arra, hogyan kell egy ilyen strukturált, jól szervezett keresési folyamatot vezetni. Az első, felügyelt finomhangolási körhöz csupán 899 keresési folyamatot készítettek, melyeket követett egy 3453 példányos megerősítéses tanulási szakasz. Ezer dokumentumnál kevesebb is elegendő volt, mert maga a keret végzi a tényleges adminisztrációt, az MI pedig csak a lényegi döntéseket igazítja hozzá. Más, konkurens rendszerekhez képest ez az adatigény minimális.
Miért csoda ez cégeknek és fejlesztőknek?
A Harness-1 nemcsak a keresési pontosságban, de költségben és gyorsaságban is veri a nagyokat. Mivel a kontextust a keret szelektíven, tervszerűen menedzseli, nem eszik feleslegesen tokeneket (és így forinttízezreket) feldolgozandó karakterekre, mint a legtöbb hosszú távú MI-feladatnál szokott, hanem olcsón, gyorsan fut. Ez rengeteg lehetséges alkalmazási területet nyit meg a vállalati adattárolástól az intelligens belső keresésen át a vállalati jelentések feldolgozásáig.
A Harness-1 bizonyítja, hogy elegendő egy okosabb működési közeg az MI köré, nem pedig egyre nagyobb, drágább modellek. Egyetlen megkötés: a licenc megköveteli az eredeti szerzők feltüntetését és a módosítások kiemelését – de ezt leszámítva bármilyen üzleti célra szabadon használható.
Fejlesztői tapasztalat: végre nem felejt az MI
Az új ügynökrendszer fejlesztésének híre gyorsan körbejárta a szakmát. A Harness-1 kirobbanó sikert aratott a programozók és adattudósok körében, akik végre egy olyan eszközt kaptak, amely nem felejti el az utasításokat a keresési folyamat közepén, nem veszik el a friss információkban, hanem szisztematikusan, átláthatóan kezeli az egész keresési folyamatot. Ez különösen fontos, amikor az MI-nek bonyolult, többlépéses kérdésekben kell naprakész, igazolt válaszokat találnia.
Az MI-k jövője – mint az évek óta csak tuningolt óriásmodellek döbbenetesen drága kudarcai mutatják – nem feltétlenül a paraméterszám bővítésében rejlik. A Harness-1 példája azt bizonyítja, hogy egy okosabb „asztal” biztosítása, egy jól szervezett adminisztráció lényegesen hatásosabb és költséghatékonyabb, mint egy irdatlanul nagy agy felesleges hajszolása. A jövő MI-ügynökei okos keretek között dolgoznak majd, nem pusztán saját „fejükre” – így a kisebb, szorgalmas rendszerek is könnyedén lekörözhetik az amúgy súlyos „óriásokat”.
