Az MI költségcsökkentő trükkje: újítás a DeepSeek-től
A kínai DeepSeek legújabb fejlesztése, a V3.2-exp nevű kísérleti MI-modell jelentősen csökkenti a hosszú kontextust igénylő feladatok költségeit. A modell legfontosabb eleme a DeepSeek Sparse Attention technológia, amely okosan kezeli, mire fókuszáljon a rendszer, amikor hosszú szövegekkel dolgozik. Ez úgy működik, hogy egy lightning indexer nevű modul előre kiválasztja a releváns szövegrészleteket a teljes kontextusból, majd egy finomhangolt tokenkiválasztó pontosan meghatározza, mely szavakat érdemes figyelembe venni. Ez lehetővé teszi, hogy a modell nagy mennyiségű információt vizsgáljon át egyszerre, jóval kisebb szerverterheléssel.
Féláron az MI működtetése
Az első tesztek szerint egy hosszú kontextust használó, egyszerű API-hívás ára akár a felére is csökkenhet. Bár további vizsgálatok még várhatók, a modell már elérhető a Hugging Face-en, így hamarosan bárki kipróbálhatja. Ez a fejlesztés része annak az új hullámnak, amelynek célja, hogy a már betanított MI-k futtatásának költségét – tehát nem a tanításét – lefaragják.
Miért egy kínai MI hozza a forradalmat?
A DeepSeek eddig is kilógott a sorból: R1 modelljük is sok figyelmet kapott, mert jóval olcsóbb volt amerikai vetélytársainál. Várakozásokkal ellentétben azonban az R1 nem váltotta be a forradalmi reményeket, és a vállalat háttérbe szorult. A mostani „spórolós” újdonsággal azonban mégis a kínaiak mutathatnak utat az amerikai MI-cégeknek arra, hogyan lehet kevesebb pénzből többet kihozni.
Különösen igaz ez most, amikor a megújuló energia egyre nagyobb szeletet hasít ki a világ energiaellátásából, miközben a fosszilis energiahordozók továbbra is markánsan jelen vannak...
Két szoftveres kutató most különösen pimasz módon mutatta be, milyen gyorsan képes a modern mesterséges intelligencia egész nyílt forráskódú projekteket újjáalkotni...
✈ Végre megérkezett az a menüpont, amire mindenki vágyott: a United mostantól mutatja a beszállás előtti biztonsági ellenőrzések várakozási idejét az appban – vagyis, ha épp eszméletlenül hosszú sorok kígyóznak, pontosan tudhatod, mennyit fogsz unatkozni multitasking közben a poggyászoddal...
Japánban egyre komolyabban veszik a lebegő adatközpontok fejlesztését. A Mitsui OSK Lines (MOL) és a Hitachi most együttműködést kötött, hogy 2027-re egy használt hajóból alakítsanak ki egy úszó szerverfarmot, amely hűtéséhez tengervizet vagy folyóvizet használna...
Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...
Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...
Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...