
Az MI-benchmarkok vakfoltjai
Fontos megjegyezni, hogy a hagyományos teljesítménymérési módszerek tovább rontanak a helyzeten. A tesztek legtöbbször a lehető legjobb eredményre vannak kihegyezve, nem pedig a realitás bemutatására. Jellemzően figyelmen kívül hagyják a hálózati késleltetés hatását – pedig akár csekély késleltetés is nagyságrendekkel visszavetheti például az S3-tárhelyek teljesítményét. Felmérésekből kiderült: már közepes késleltetés mellett drasztikusan romlik az adatok átvitelének sebessége, és minél nagyobb a távolság a rendszerek között, annál súlyosabb a visszaesés. Érdekesség, hogy a tesztek alapján a késleltetés jóval nagyobb veszteséget okoz, mint a hálózati ingadozás (jitter) – ez pontosan az eredeti elvárások fordítottja. Következtetésképpen az S3-alapú adattárolást már nem lehet ideális laborfeltételekre tervezni, a létező hálózati gyengeségekből kell kiindulni.
Az adatutak törékenységének ára
Az MI-infrastruktúra tervezésénél mindenki a GPU-kra fókuszál, mivel ezek a leglátványosabb és legdrágább komponensek. Csakhogy a GPU annyit ér, amennyit az adatellátás biztosít. Ez az adatút széttöredezett, többféle szolgáltatóból és rétegből áll: tárolók, hálózat, adatbázis, biztonsági egységek, üzemeltető szoftverek. A végfelhasználó ebből semmit nem lát, csak az eredményt. Az adatok akadása azonban gyorsan csőstül jön: a GPU-k kihasználatlansága csak a legszembetűnőbb tünet, de romlik a gépi előrejelzések pontossága, romlik a válaszidő, nő a feleslegesen replikált adatok miatt az adatforgalom költsége, és egyre nehezebb lesz az egész rendszer üzemeltetése. A helyzet eléri azt a szintet, ahol már nem technológiai finomhangolás, hanem üzleti stratégiai kérdés lesz, hogy mennyire hatékony az adatszállítás. Egy jól megépített adatút mellett a GPU-k folyamatosan dolgoznak, az MI-alkalmazások gyorsan, megbízhatóan futnak, az üzemeltetés is viszonylag egyszerű, és a kiadásokon is sokat lehet fogni.
A tárhely határán dől el minden
Korábban a vállalati informatika úgy nézett ki: először lementjük az adatokat, utána jöhet az elemzés. Mára ez elavult. Az adat mennyiségén kívül ugyanolyan fontos a relevancia, az adatszármazás, a biztonság, a gyors elérhetőség – a teljes infrastruktúrába kell beépíteni az „intelligenciát”. Az F5 és a MinIO közös megoldásában például a BIG-IP nevű modul folyamatosan figyeli a tárhelycsomópontok állapotát, és mindig csak az egészséges csomópontokhoz küldi a lekérdezéseket. Különösen nagy jelentőségű ez elosztott adathálózatoknál: ha egy csomópont elromlik, nincs értelme a klienst oda irányítani újabb próbálkozásra, csakis a legjobb állapotú egységeket kell dolgoztatni.
Döntő jelentőségű ellenőrzés és szuverenitás
Az MI-projektek egyre gyakrabban több telephely, régió vagy akár több felhő között futnak. Ekkor már nem is a teljesítményen van a hangsúly, hanem azon, hogy ki, hol, milyen feltételekkel férhet hozzá az adatokhoz. A digitális szuverenitás – azaz hol tárolhatod az adatokat, ki kezelheti, milyen országhatárt nem léphetnek át – most már tervezési kényszer lett. Ezért sok cég visszaköltözteti a kritikus MI-adatokat saját tulajdonú rendszerekbe. A korszerű architektúra lényege: az alkalmazások elválasztása a konkrét tárhelytől, mindezt független köztes irányító réteggel, amely egységes szabályokat érvényesít mindenhol. Így a szuverenitás, a hibatűrés és a költségek nem külön-külön fejfájást okoznak, hanem működő modellé válnak.
Az adatútból menedzselt vezérlőpont lesz
A hagyományos logika szerint „egyenes” adatkapcsolatra épül a rendszer, de ma már ez a szemlélet életveszélyes. Helyette teljes körű alkalmazásszállítási vezérlő (ADC) védje az adatutat: így a forgalom megfigyelhető, programozható, terhelésérzékeny, sőt automatikusan szabályozható. Így a GPU-k a romló hálózati viszonyok mellett sem maradnak munka nélkül, az adatbiztonság pedig már nem csak szólam, hanem mindennapos művelet.
