Az Új Google AI Eszköz: Forradalmasítsd A Képgenerálást A Whiskkel
A Google legújabb AI-fejlesztése, a Whisk, lehetővé teszi, hogy képeket generáljunk meglévő képek alapján, így elkerülhető a hosszas szöveges leírások készítése. Az alkalmazás segítségével egyszerűen megadhatunk néhány képet, amelyek alapján az AI megérti, mit szeretnénk látni, legyen az a kép témája, látványa vagy stílusa. Ha éppen nincsenek képeid, a Whisk dobókocka ikonja véletlenszerű képeket kínál, amelyek az AI kreativitásának eredményei. A folyamat végén lehetőség van szöveges részletezéssel pontosítani az elképzeléseket, de ez egyáltalán nem kötelező.
Képgenerálás és finomhangolás
Miután megadtuk a kívánt képeket, a Whisk elkezdi az alkotást, és szöveges javaslatokkal segíti a kreatív folyamatot. Amennyiben az elkészült képpel elégedettek vagyunk, könnyedén elmenthetjük vagy letölthetjük azt. Ha azonban további csiszolást igényel, új szöveges javaslatokkal finomíthatjuk a kompozíciót. A képre kattintva is lehetőség nyílik a szerkesztésre, így igazán egyedivé tehetjük az alkotásunkat.
A Google megközelítése a Whiskkel kapcsolatban
A Google egy blogbejegyzésben hangsúlyozza, hogy a Whisk elsődleges célja a “gyors vizuális feltérképezés,” nem pedig a részletek aprólékos kidolgozása. Arra is figyelmeztetnek, hogy néha a Whisk nem találja el pontosan, amit szeretnénk, ezért külön lehetőséget biztosítanak a javaslatok módosítására. Rövid tesztelésünk alapján a Whisk élvezetes eszköznek bizonyult. Bár a képek létrehozása néhány másodpercig tart, az eredmények különlegesek és innovatívak.
Legújabb technológia az Imagen 3 és Veo 2 modellekkel
A Whisk a Google újításainak csúcsát képviseli, az Imagen 3-modell legfrissebb változatán alapul, amelyet most mutattak be a nagyközönségnek. Emellett a Veo 2 is napvilágot látott, amely a videós tartalmak előállítására specializálódott, hangsúlyt fektetve a filmkészítés sajátos nyelvezetének megértésére. Ez az új modell pontosabb, kevesebbszer “hallucinál” különös elemeket, mint például extra ujjakat, így megbízhatóbb az előző verzióknál. Először a Google VideoFX platformján érhető el, de hamarosan további Google-termékeknél is találkozhatunk vele.
A TerraPower, Bill Gates atomenergiás startupja végre megkapta az amerikai hatósági engedélyt Wyomingban, hogy felhúzhassa első, kereskedelmi léptékű, új generációs atomerőművét...
🚗 Egy kínai kutatócsoport forradalmi áttörést ért el az elektromos autók akkumulátor-technológiájában: a világ első félig szilárdtest akkumulátora már valódi autóban is sikeresen helytállt, ráadásul elképesztő, 1000 kilométeres hatótávolságot produkált egyetlen feltöltéssel...
🔒 Az IPVanish VPN alkalmazás macOS-verziójában kritikus hibát találtak, ami lehetőséget ad arra, hogy a támadók átvegyék a felhasználó teljes rendszerét...
💡 A tudomány ismét elképesztő felfedezést tett: egy gigantikus űrlézert, azaz úgynevezett megamasert sikerült észlelni, amely 8 milliárd fényévnyi távolságból sugároz felénk...
Dravet-szindróma esetén már néhány éves korban sűrű, gyakran életveszélyes epilepsziás rohamok jelennek meg, miközben a gyerekek szellemi fejlődése is lelassul...
Egy floridai férfi azután vetett véget az életének, hogy a Google Gemini chatbot előbb arra biztatta, ártatlanokat öljön meg, majd öngyilkossági visszaszámlálást indított el a beszélgetésben...
Jól illusztrálja ezt, hogy a legfontosabb kriptodevizák – köztük az ether, a solana és az xrp – hirtelen nagyot ugrottak, miközben a globális részvénypiacok is felpattantak, a befektetők pedig mérsékelték a háborús kockázatoktól való félelmüket...
A generatív MI-modellek képzése eddig egyfajta külső mestertől függött: a Stable Diffusion vagy a FLUX modellek a szöveges vagy képi tartalom megértéséhez külső, „lefagyasztott” kódolókat – például CLIP-et vagy DINOv2-t – használtak...
A legújabb kutatások szerint a GLP-1 típusú, cukorbetegség elleni és fogyást elősegítő gyógyszerek, például az Ozempic vagy a Wegovy, nemcsak testsúlycsökkentésre alkalmasak, hanem jelentős védelmet is nyújthatnak különféle szenvedélybetegségek kialakulása ellen...
Most őszintén, észrevetted már, hogy az unalmas oktatóvideók teljesen átalakulnak? A Google Ultra‑előfizetők számára már ma elérhető egy vadiúj funkció: a filmszerű áttekintő videók (Cinematic Video Overviews)...
Az OpenClaw nevű MI-ügynök azért is veszélyes, mert képes szinte bármilyen feladatot automatizálni – de most egy újabb kockázat jelent meg: hamis telepítők lepték el az internetet, amelyek kártékony programokat terjesztenek...
👍 Megint érkezett egy frissítés a Windowsra, de most tényleg jól jártunk: végre helyrehozták azt a borzalmas hibát, ami miatt hónapok óta nem volt elérhető a Windows 10 helyreállítási környezete (Recovery Environment, WinRE)...
Dróntámadások és rakétacsapások súlyos károkat okoztak az AWS adatközpontjaiban az Egyesült Arab Emírségekben és Bahreinben, megbénítva a felhőszolgáltatásokat...
🗡 Felmerül a kérdés, hogy mennyire tud együttműködni a technológiai szektor a hadsereggel, ha a nemzetbiztonság és a mesterséges intelligencia fejlődése összeütközik...
🦜 A világ legnagyobb és legfurcsább papagájai, a kākāpōk történelmi szaporodási rohamot produkáltak Új-Zéland erdeiben, hála az elmúlt évtizedek legnagyobb rimu bogyótermésének...
A bakteriális genetika után most a teljes élővilág genetikai térképéhez nyúlt hozzá az Evo 2, egy mindenki számára hozzáférhető, óriási MI-alapú genommodell...
A világ legnagyobb Android-alkalmazásboltja, a Google Play, jelentős változáson megy át: a fejlesztők által fizetett jutalék 30 százalékról 20 százalékra csökken, bizonyos esetekben az új telepítések után akár 15 százalékra is...
Egy friss ügy borzolja a kedélyeket a Meta háza táján: kiderült, hogy sokszor külső cégek dolgozói nézhetnek bele azokba a személyes videókba és képekbe, amelyeket a Ray-Ban Meta okosszemüvegek készítenek...
Megdöbbentő eredményre jutott a legújabb kutatás: a nagyméretű nyelvi modellek az esetek 95 százalékában alkalmaznak nukleáris fenyegetést szimulált hadijátékok során...
⚡ Az Amazon, a Google, a Meta, a Microsoft, az OpenAI, az Oracle és az xAI most látványosan ígéretet tett arra, hogy a mesterséges intelligencia miatt épülő vadonatúj adatközpontjaik nem terhelik rá senkire a megduplázódott villanyszámlát...