genai play 3d game

Játékfejlesztő álom valóra vált: WHAM AI segíti a kreatív ötletelést

Képzeld el, hogy van egy mesterséges intelligencia, ami pontosan érti, hogyan működik egy 3D-s játék világa, és képes új, izgalmas játékmeneteket generálni, amiket aztán kedvedre módosíthatsz! Ez nem sci-fi, hanem valóság, köszönhetően a Microsoft legújabb fejlesztésének, a WHAM (World and Human Action Model) nevű modellnek.

A Microsoft kutatói által kifejlesztett WHAM egy olyan generatív AI modell, amely emberi játékmenetre vonatkozó adatokon tanulva képes konzisztens, változatos és módosítható játékjelenetek létrehozására. A fejlesztést a Nature tudományos folyóiratban publikálták februárban, ami önmagában jelzi a munka jelentőségét, hiszen ritkán kerülnek játékfejlesztéssel kapcsolatos technológiák ilyen rangos tudományos orgánum oldalára.

A WHAM különlegessége, hogy képes:

  • Következetesen generálni játékmeneteket, figyelembe véve a játék fizikáját és mechanikáit
  • Változatos lehetőségeket nyújtani különböző játékmenet-útvonalakra
  • Megőrizni a felhasználó által végrehajtott módosításokat a generált jelenetekben

Ez a három képesség pontosan azt támogatja, amire a kreatív szakembereknek szükségük van a munkájuk során: a divergens gondolkodást és az iteratív alkotási folyamatot.

Miért fontos ez a játékfejlesztőknek?

A Microsoft 27 játékfejlesztő szakemberrel készített interjút, hogy jobban megértsék, mire van szükségük a kreatív folyamatok támogatásához. Kiderült, hogy a generatív AI modellek eddigi képességei gyakran elmaradtak a kreatív szakemberek elvárásaitól.

Az egyik résztvevő, egy indie stúdió operatív igazgatója megjegyezte: „Nehéz tudni, mi a megfelelő kimenet, amíg nem látjuk, és sok finomhangolást és kísérletezést igényel. Játéktervezőként sokszor nem is vagyunk tudatában a részleteknek, ahol ezernyi kis döntést kell meghozni. De egyszerűen tudjuk, ha valami nem stimmel, és csiszolgatjuk.

A WHAM pontosan erre a problémára kínál megoldást, mivel lehetővé teszi a kreatív szakemberek számára, hogy gyorsan generáljanak alternatív játékmeneteket, majd finomhangolják azokat, amíg „jól nem érzik” magukat.

Hogyan működik?

A WHAM egy transformer alapú modell, amely képes értelmezni és generálni mind a játék vizuális elemeit (képkockák), mind a játékos irányítói műveleteit. A modellt több mint 500 000 játékmenet alapján tanították, ami több mint 7 évnyi folyamatos játékidőnek felel meg.

A rendszer képes:

  1. Autoregresszív módon generálni a következő játékelem-tokent
  2. Vizuális jelzéseken keresztül irányítani a generálást
  3. Közvetlenül szerkeszteni a képeket a generálás során

A legnagyobb WHAM modell 1,6 milliárd paramétert tartalmaz, és képes 1 másodperces kontextust figyelembe venni a generáláskor.

A technológia már kis is próbálható

A kutatók létrehoztak egy WHAM Demonstrator nevű koncepció prototípust, amely vizuális felületet biztosít a WHAM modellekkel való interakcióhoz. Ezen keresztül a felhasználók különböző módokon irányíthatják a modellt, és felfedezhetik annak képességeit.

A jó hír, hogy a kutatók nyilvánosan elérhetővé tették a betanított modelleket, a WHAM Demonstratort és egy minta értékelési adatkészletet is, így bárki kipróbálhatja és továbbfejlesztheti azokat. Ezek elérhetők a https://huggingface.co/microsoft/wham oldalon.

Mi a jelentősége hosszú távon?

Ez a fejlesztés messze túlmutat a játékipar határain. A WHAM technológiája potenciálisan alkalmazható más kreatív területeken is, mint a zene vagy a videó. A generatív AI modellek, mint a WHAM, jelentőségét az adja, hogy képesek megtanulni komplex struktúrákat a megfelelő adatokból, előzetes domain-specifikus ismeretek nélkül.

A tanulmány záró gondolata szerint: „Extrapolálva egyetlen 3D-s videojátékra összpontosító felhasználási esetünkből, kezdetben is megsejthetjük, milyen erőteljesek lesznek a jövőbeli modellek, amelyek lehetővé teszik az emberi alkotók csapatai számára, hogy összetett új élményeket hozzanak létre.

Ez azt jelenti, hogy a jövőben az ilyen és ehhez hasonló AI modellek nem egyszerűen automatizálják a kreatív folyamatokat, hanem olyan eszközökként szolgálnak, amelyek kiegészítik és kibővítik az emberi kreativitást – legyen szó játékfejlesztésről vagy más alkotó területekről.

A jövő izgalmas lehetőségeket tartogat a mesterséges intelligencia és az emberi kreativitás együttműködésében!

Forrás: World and Human Action Models towards gameplay ideation

Itt is nézze meg

pathology explorer: új mi eszköz érkezik az egészségügyi cégekhez

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

Az Owkin francia-amerikai mesterséges intelligencia vállalat nemrégiben bejelentette első speciális biológiai MI ügynökének elindítását a J.P. Morgan Healthcare konferencián, amely alapvetően megváltoztathatja a gyógyszer- és diagnosztikai kutatások folyamatát. Az egészségügyi szakemberek mostantól olyan MI-eszközöket használhatnak, amelyek valós betegadatokból tanultak és közvetlenül a munkájukba integrálhatók.