Képzeld el, hogy van egy mesterséges intelligencia, ami pontosan érti, hogyan működik egy 3D-s játék világa, és képes új, izgalmas játékmeneteket generálni, amiket aztán kedvedre módosíthatsz! Ez nem sci-fi, hanem valóság, köszönhetően a Microsoft legújabb fejlesztésének, a WHAM (World and Human Action Model) nevű modellnek.
A Microsoft kutatói által kifejlesztett WHAM egy olyan generatív AI modell, amely emberi játékmenetre vonatkozó adatokon tanulva képes konzisztens, változatos és módosítható játékjelenetek létrehozására. A fejlesztést a Nature tudományos folyóiratban publikálták februárban, ami önmagában jelzi a munka jelentőségét, hiszen ritkán kerülnek játékfejlesztéssel kapcsolatos technológiák ilyen rangos tudományos orgánum oldalára.
A WHAM különlegessége, hogy képes:
- Következetesen generálni játékmeneteket, figyelembe véve a játék fizikáját és mechanikáit
- Változatos lehetőségeket nyújtani különböző játékmenet-útvonalakra
- Megőrizni a felhasználó által végrehajtott módosításokat a generált jelenetekben
Ez a három képesség pontosan azt támogatja, amire a kreatív szakembereknek szükségük van a munkájuk során: a divergens gondolkodást és az iteratív alkotási folyamatot.
Miért fontos ez a játékfejlesztőknek?
A Microsoft 27 játékfejlesztő szakemberrel készített interjút, hogy jobban megértsék, mire van szükségük a kreatív folyamatok támogatásához. Kiderült, hogy a generatív AI modellek eddigi képességei gyakran elmaradtak a kreatív szakemberek elvárásaitól.
Az egyik résztvevő, egy indie stúdió operatív igazgatója megjegyezte: „Nehéz tudni, mi a megfelelő kimenet, amíg nem látjuk, és sok finomhangolást és kísérletezést igényel. Játéktervezőként sokszor nem is vagyunk tudatában a részleteknek, ahol ezernyi kis döntést kell meghozni. De egyszerűen tudjuk, ha valami nem stimmel, és csiszolgatjuk.”
A WHAM pontosan erre a problémára kínál megoldást, mivel lehetővé teszi a kreatív szakemberek számára, hogy gyorsan generáljanak alternatív játékmeneteket, majd finomhangolják azokat, amíg „jól nem érzik” magukat.
Hogyan működik?
A WHAM egy transformer alapú modell, amely képes értelmezni és generálni mind a játék vizuális elemeit (képkockák), mind a játékos irányítói műveleteit. A modellt több mint 500 000 játékmenet alapján tanították, ami több mint 7 évnyi folyamatos játékidőnek felel meg.
A rendszer képes:
- Autoregresszív módon generálni a következő játékelem-tokent
- Vizuális jelzéseken keresztül irányítani a generálást
- Közvetlenül szerkeszteni a képeket a generálás során
A legnagyobb WHAM modell 1,6 milliárd paramétert tartalmaz, és képes 1 másodperces kontextust figyelembe venni a generáláskor.
A technológia már kis is próbálható
A kutatók létrehoztak egy WHAM Demonstrator nevű koncepció prototípust, amely vizuális felületet biztosít a WHAM modellekkel való interakcióhoz. Ezen keresztül a felhasználók különböző módokon irányíthatják a modellt, és felfedezhetik annak képességeit.
A jó hír, hogy a kutatók nyilvánosan elérhetővé tették a betanított modelleket, a WHAM Demonstratort és egy minta értékelési adatkészletet is, így bárki kipróbálhatja és továbbfejlesztheti azokat. Ezek elérhetők a https://huggingface.co/microsoft/wham oldalon.
Mi a jelentősége hosszú távon?
Ez a fejlesztés messze túlmutat a játékipar határain. A WHAM technológiája potenciálisan alkalmazható más kreatív területeken is, mint a zene vagy a videó. A generatív AI modellek, mint a WHAM, jelentőségét az adja, hogy képesek megtanulni komplex struktúrákat a megfelelő adatokból, előzetes domain-specifikus ismeretek nélkül.
A tanulmány záró gondolata szerint: „Extrapolálva egyetlen 3D-s videojátékra összpontosító felhasználási esetünkből, kezdetben is megsejthetjük, milyen erőteljesek lesznek a jövőbeli modellek, amelyek lehetővé teszik az emberi alkotók csapatai számára, hogy összetett új élményeket hozzanak létre.”
Ez azt jelenti, hogy a jövőben az ilyen és ehhez hasonló AI modellek nem egyszerűen automatizálják a kreatív folyamatokat, hanem olyan eszközökként szolgálnak, amelyek kiegészítik és kibővítik az emberi kreativitást – legyen szó játékfejlesztésről vagy más alkotó területekről.
A jövő izgalmas lehetőségeket tartogat a mesterséges intelligencia és az emberi kreativitás együttműködésében!
Forrás: World and Human Action Models towards gameplay ideation




