új mi llm-ek frissítve 2 ezekben a hetekben

MI-őrület – Kijöttek az új verziók: mindenhonnan olvas, videót készít, ügynököket terel

MiMaster 2025.11.22. MI, MI újdonságok 106 Megtekintések

Az elmúlt hetekben nagyüzemben jelentek meg az új MI-k. Az OpenAI GPT-5.1 frissítése finomhangolt beszélgetési élményt és rugalmas működési módokat ad a mindennapi feladatokhoz. A Google Gemini 3 a multimodális feldolgozásban és a mély gondolkodásban nyújt kiemelkedő teljesítményt, új szintre emelve a kontextusértelmezést. Az xAI Grok 4.1 modellje nagy kontextusablakkal és fejlett ügynökfunkciókkal támogatja a valós idejű feladatvégrehajtást. Mindhárom fejlesztés jelentősen erősíti a munkavégzést és a személyes fejlődést segítő MI-képességeket.

Openai GPT-5.1

Az OpenAI-nál gyorsan pörögtek az események: kijött a GPT-5.1, ami sokkal emberibb, barátságosabb hangon beszél, nyolc kész személyiséget kínál (profi, laza, cinikus, bármi), és végre magától tudja, hogy egyszerű kérdésre gyorsan válaszoljon, a bonyolultabbra meg tovább gondolkozzon.

Az Instant mód a gyors ötletelésekhez és csevegésekhez, ami ideális, ha épp egy emailt kell gyorsan összedobni vagy ötleteket gyűjteni egy meetingre,
a Thinking mód a komolyabb feladatokhoz, mint adatok rendszerezése vagy stratégia kidolgozása, ahol az MI alaposabban gondolkodik el a válaszon.
Az Auto mód pedig magától vált a kettő között, így nem kell azon agyalni, melyiket válasszuk, ami nagy segítség lehet a rohanós munkanapokon.

A személyre szabás is bővült, most nyolc stílus közül választhatunk, mint a barátságos vagy a hatékony, és ezek azonnal érvényesülnek minden chatben, akár menet közben is váltva, ami jól jön, ha egyik pillanatban formális jelentést írunk, a másikban pedig lazább üzenetet.

Az adaptív gondolkodás pedig automatikusan állítja be, mennyi időt szán egy kérdésre az MI, gyorsabban reagálva az egyszerű dolgokra, de mélyebben beleásva magát a bonyolultakba, így megbízhatóbban támogatja a munkát.

GPT-5.1-Codex-Max

Érkezett a GPT-5.1-Codex-Max, ami már simán elbír 24+ órás kódolós sessionöket úgy, hogy közben okosan összenyomja a korábbi beszélgetést, tehát nem felejti el, mit csináltatok tegnap, de nem is eszi meg az összes kreditet. Aki néha egy kis automatizálást vagy scriptet ír, most már egész napra „odarakhat” egy türelmes segítőt.

Az OpenAI közben a céges oldalon is nagyot lépett: elindult a Company Knowledge a ChatGPT Enterprise-ben, ami egyből beköti a Slack, Drive, GitHub, HubSpot adatait, tehát ha kérdezed, hogy „mi történt a legutóbbi termékmeetingen”, már nem csak találgat, hanem összefoglalja a céges forrásokból.

ChatGPT for Teachers

Az OpenAI élesítette a kifejezetten tanároknak és iskolavezetőknek készített változatot: a ChatGPT for Teachers egy külön, zárt munkaterület, ahol végre gond nélkül lehet MI-t használni az iskolában is.

A tanárok szempontjából ez azt jelenti:

Gyorsan át lehet dolgozni tananyagot, differenciálni feladatlapokat, óravázlatokat.
Óra-előkészítéskor azonnal kap ötleteket, példafeladatokat, magyarázatokat különböző szintekre.
Kollégákkal közös munkamenetben lehet együtt tervezni, megosztani anyagokat.
Mindenki saját tempójában ismerkedhet az MI-vel, nincs nyomás.

Az iskola- és tankerületi vezetőknek pedig:

Egy közös iskolai fiók alá lehet hozni az összes tanárt és dolgozót.
Teljesen megfelel a gyerekadat-védelmi szabályoknak (FERPA-kompatibilis, oktatási szintű titkosítás).
Központilag lehet kezelni, ki mit lát, mit használ – így nem szivárog semmilyen diákadat.

Röviden: végre van egy olyan ChatGPT, amit nyugodt szívvel be lehet vinni az osztályterembe, nem kell attól félni, hogy valaki véletlenül rossz prompttal érzékeny adatot tölt fel. Ha tanár vagy, vagy iskolában döntesz ilyesmiről, érdemes rögtön kipróbálni – jelentősen lerövidítheti az előkészületeket és sokkal változatosabbá teheti az órákat.

Google Gemini 3

A Google viszont nem akart lemaradni, és bedobta a Gemini 3-at, méghozzá rögtön a Deep Think móddal együtt. Ez nem csak gyors, hanem ténylegesen mélyen gondolkodik: stratégiai terveket elemez, tudományos témákat magyaráz el úgy, hogy közben őszintén megmondja, ha valamit félreértettél, és nem csak bólogat. „A Gemini 3 a világ legjobb modellje a multimodális megértésben és a legerősebb ügynök alapú kódoló modellünk eddig” – mondta Demis Hassabis, a DeepMind vezére. A Deep Think különösen akkor durva, ha valami igazán bonyolultat kell megérteni vagy megtervezni, mert lassabban, de alaposabban dolgozik, mintha egy okos kolléga ülne melletted és nem siet sehova.

Fotóalapú videókészítő funkció

Akár három referenciaképet tölthetünk fel az AI-alapú videók készítésének irányításához. A frissítés, amelyet a Google „vizuális összetevőknek” nevez, lehetőséget ad arra, hogy a felhasználók következetes karakterekkel, stílussal és jelenetekkel rendelkező videókat hozzanak létre bonyolult szöveges utasítások írása nélkül.

Antigravity

Ugyanebben a csomagban jött az Antigravity nevű ingyenes ügynök-platform, ahol a Gemini 3 már önállóan tud kódot írni, applikációt összerakni, e-maileket rendszerezni vagy akár helyi szolgáltatást foglalni – és mindezt úgy, hogy nem kell hozzá programozónak lenni. Aki eddig csak másolta-beillesztette a promptokat, most már egész projekteket rábízhat az MI-re, és az tényleg megcsinálja.

A Gemini 3 egyből bekerült a Google Keresőbe is, ahol élőben generál interaktív táblázatokat, diagrammokat, szinte már mini-appokat a válaszokhoz. Emellé a Gemini appba bekerült a videókészítés három referenciaképpel, tehát ha gyorsan kell egy egyenletes stílusú bemutatóvideó vagy kampányanyag, pár kattintás és kész.

Google DS-STAR

A Google Kutatóközpont bemutatta a DS-STAR-t, egy fejlett mesterséges intelligencia ügynököt, amely automatizálja az összetett adatelemzési feladatokat különféle adatformátumokban. A DS-STAR fő fókusza a teljes adattudományi munkafolyamat automatizálása – a dokumentumok értelmezésétől a statisztikai elemzésig – egy olyan kritikus problémát céloz meg, amely azokban a vállalkozásokban jelentkezik, ahol hiányzik a mély technikai szaktudás. A rendszer képessége, hogy valódi, kaotikus adatokkal dolgozzon, nem pedig tisztított relációs adatbázisokkal, lehetővé teszi gyakorlati vállalati bevezetését, ami elősegítheti a fejlett analitikai megoldások

Opal – a miniapp készítő kódolás nélkül

Az elmúlt napokban a Google Labs is becsatlakozott a nagyüzemi MI-frissítések sorába: ma élesedett az Opal, egy teljesen új, kísérleti eszköz, ami gyakorlatilag bárkiből „MI-app fejlesztőt” csinál – kódolás nélkül.

Az Opal lényege, hogy természetes nyelven leírhatjuk, mit szeretnénk (például „legyen egy app, ami bejövő e-mailjeimet elolvassa, kiemeli a teendőket, átalakítja őket teendőkké a Google Tasksban, és összefoglalót küld Slackre”), az eszköz pedig ebből automatikusan összerak egy vizuális munkafolyamatot. Utána már csak beszélgetni kell vele és kész is az App. Egy linkkel megoszthatjuk, és mások már futtathatják is a saját Google-fiókjukkal.

Három fő erőssége van:

Workflow-automatizálás kód nélkül – több lépéses folyamatokat (prompt-láncok, eszközhívások) rak össze percek alatt.
Vizuális + beszélgetős szerkesztés – vagy kattintgatsz a folyamatábrán, vagy egyszerűen odamondod: „tedd a harmadik lépést az elejére”, és máris átalakult.
Azonnali megosztás – kész az app, kész a publikus link, mások már használhatják is.

Az Opal ma indult nyilvános bétában (egyelőre csak az Egyesült Államokban), de a Google kifejezetten a közösséggel együtt akarja továbbfejleszteni. Aki eddig csak álmodozott egy saját kis MI-segédről – hírlevél-összefoglalóról, árajánlat-generátorról, meeting-jegyzőkönyv készítőről vagy bármi hasonló munkafolyamatról –, most pár perc alatt élesítheti, és már mehet is élesben a napi munkába.

Microsof Copilot

A Microsoft sem tétlenkedett: az Ignite-on bemutatták a Copilot nagy őszi frissítését 12 új funkcióval és hosszú távú memóriával, jövőre pedig egy rakás eddig fizetős dolgot ingyenessé tesznek az Office-ban. Emellé jött az Agent 365, ami egy központi irányítópult az összes céges MI-ügynökhöz, mert pár év múlva már milliárdos nagyságrendben rohangálnak majd ezek a kis segítők.

A Microsoft őszi nagy frissítése nem csak pár apróság, hanem 12 olyan új képesség, ami egyértelműen arra megy, hogy a Copilot végre ne csak „válaszolgasson”, hanem ténylegesen együtt dolgozzon velünk és a csapattal.

Groups – Közös Copilot-munkamenetek Akár 32-en lehetünk bent egyszerre egy „szobában”. Ott lehet ötletelni, együtt írni dokumentumot, tervezni – és a Copilot végig követi a beszélgetést, összefoglalja a döntéseket, és nyomon követi a nyitott feladatokat. Tökéletes távoli csapatoknak, mert egyben van a meeting-chat, a feladatlista és az MI-segítő.
Imagine – Kreatív központ Gyorsan lehet képeket, marketinganyagokat, oktatási segédleteket generálni és átalakítani együtt a csapattal. Prototípusok, moodboardok, prezentációk pár perc alatt kész.
Mico – Az új arca a Copilotnak Egy aranyos, formátlan kis „blob” figura, ami érzelmeket is mutat, viccel, reagál. Olyan, mint egy modernebb Clippy, csak tényleg szerethető és mindenhol ott van (chat, böngésző, Windows).
Real Talk – Végre őszintén megmondja Nem hízelkedik, nem bólogat mindig. Ha hülyeséget kérdezel, finoman visszaszól, kérdez, vitázik veled – pont, ahogy egy jó kolléga tenné. Sokaknak ez hiányzott a korábbi modellekből.
Memory & Personalization – Hosszú távú emlékezet Megjegyez mindent, amit fontosnak tartasz: célokat, edzéstervet, határidőket, preferenciákat. Másnap is tudja, hol hagytátok abba.
Connectors – Összeköti a fiókjaidat OneDrive, Outlook, Gmail, Google Drive, Google Naptár – mindet át tudja keresni természetes nyelven. „Mutasd a múlt heti sales e-maileket a Google Drive-on” – és már jön is.
Proactive Actions (előnézet) Magától kínál következő lépéseket aszerint, mit csináltál az elmúlt percekben. „Épp most nyitottad meg a költségvetés-táblát? Segítsek frissíteni a számokat?”
Copilot for Health Orvosi infók megbízható forrásokból (pl. Harvard Health), orvoskereső, tünet-összehasonlító – minden adatokkal alátámasztva.
Learn Live – Élő, hangalapú oktató mód Kérdez, rajzol a táblára, képekkel magyaráz – olyan, mintha egy türelmes tanár ülne melletted.
Copilot Mode az Edge böngészőben Az Edge most már „MI-böngésző”: összefoglal oldalt, összehasonlít árakat, hanggal irányítható, sőt webes műveleteket is elvégez helyetted.
Copilot a Windows-ban „Hey Copilot” és máris nyitja a fájlokat, keres a gépen, mutatja a képernyőt, segít lépésről lépésre (Copilot Vision).
Copilot Pages és Copilot Search Egy közös, végtelen vászon-szerű dokumentum, ahol együtt dolgozhattok, plusz egy szuper kereső, ami egyszerre ad MI-választ forrásokkal és normál webes találatokat.

Az egész csomag máris elérhető az Egyesült Államokban, a héten jön az Egyesült Királyság és Kanada, a többi ország pedig folyamatosan csatlakozik a következő hetekben. Akinek van Microsoft 365 előfizetése, annak érdemes azonnal kipróbálni – tényleg olyan érzés, mintha végre egy igazi digitális kolléga költözött volna az asztalra.

Inygenes Colipot az Office-ban

A Microsoft 2026 elején tervezi ingyenes AI-fejlesztések bevezetését az Outlook, Word, Excel és PowerPoint programokba, jelentősen bővítve a jelenleg csak fizetős előfizetőkre korlátozott képességeket. Az Outlookban a Copilot Chat képes lesz teljes postaládák tartalmához hozzáférni, beleértve a naptári eseményeket és találkozókat is, lehetővé téve a felhasználók számára az e-mailek rendezését és a találkozókra való felkészülést fizetős előfizetés nélkül. Az Agent Mode, amely korábban csak a Microsoft 365 Copilot előfizetők számára volt elérhető, az összes Microsoft 365 felhasználó számára elérhetővé válik a Word, Excel és PowerPoint programokban.

xAI Grok

A kreatív vonalon a Grok is belehúzott: az X-en most már egy hosszú nyomással képből videót csinál, az xAI pedig kiadta a Grok 4.1-et, ami jóval kevesebbet hallucinál, tehát megbízhatóbb lett a napi használatban.

Ez a frissítés főként az ügynök alapú feladatokra fókuszál, ahol a Grok 4.1 Fast változat kiemelkedik a valós idejű eszközhasználatban, mint webkeresés, kódvégrehajtás vagy dokumentumkezelés, miközben

2 millió tokenes kontextusablakkal kezeli a hosszú beszélgetéseket anélkül, hogy elvesztené a fonalat.

Harmadára csökkent a hallucináció mennyisége, ami azt jelenti, hogy kevesebb hamis infót ad, így megbízhatóbban használható kutatáshoz vagy riportok összeállításához a munkában. A modell jobb érzelmi intelligenciát és kreativitást mutat, stabilabb személyiséggel, ami segít kollaboratív ötletelésben vagy ügyfélkommunikációban, ahol a hangnem konzisztens marad.

Állóképekből rövid videoklipek az X-ben

Elon Musk november 8-án bemutatott egy új képből videóvá alakító animációs képességet a Grok számára, amely lehetővé teszi a felhasználók számára, hogy egy egyszerű hosszú lenyomás gesztussal, majd testre szabható szöveges utasításokkal állóképekből rövid videoklipeket készítsenek.

A jelentések szerint a Grok Imagine-t működtető Aurora motor átlagosan körülbelül 17 másodperc alatt generál videókat, így versenyképes pozícióba kerül az Adobe, a Google és az OpenAI eszközeivel szemben.A rendszer 6-15 másodperc hosszúságú videókat képes előállítani szinkronizált hanggal, beleértve a háttérzenét, párbeszédeket és hangeffektusokat.

Összességében most olyan eszközök vannak a kezünkben, amik nem csak gyorsítanak, hanem tényleg átvesznek teljes feladatokat – legyen az kódolás, stratégiai gondolkodás, céges tudás összefoglalása vagy videók gyártása. Aki eddig csak alap szinten nyomta, most már pár kattintással olyan dolgokat tud megoldani, amik pár hónappal ezelőtt még órákig tartottak, vagy egyáltalán nem voltak elérhetők. Érdemes kipróbálni, mert a hétköznapi meló érezhetően könnyebb és gyorsabb lett.