a prompt caching használatával akár 90%-kal csökkenthetők a költségek, és akár 85%-kal is lerövidíthető a hosszú promptok feldolgozási ideje. jelenleg a prompt caching nyilvános bétaverzióban érhető el a claude 3.5 sonnet és claude 3 haiku modellek esetében

Prompt Caching: Az Anthropic API Legújabb Fejlesztése

MiMaster 2024.08.16. Hírek 63 Megtekintések

A Claude modelleket fejlesztő Anthropic cég új funkciót vezetett be az API-ján keresztül, amelyet „prompt caching”-nek hívnak. Ez a funkció lehetővé teszi a fejlesztők számára, hogy az API hívások között tárolják a gyakran használt kontextust, ezáltal jelentős költség- és időmegtakarítást érjenek el. A prompt caching használatával akár 90%-kal csökkenthetők a költségek, és akár 85%-kal is lerövidíthető a hosszú promptok feldolgozási ideje. Jelenleg a prompt caching nyilvános bétaverzióban érhető el a Claude 3.5 Sonnet és Claude 3 Haiku modellek esetében, de hamarosan támogatni fogja a Claude 3 Opus modellt is.

Mikor érdemes használni a prompt cachinget?

A prompt caching különösen hasznos olyan helyzetekben, amikor nagy mennyiségű kontextust szeretnénk egyszer elküldeni, majd azt ismételten felhasználni a későbbi kérésekben. Az alábbiakban néhány gyakorlati példa található a prompt caching alkalmazására:

Beszélgető ügynökök: Hosszabb beszélgetések során, különösen akkor, ha hosszú utasításokat vagy dokumentumokat kell kezelni, jelentősen csökkenthetők a költségek és a válaszidő.
Kódolási asszisztensek: Az autocomplete és kódbázis kérdezz-felelek funkciók javítása érdekében a kódbázis összefoglalóját a promptba lehet ágyazni, ami gyorsítja és hatékonyabbá teszi a válaszokat.
Nagy dokumentumok feldolgozása: Teljes hosszú szövegeket, képeket tartalmazó anyagokat lehet a promptba beilleszteni anélkül, hogy ez megnövelné a válaszidőt.
Részletes utasítások: Hosszú utasítások, eljárások és példák megosztása, amelyek finomítják Claude válaszait. A fejlesztők gyakran néhány példát tartalmaznak a promptban, de a prompt caching segítségével több tucatnyi, kiváló minőségű példát is be lehet vonni a jobb teljesítmény érdekében.
Agentikus keresés és eszközhasználat: A több eszközhívást és iteratív változtatásokat igénylő forgatókönyvek javítása, ahol minden lépés általában új API hívást igényel.
Könyvekkel, dokumentációval, podcast átiratokkal és más hosszú tartalmakkal való kommunikáció: Bármilyen tudásbázist életre lehet kelteni, ha az egész dokumentumot a promptba ágyazzuk, és lehetőséget biztosítunk a felhasználóknak kérdések feltevésére.

A korai felhasználók jelentős sebesség- és költségjavulást tapasztaltak a prompt caching segítségével, különféle felhasználási esetekben, például egy teljes tudásbázis beépítésénél, 100 példás oktatásoknál vagy minden beszélgetési fordulat beépítésénél a promptba.

Árazási modell

A cachelt promptokat az eltárolt bemeneti tokenek száma és azok használatának gyakorisága alapján árazza az Anthropic. A cachebe írás 25%-kal többe kerül, mint az alap bemeneti tokenár a modellek esetében, míg a cachelt tartalom használata jelentősen olcsóbb, mindössze az alap bemeneti tokenár 10%-ába kerül.

A Notion cég is elkezdte alkalmazni a prompt cachinget a Claude által támogatott funkciókhoz, amelyek az AI asszisztensüket, a Notion AI-t működtetik. A prompt caching bevezetésével a Notion jelentősen csökkenteni tudta a költségeket, és növelte a válaszadási sebességet, ezáltal javítva a felhasználói élményt.
Simon Last, a Notion társalapítója így nyilatkozott: „Izgatottan várjuk, hogy a prompt caching segítségével a Notion AI gyorsabbá és olcsóbbá váljon, miközben megőrzi a legmodernebb minőséget.”

Hogyan lehet elkezdeni?

A prompt caching nyilvános béta verziójának használatához a fejlesztőknek meg kell látogatniuk az Anthropic API dokumentációját és árazási oldalát, ahol minden szükséges információt megtalálnak a bevezetéshez.

Forrás: „Prompt caching with Claude„

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

Az Owkin francia-amerikai mesterséges intelligencia vállalat nemrégiben bejelentette első speciális biológiai MI ügynökének elindítását a J.P. Morgan Healthcare konferencián, amely alapvetően megváltoztathatja a gyógyszer- és diagnosztikai kutatások folyamatát. Az egészségügyi szakemberek mostantól olyan MI-eszközöket használhatnak, amelyek valós betegadatokból tanultak és közvetlenül a munkájukba integrálhatók.

MiMaster Lépj szintet a Mesterséges Intelligenciával

Anthropic új fegyvere: a vállalati MI végre a céges hálózaton belül marad

Google három ingyenes MI-funkciót aktivál 3 milliárd Gmail-felhasználó számára

Veszélyes titok a munkahelyeken: Shadow AI – munkatársak 80%-a engedély nélkül dolgozik MI-vel

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

MI-őrület – Kijöttek az új verziók: mindenhonnan olvas, videót készít, ügynököket terel

Versenyfutás az MI-vel: mesterséges intelligencia vs. emberi munkaerő. Ki lesz a nyertes?

Mi az a Markdown, és miért forradalmi az LLM-ekkel kombinálva?

ChatGPT 3.5: Teljes Útmutató az Első Lépésektől a Hatékony Beállításokig

ChatGPT használatának munkahelyi lehetőségei

Elhülyüléssel fizetünk az MI használatért?

Versenyfutás az MI-vel: mesterséges intelligencia vs. emberi munkaerő. Ki lesz a nyertes?

Kínai robotok kitúrják munkahelyükről a fizikai dolgozókat is : A jövő robotjai már itt vannak!

Elhülyüléssel fizetünk az MI használatért?

Eljön a nap, amikor a főnök nem azt kérdezi: mit tudsz, hanem hogy mennyire tudsz „tanulást tanulni”

Prompt Caching: Az Anthropic API Legújabb Fejlesztése

Mikor érdemes használni a prompt cachinget?

Árazási modell

Hogyan lehet elkezdeni?

Kapcsolódó cikkek

Itt is nézze meg

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

Anthropic új fegyvere: a vállalati MI végre a céges hálózaton belül marad

Google három ingyenes MI-funkciót aktivál 3 milliárd Gmail-felhasználó számára

Veszélyes titok a munkahelyeken: Shadow AI – munkatársak 80%-a engedély nélkül dolgozik MI-vel

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

Kosmos: Az MI tudós, amely 6 hónapnyi munkát végez el egyetlen nap alatt

Kínai robotok kitúrják munkahelyükről a fizikai dolgozókat is : A jövő robotjai már itt vannak!

Eljön a nap, amikor a főnök nem azt kérdezi: mit tudsz, hanem hogy mennyire tudsz „tanulást tanulni”

Mesterséges intelligencia az orvosok mellett: Hatékonyabb ellátás, kevesebb stressz

Anthropic új fegyvere: a vállalati MI végre a céges hálózaton belül marad

Google három ingyenes MI-funkciót aktivál 3 milliárd Gmail-felhasználó számára

Veszélyes titok a munkahelyeken: Shadow AI – munkatársak 80%-a engedély nélkül dolgozik MI-vel

Hetekről órákra csökkent az elemzési idő – új MI eszköz érkezik az egészségügyi cégekhez

Kosmos: Az MI tudós, amely 6 hónapnyi munkát végez el egyetlen nap alatt