09.5.2025, 12:58
Google spouští "implicitní ukládání do mezipaměti", aby zlevnil přístup ke svým nejnovějším modelům umělé inteligence
![[Obrázek: vTuvVlx.png]](https://i.imgur.com/vTuvVlx.png)
Google představil v rámci své Gemini API novou funkci nazvanou implicitní kešování (implicit caching), která má vývojářům přinést až 75% úsporu nákladů u opakujícího se obsahu zasílaného modelům Gemini 2.5 Pro a 2.5 Flash. Tato funkce je aktivní ve výchozím nastavení, na rozdíl od explicitního kešování, a automaticky rozpozná shodné úvodní části požadavků (common prefixes) a uplatní slevu na odpovídající tokeny.
Google zároveň snížil minimální počet tokenů, které musí požadavek obsahovat, aby bylo možné dosáhnout zásahu do keše, na 1 024 tokenů pro model Flash a 2 048 tokenů pro model Pro, což zvyšuje pravděpodobnost využití keše i u kratších požadavků.
Implicitní kešování reaguje na stížnosti vývojářů na vysoké náklady spojené s explicitním kešováním Gemini 2.5 Pro a přináší automatizované řešení bez nutnosti dalšího nastavování, čímž usnadňuje přístup k nejnovějším AI modelům při zachování efektivity nákladů.
![[Obrázek: vTuvVlx.png]](https://i.imgur.com/vTuvVlx.png)
Google představil v rámci své Gemini API novou funkci nazvanou implicitní kešování (implicit caching), která má vývojářům přinést až 75% úsporu nákladů u opakujícího se obsahu zasílaného modelům Gemini 2.5 Pro a 2.5 Flash. Tato funkce je aktivní ve výchozím nastavení, na rozdíl od explicitního kešování, a automaticky rozpozná shodné úvodní části požadavků (common prefixes) a uplatní slevu na odpovídající tokeny.
Google zároveň snížil minimální počet tokenů, které musí požadavek obsahovat, aby bylo možné dosáhnout zásahu do keše, na 1 024 tokenů pro model Flash a 2 048 tokenů pro model Pro, což zvyšuje pravděpodobnost využití keše i u kratších požadavků.
Implicitní kešování reaguje na stížnosti vývojářů na vysoké náklady spojené s explicitním kešováním Gemini 2.5 Pro a přináší automatizované řešení bez nutnosti dalšího nastavování, čímž usnadňuje přístup k nejnovějším AI modelům při zachování efektivity nákladů.
... Všechny mé příspěvky pocházejí z reálných a existujících článků které jsou do podoby stručných souhrnů přeloženy, upraveny a doplněny o tematický vizuál umělou inteligencí ...

![[Obrázek: H4uAkyu.jpeg]](https://i.imgur.com/H4uAkyu.jpeg)