30.11.2024, 14:28
Alibaba vydává Qwen s otázkami, otevřený argumentační model, který překonává o1-preview
![[Obrázek: 1bksNER.png]](https://i.imgur.com/1bksNER.png)
Alibaba představila nový model umělé inteligence s názvem Qwen with Questions (QwQ), který je navržen pro pokročilé logické uvažování a plánování, což jej činí vhodným pro úlohy, jako je řešení matematických problémů a programování. QwQ využívá dodatečné výpočetní cykly během inferenčního procesu k přezkoumání svých odpovědí a opravě případných chyb.
V testech QwQ překonal model o1-preview od OpenAI v benchmarcích AIME a MATH, které hodnotí schopnosti řešení matematických úloh. Dále předčil model o1-mini v GPQA, což je benchmark pro vědecké uvažování. Přestože v testech LiveCodeBench zaměřených na programování zaostal za modelem o1, stále dosáhl lepších výsledků než jiné špičkové modely, jako jsou GPT-4 a Claude 3.5 Sonnet.
QwQ je k dispozici s 32 miliardami parametrů a kontextovým oknem o velikosti 32 000 tokenů. Model je uvolněn pod licencí Apache 2.0, což umožňuje jeho komerční využití. Přestože nebyl zveřejněn podrobný popis tréninkových dat a procesu, otevřená povaha modelu umožňuje zkoumat jeho způsob uvažování při řešení problémů.
Tento vývoj zdůrazňuje rostoucí důraz na schopnost modelů umělé inteligence nejen generovat text, ale také provádět složité logické operace a sebereflexi, což je klíčové pro přesné a spolehlivé výsledky v náročných úlohách.
![[Obrázek: 1bksNER.png]](https://i.imgur.com/1bksNER.png)
Alibaba představila nový model umělé inteligence s názvem Qwen with Questions (QwQ), který je navržen pro pokročilé logické uvažování a plánování, což jej činí vhodným pro úlohy, jako je řešení matematických problémů a programování. QwQ využívá dodatečné výpočetní cykly během inferenčního procesu k přezkoumání svých odpovědí a opravě případných chyb.
V testech QwQ překonal model o1-preview od OpenAI v benchmarcích AIME a MATH, které hodnotí schopnosti řešení matematických úloh. Dále předčil model o1-mini v GPQA, což je benchmark pro vědecké uvažování. Přestože v testech LiveCodeBench zaměřených na programování zaostal za modelem o1, stále dosáhl lepších výsledků než jiné špičkové modely, jako jsou GPT-4 a Claude 3.5 Sonnet.
QwQ je k dispozici s 32 miliardami parametrů a kontextovým oknem o velikosti 32 000 tokenů. Model je uvolněn pod licencí Apache 2.0, což umožňuje jeho komerční využití. Přestože nebyl zveřejněn podrobný popis tréninkových dat a procesu, otevřená povaha modelu umožňuje zkoumat jeho způsob uvažování při řešení problémů.
Tento vývoj zdůrazňuje rostoucí důraz na schopnost modelů umělé inteligence nejen generovat text, ale také provádět složité logické operace a sebereflexi, což je klíčové pro přesné a spolehlivé výsledky v náročných úlohách.
... Všechny mé příspěvky pocházejí z reálných a existujících článků které jsou do podoby stručných souhrnů přeloženy, upraveny a doplněny o tematický vizuál umělou inteligencí ...

![[Obrázek: 5eofeNM.jpeg]](https://i.imgur.com/5eofeNM.jpeg)