Společnost Anthropic vydala nový model umělé inteligence Claude 3.7 Sonnet, který přináší revoluční přístup k uvažování. Tento model představuje první „hybridní rozumový model“ na trhu, který dokáže přepínat mezi rychlými odpověďmi a prodlouženým myšlením.
Na rozdíl od konkurence v Anthropic přistupují k uvažování umělé inteligence odlišně. Společnost považuje schopnost uvažování za integrovanou funkci AI modelů, nikoliv za něco, co by mělo být poskytováno jako samostatný model. Stejně jako lidé používají jeden mozek pro rychlé odpovědi i hluboké úvahy, Claude 3.7 Sonnet nabízí obě schopnosti v jednom systému.
Klíčové vlastnosti Claude 3.7 Sonnet:
- Duální režim – Model může fungovat jako běžný jazykový model nebo jako rozumový model s vylepšeným myšlením, který před odpovědí provádí sebereflexi, což zlepšuje jeho výkon zejména v matematice, fyzice a programování.
- Kontrola nad výdaji – Při použití vzdáleného napojení skrz Anthropic API mohou vývojáři definovat, kolik tokenů může model věnovat přemýšlení, což umožňuje vyvážit rychlost, cenu a kvalitu odpovědi.
- Zaměření na reálné úlohy – Model se zaměřuje na praktické úlohy, které lépe odrážejí skutečné využití v podnikání.
Claude 3.7 Sonnet, včetně režimu, který nabízí prodloužené myšlení, je nyní dostupný ve všech plánech předplatného včetně bezplatného, a také prostřednictvím Anthropic API, Amazon Bedrock a Google Cloud Vertex.
Cena modelu zůstává stejná jako u předchůdců: 3$ za milion vstupních tokenů a 15$ za milion výstupních tokenů, včetně „myšlenkových“ tokenů.
Spolu s novým modelem byl představen nástroj Claude Code, který je dostupný v omezené preview verzi. Tento nástroj umožňuje vývojářům zadávat Claudovi rozsáhlé úkoly přímo z terminálu. Aby tento nástroj fungoval, je zapotřebí na něj napojit Clauda pomocí Anthropic API.

Claude Code dokáže:
- Vyhledávat a číst kód
- Upravovat soubory
- Psát a spouštět testy
- Commitovat a pushovat kód na GitHub
- Používat nástroje a příkazové řádky
V prvních testech dokázal Claude Code dokončit úkoly jedním průchodem, normálně by tyto úkoly zabraly více než 45 minut manuální práce. Vývojáři Anthropic vylepšili integraci s GitHubem, která je nyní dostupná ve všech plánech včetně bezplatného.
V benchmarku SWE, který hodnotí výkon modelů na reálných úlohách softwarového inženýrství, dosáhl Claude 3.7 Sonnet přesnosti 62,3 % ve srovnání s 49,3 % u modelu o3-mini od OpenAI, což dokazuje jeho výjimečné schopnosti v této oblasti.

Společnost Anthropic uvádí, že režim prodlouženého myšlení je navržen pro reálné výzvy, jako jsou komplexní programovací problémy a matematické úlohy, kde může být „přemýšlení navíc“ užitečné. Claude 3.7 Sonnet je nyní dostupný pro širokou veřejnost.
