Anthropic PBCは2026年2月17日、Claude Sonnetモデルをバージョン4.6にアップグレードしたと発表した。
コンピューター操作能力、長文コンテキスト推論、エージェント計画、ナレッジワークおよびデザイン性能が向上した。フラッグシップモデルのOpus 4.6で導入済みの100万トークンコンテキストウィンドウをベータモードでSonnetにも提供する。FreeプランおよびProプランでデフォルトモデルとなり、価格は入力100万トークンあたり3ドル、出力100万トークンあたり15ドルで据え置きである。
Box Inc.の最高技術責任者ベン・クス氏は、重度の推論を要するQ&AタスクでClaude Sonnet 4.5を15ポイント上回ったと評価したとされる。APIではアダプティブシンキング、エクステンデッドシンキング、コンパクション機能(ベータ)に対応し、コード実行、Webフェッチ、メモリ、プログラマティックなツール呼び出しが一般提供となった。Claude in ExcelのModel Context ProtocolサポートがProサブスクリプション以上のユーザーに提供される。
From:
Anthropic debuts Sonnet 4.6, a highly capable creative and coding AI model – SiliconANGLE
【編集部解説】
Anthropicが2026年2月5日にリリースしたフラッグシップモデルOpus 4.6からわずか12日後に、中間層モデルであるSonnet 4.6が発表されました。この異例ともいえるリリースペースは、OpenAI、Googleとの三つ巴の競争がいかに激化しているかを物語っています。
今回の発表で注目すべきは、「中間層モデルがフラッグシップに肉薄した」という事実です。Anthropicの公式発表によると、Claude Codeのテストにおいて、ユーザーの約70%がSonnet 4.5よりSonnet 4.6を好み、さらに59%が2025年11月リリースの旧フラッグシップモデルOpus 4.5よりもSonnet 4.6を選んだとされています。「性能はフラッグシップ級、価格は中間層」というポジショニングは、API経由で大量のトークンを消費するエンタープライズにとって大きな意味を持ちます。
コンピューター操作能力の進化も見逃せません。AIがマウスやキーボードを操作し、Chrome、LibreOffice、VS Codeなどのソフトウェアを人間と同じように使う能力を測定するOSWorld-Verifiedベンチマークにおいて、Anthropic提供資料に基づく比較では、Sonnet 4.6は72.5%を記録しました。2024年10月のSonnet 3.5では14.9%だったスコアが、16か月で約5倍に向上したことになります。この数値はOpus 4.6の72.7%とほぼ同等であり、GPT-5.2の38.2%を大きく上回る結果が示されています。
この能力が実用レベルに近づくことで、APIを持たないレガシーシステムの自動化という巨大な市場が開かれます。保険業務の入力処理、行政の古いデータベース操作、ERPシステムへのデータ入力など、これまでRPA(ロボティック・プロセス・オートメーション)ツールでしか対応できなかった業務に、AIモデルが直接参入できる可能性が生まれています。
一方で、安全性への懸念も軽視できません。コンピューターを完全に操作できるAIは、プロンプトインジェクション攻撃のリスクにさらされます。悪意のあるWebサイトに隠された指示がAIの行動を乗っ取る可能性があり、Anthropicはこの耐性を大幅に改善したと述べていますが、リスクが完全に排除されたわけではありません。
企業としてのAnthropicの勢いも加速しています。2026年2月12日には300億ドルのシリーズG資金調達を完了し、ポストマネーバリュエーションは3800億ドルに達しました。年間ランレート収益は140億ドル、Claude Code単体でも25億ドルに成長しています。
長期的な視点で見ると、今回のリリースはAI業界の構造変化を示唆しています。フラッグシップモデルの性能が中間層に急速に降りてくることで、高性能AIへのアクセスが民主化されつつあります。これは開発者やスタートアップにとっての追い風である一方、既存のソフトウェア企業にとっては大きな脅威となりえます。Anthropicの製品群――とくにClaude CoworkやClaude Codeの進化が、従来のSaaS企業の価値を根底から揺さぶりかねないとの見方も広がっています。
【用語解説】
コンテキストウィンドウ(Context Window)
AIモデルが一度に処理できるテキスト量の上限を指す。この上限が大きいほど、より多くの情報を同時に参照しながら回答を生成できる。
アダプティブシンキング(Adaptive Thinking)
モデルがタスクの難易度に応じて推論の深さを自動的に調整する機能である。簡単な質問には素早く回答し、複雑な問題にはより深い推論を行うことで、速度・コスト・精度のバランスを最適化する。
コンテキストコンパクション(Context Compaction)
コンテキストウィンドウの上限に近づいた際、古い会話内容をモデルが自動的に要約して圧縮する仕組みである。これにより、最も古い情報が失われることなく、会話を継続できる。
OSWorld-Verified
AIがChrome、LibreOffice、VS Codeなどの実際のソフトウェアを、マウスやキーボードを通じて人間と同じように操作する能力を測定するベンチマークである。2025年7月にリリースされた改良版で、タスク品質や評価基準が更新されている。
SWE-bench Verified
実際のGitHubリポジトリのバグ修正タスクを用いて、AIのソフトウェアエンジニアリング能力を測定するベンチマークである。
Model Context Protocol(MCP)
AIモデルが外部ツールやデータソースと標準化された方法で接続するためのプロトコルである。Claude in Excelにおいては、S&P Global、FactSetなどの金融データプロバイダーとの連携に使用される。
ハルシネーション
AIモデルが事実に基づかない情報を、あたかも正しいかのように生成する現象である。
【参考リンク】
Anthropic公式 — Claude Sonnet製品ページ(外部)
Sonnetモデルファミリーの概要、各バージョンの特徴、価格、利用可能プラットフォーム情報をまとめた製品ページ。
Anthropic公式 — API価格表(外部)
Claude全モデルのAPI価格、バッチ処理割引、長文コンテキスト追加料金、プロンプトキャッシュの詳細な料金体系。
Claude Cowork — 製品ページ(外部)
macOS向けデスクトップアプリClaude Coworkの概要。ファイル操作やブラウザ操作、タスク自動化機能を紹介。
Claude Code — 製品ページ(外部)
開発者向けターミナルツールClaude Codeの製品ページ。自然言語によるコーディング支援機能の詳細を掲載。
Box Inc. — 公式サイト(外部)
クラウドコンテンツ管理プラットフォーム提供企業。CTOベン・クス氏がSonnet 4.6の性能を評価している。
OSWorld — ベンチマーク公式サイト(外部)
AIのコンピューター操作能力を測定するベンチマークの公式ページ。テスト手法やスコアの詳細を公開。
【参考記事】
Anthropic’s Sonnet 4.6 matches flagship AI performance at one-fifth the cost — VentureBeat(外部)
OSWorld 72.5%、SWE-bench 79.6%等の数値を網羅した詳細分析。旧Opus価格との比較である点に留意が必要。
Anthropic closes $30 billion funding round at $380 billion valuation — CNBC(外部)
300億ドルのシリーズG、年間収益140億ドル、Claude Code収益25億ドルなど企業成長の数値を詳報。
Introducing Claude Sonnet 4.6 — Anthropic公式ブログ(外部)
ユーザー選好率やVending-Bench Arena結果、安全性評価、15社以上のパートナーコメントを掲載した一次情報源。
Anthropic releases Claude Sonnet 4.6, continuing breakneck pace — CNBC(外部)
Opus 4.6から12日後のリリースペースに注目し、OpenAI・Googleとの競争激化とソフトウェア株への影響を報道。
【編集部後記】
AIモデルの性能がフラッグシップから中間層へと急速に降りてくる今、「高性能AI=高コスト」という前提が崩れ始めています。
みなさんの日々の開発やビジネスの現場では、こうしたモデルの進化をどのように活用できそうでしょうか。また、AIがコンピューターを直接操作する時代に、私たちの働き方はどう変わっていくのか――ぜひ一緒に考えていければと思います。






































