さくらインターネット株式会社は、生成AI向け推論API基盤「さくらのAI Engine」を2025年9月24日より一般提供開始した。
本サービスは「さくらのクラウド」のコントロールパネルから利用でき、大規模言語モデル(LLM)をAPI経由でアプリケーションへ組み込める。また、サービス提供開始に合わせて「さくらの生成AIプラットフォーム」の名称を「さくらのAI」へ変更した。
本サービスは生成AI向けクラウドサービス「高火力」を基盤とし、複数の基盤モデルやRAG機能(ベクトルデータベースを活用)をAPIで提供する。Chat completionsでは「gpt-oss-120b」「llm-jp-3.1-8x13b-instruct4」などのモデルを利用可能だ。
料金体系は「基盤モデル無償プラン」と「従量課金プラン」の2種類で、Chat completionsの無償枠は月3,000回、従量課金ではInput0.15円/10,000トークン、Output0.75円/10,000トークンから利用できる(公式サイト料金ページより、2025年9月24日時点)
From: 生成AI向け推論API基盤「さくらのAI Engine」を一般提供開始
【編集部解説】
さくらインターネットが発表した「さくらのAI Engine」は、国内クラウド事業者による本格的な生成AI推論基盤として注目される取り組みです。特に重要なのは、海外の大手クラウドプロバイダーが優勢な生成AIインフラ市場において、日本企業が独自の競争力を示している点でしょう。
このサービスの最大の特徴は「国内完結」という点にあります。データが国外に流出するリスクを懸念する企業や自治体にとって、機密性の高い情報を扱いながら生成AIを活用できる環境は極めて貴重です。特に金融機関や医療機関、政府関連組織では、データガバナンスの観点から海外サービスの利用に制約があるケースが多く見られます。
技術的な側面では、複数の基盤モデルを選択できる柔軟性が実用性を高めています。用途に応じてgpt-oss-120bやQwen3-Coderシリーズなどを使い分けることで、コスト効率と性能のバランスを最適化できるでしょう。
料金設定も興味深い戦略を取っています。月3,000回の無償枠付きプランは、中小企業や個人開発者の参入障壁を下げる効果が期待されます。一方で従量課金制により、大規模利用にも対応可能な構造となっています。
ただし、海外の大手プロバイダーと比較した場合の性能面や、モデルの更新頻度、多言語対応などの課題も残されているのが現状です。今後の市場競争力は、これらの点でどこまで差別化を図れるかにかかっているといえるでしょう。
【用語解説】
推論(Inference)
学習済みの機械学習モデルを使って、新しい入力データに対して予測や生成を行う処理のこと。モデルのパラメータを更新せずに結果を出力する段階を指す。
RAG(Retrieval Augmented Generation)
検索拡張生成と呼ばれる技術で、外部の知識ベースから関連情報を検索し、その情報を基にLLMが回答を生成する手法。企業の内部文書などを活用したチャットボット構築に使われる。
ベクトルデータベース
テキストや画像などのデータを数値ベクトルに変換して保存するデータベース。類似性検索が高速で実行できるため、RAGシステムの基盤技術として活用される。
トークン
自然言語処理において、文章を単語や文字などの最小単位に分割した要素。料金計算や処理量の測定基準として使用される。
NVIDIA GPU
並列計算処理に特化した半導体チップで、AI・機械学習の計算処理において業界標準となっている。特に生成AIの推論処理では必須のハードウェアとされる。
【参考リンク】
さくらインターネット株式会社(外部)
1996年創業の老舗クラウド事業者。レンタルサーバーから始まり、現在はクラウドサービス、データセンター運営など幅広いインフラサービスを展開している。
さくらのAI Engine(外部)
生成AI向け推論API基盤として提供される新サービス。複数の基盤モデルをAPI経由で利用でき、国内データセンターでの運用により高いセキュリティ要件にも対応する。
【参考記事】
生成AI向け推論API基盤「さくらのAI Engine」を一般提供開始(外部)
さくらインターネットが生成AI向け推論API基盤を国内データセンターで提供開始し、複数のLLMやRAG機能をAPIで利用可能にしたことを伝える公式プレスリリースです。
「国内で完結した生成AIの活用を可能に」 Preferred Networks …(外部)
Preferred Networks、さくらインターネット、NICTが、日本の文化や社会に配慮した「安全で高性能な国産LLM」開発とサービス化を目指すエコシステム構築で基本合意したことを報じています。国内完結型の生成AI活用を目指す大きな動きとして参考になります。
NTTデータ、生成AIの推論をプライベートクラウド環境で完結 …(外部)
NTTデータが2025年度中に自社のデータセンター上で、生成AIの推論をプライベートクラウド環境で完結できるサービスを拡充する計画を発表した記事です。国内大手IT企業が同様の「国内完結」「高セキュリティ」を志向している市場の動向を把握できます。
さくらインターネット、AI推論ニーズに応えるサービス展開で「 …(外部)
さくらインターネットが、生成AI向けクラウドサービス「高火力」において、AIの学習から推論へと市場のニーズがシフトしていることを指摘し、推論用途に特化したプラットフォーム構築を進めている戦略を解説した記事です。
国内パブリッククラウドサービス市場予測を発表(外部)
調査会社IDC Japanによる国内パブリッククラウド市場の予測レポートです。2024年以降、生成AIが市場成長の重要な要因となっており、ベンダー間の競合が激化している市場背景を理解する上で重要です。
【編集部後記】
生成AIを実際のビジネスで活用したいと考えている皆さんにとって、今回のさくらインターネットの取り組みはどのように映るでしょうか。特に、データを海外に送ることに不安を感じながらも、生成AIの恩恵を受けたいと思っている企業の担当者の方々にとって、国内完結型のサービスは魅力的に感じられるかもしれません。
一方で、無償枠での試用から始められる点も興味深いですね。皆さんの会社や組織では、どのような用途で生成AIを活用してみたいとお考えですか?チャットボットによる顧客対応の改善、社内文書の検索効率化、それともコード生成による開発効率の向上でしょうか。実際に手を動かして試してみることで、新たな可能性が見えてくるかもしれません。