Sangfor One Cloud が AI 向けにアップグレード: DeepSeek をホスティングし、ディープ AI アプリケーションのイノベーションをサポート

2月17日、Sangfor OneCloudがAI向けに大幅なアップグレードを実施し、大規模モデルシナリオに適したAIプラットフォームを構築したことが発表されました。これにより、ユーザーにインテリジェントコンピューティングサポートとアプリケーション構築機能を提供します。DeepSeekをベースとしたユーザーシナリオでは、ワンクリックデプロイ、パフォーマンス向上、迅速なアプリケーション開発を実現するベストプラクティスソリューションを提供します。

要約すると、Sangfor One Cloud のアップグレードには次の 3 つの側面が含まれます。

1. オフラインインフラストラクチャは、従来のビジネスサポートプラットフォームからインテリジェントコンピューティングサポートプラットフォームにアップグレードされ、DeepSeek を含む最新の大規模モデルと幅広く互換性があります。

Sangfor は、「HCI+AICP 次世代ハイパーコンバージドインフラストラクチャ」ソリューションを開発しました。このソリューションでは、元のクラスターに GPU ノードを追加するだけで、DeepSeek などのエンタープライズレベルの大規模モデルをローカルクラスターに迅速に展開してサポートできます。

Sangfor の AICP コンピューティングプラットフォームは、NVIDIA GPU のサポートに加えて、多くの国内メーカーと広範なソフトウェアおよびハードウェアの互換性テストを実施しており、Tianshu Zhixin、Ascend、Hygon、Muxi、Suiyuan などのさまざまな国内カードに適応できるため、ユーザーは異機種コンピューティングパワー管理を実現できます。

2. オンラインホスティングクラウドは、DeepSeekなどのエンタープライズレベルの大規模モデルサービスを提供する、新しいAIサービスカタログを発表しました。ユーザーはサブスクリプションを通じてAI機能を迅速に取得できます。

Sangfor Managed Cloud は、専用リソースと AICP に基づく専用のエンタープライズレベルの大規模モデルサービスをユーザーに提供できるようになりました。これにより、専用サービスモデルのオンライン展開に対するユーザーのニーズを満たすことができます。

Sangfor はオンラインサービスカタログを引き続き充実させ、ユーザーがサブスクリプションを通じて DeepSeek やその他のモデルサービスなどの AI 機能に簡単かつスムーズにアクセスできるようにします。

3. 大規模なモデルアプリケーションを迅速に構築できるようにするための新しい AI アプリケーションイノベーションプラットフォームがリリースされ、AI アプリケーションの開発と運用が簡素化されました。

SangforのAIアプリケーション・イノベーション・プラットフォームは、RAGベストプラクティスのワークフローを統合し、インテリジェントなシャーディングと企業所有のナレッジベースへの直接接続をサポートします。ユーザーは簡単な操作で高品質なRAGアプリケーションを構築できます。このプラットフォームは、ビジネス評価データセットに基づくアプリケーションパフォーマンス評価をサポートし、最適化の提案を自動生成します。ユーザーは複雑な技術的詳細を理解することなく、構成の最適化とパフォーマンス向上を実現できます。

報道によると、AI にアップグレードした後、Sangfor は推論パフォーマンスを総合的に最適化し、クラウド上で実行される大規模モデルアプリケーションの推論パフォーマンスを大幅に向上させ、大規模モデルの使用にかかる全体的なコストを削減できるようになりました。

個人開発者が一般的に使用するOllamソリューションを用いてDeepSeekを導入する場合と比較して、SangforのAICPコンピューティングプラットフォームを介した導入ソリューションは、マルチインスタンスの同時推論シナリオにおいて5～10倍のパフォーマンス向上を実現します。大規模なモデルでは、同時実行性、スループット、推論応答のレイテンシが向上するため、ユーザーはリソース投資を抑えながら、エンタープライズレベルのAIアプリケーションの構築と利用において優れたエクスペリエンスを享受できます。

4 枚の 4090 カードを使用して DeepSeek-32B モデルを実行し、質問応答テスト用の 64 スレッド同時シナリオをシミュレートします。

32B モデルを例にとると、日常的な質疑応答のシナリオ (2k コンテキスト) では、AICP の同時実行性は Ollam の 8 ～ 10 倍、総スループットは 10 倍以上になります。

ハードウェアリソース: INT4は2*4090、FP16は4*4090を使用

ナレッジベースアプリケーションシナリオ (4k コンテキスト) では、AICP の同時実行性は Ollam の 2 倍、合計スループットは Ollam の 4 ～ 8 倍になります。

ハードウェアリソース: INT4は2*4090、FP16は4*4090を使用

SHOUJIKE

Sangfor One Cloud が AI 向けにアップグレード: DeepSeek をホスティングし、ディープ AI アプリケーションのイノベーションをサポート

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ