|
3月7日、テンセント・フンユアンの公式WeChatアカウントによると、テンセント・フンユアンは生の動画モデルを公開し、オープンソース化した。同時に、リップシンクやモーションドリブンゲームプレイなどの機能を導入し、背景効果音や2K高画質動画の生成もサポートした。 公式紹介によると、画像から動画を作成する機能により、ユーザーは画像をアップロードし、画像をどのように動かしたいか、カメラをどのように配置したいかを簡単に説明するだけで、Hunyuan が必要に応じて画像を動かし、5 秒間の短い動画に変換し、背景のサウンド効果を自動的に追加することもできるという。 さらに、人物の写真をアップロードし、「リップシンク」したいテキストや音声を入力すると、写真の人物が「話したり」「歌ったり」することができます。また、「モーションドリブン」機能を使用すると、ワンクリックで同様のダンスビデオを生成することもできます。 現在、ユーザーは公式サイトを通じてHunyuan AI Videoを体験することができ、企業や開発者はTencent Cloudを通じてAPIインターフェースの使用を申請することができる。 このオープンソースの画像ベース動画モデルは、Hunyuan画像ベース動画モデルのオープンソース化の継続です。モデルのパラメータ総数は130億のままです。このモデルは、リアルな動画制作、アニメキャラクター、さらにはCGIキャラクターの生成など、様々な種類のキャラクターやシーンに適用できます。 オープンソースコンテンツには、重み、推論コード、LoRAトレーニングコードが含まれており、開発者が混合ソースモデルに基づいて独自のLoRAモデルやその他の派生モデルをトレーニングするのに役立ちます。現在、GitHubやHuggingFaceなどの主要な開発者コミュニティでダウンロードとテストが可能です。(周小白) |
テンセントのHunyuanプラットフォームは、画像生成ビデオモデルをリリースしてオープンソース化し、リップシンクやモーション駆動型ゲームプレイなどの機能を実現しました。
関連するおすすめ記事
-
報道によれば、次世代の Avita は Changan SDA プラットフォームをベースとしており、Huawei は同プラットフォームを推奨しなくなったとのことです。
-
中国自動車販売協会は、自動車の価格や数量の制限を禁止することを規定した「業界独占禁止自主規律条約」を採択した。
-
CATL、Snapdragonスーパーハイブリッドバッテリーをリリース:4C超急速充電で世界初400km走行を実現
-
JD.comの第一陣のフルタイム配達員たちは契約を結び、配達員たちは「定年まで働く意思がある」と語っている。
-
自動車メーカー、数十億ドルの罰金を一時的に免れる!EU、自動車の炭素排出規制を緩和へ。
-
DeepSeek は Intel Core Ultra 製品で実行でき、AI PC でオフラインで使用することもできます。