|
Sina Tech Newsは1月28日朝、DeepSeekの創設者であるLiang Wenfeng氏が深夜、DeepSeekが画像を生成できるJanus-Pro-7BというマルチモーダルAIモデルをリリースし、オープンソース化したと発表したと報じた。 Liang Wenfeng氏によると、GenEvalとDPG-Benchのベンチマークテストでは、Janus-Pro-7BがOpenAIのDALL-E3とStable Diffusionを上回ったという。 Sina Techは、DeepSeekのエンジニアが本日早朝、Janus Pro 7Bおよび1.5BモデルをHugging Faceプラットフォームにアップロードしたことを知りました。これら2つのモデルは、DeepSeekが昨年10月にリリースしたJanusモデルのアップグレード版です。 DeepSeekによると、Janus-Proは、マルチモーダル理解と生成を統合する革新的な自己回帰フレームワークです。Janus-Proは、DeepSeek-LLM-1.5bベース/DeepSeek-LLM-7bベースモデルを基盤としています。 マルチモーダル理解タスクでは、Janus-ProはSigLIP-Lを視覚エンコーダとして用い、384 x 384ピクセルの画像入力をサポートします。画像生成タスクでは、Janus-Proは特定のソースからダウンサンプリングレート16のトークナイザーを使用します。(Wen Meng) |
DeepSeekの創設者が今朝早くに発表しました!マルチモーダルJanus-Pro-7Bモデルがリリースされ、オープンソース化され、OpenAI DALL-E3を破りました。
関連するおすすめ記事
-
犯罪者がトロイの木馬ウイルスを大規模に拡散しています。WeChatが緊急アナウンスを発令しました。
-
中国乗用車協会の崔東樹氏:1月から9月までの中古車販売台数は1,422万台で、前年同期比5%増、取引額は9,392億元で、前年同期比9%増となった。
-
DeepSeekは、優秀な人材を引き付けるためにMaimai(中国のプロフェッショナルネットワーキングプラットフォーム)に積極的に登録している幹部を採用するために、年間数百万ドルの給与を用意している。
-
Meta のソーシャル プラットフォーム Threads の商業化の進捗状況: 来年、ニュース フィードに広告を掲載するパイロット プログラムが開始されます。
-
雷軍のDouyinライブ配信は、運転中のライブ配信をネットユーザーから通報されたためと思われるが、一時的に停止された。
-
テスラは、サイバートラックのカスタマイズ可能なバーチャルボディラップ機能が他のモデルにも拡張されることを発表しました。