DeepSeek 征服了移动世界,现在正在向 Windows 扩展——令人惊讶的是,它得到了微软的全力支持。昨天,这家软件巨头将 DeepSeek R1 模型添加到其 Azure AI Foundry,以允许开发人员使用它测试和构建基于云的应用程序和服务。今天,微软宣布将 R1 的精简版本引入 Copilot+ PC。 精简后的模型将首先应用于搭载骁龙 X 芯片的设备、搭载英特尔酷睿 Ultra 200V 处理器的设备,然后应用于基于 AMD Ryzen AI 9 的 PC。 第一个模型将是 DeepSeek-R1-Distill-Qwen-1.5B(即 15 亿参数模型),更大、更强大的 7B 和 14B 模型即将推出。这些模型将可从 Microsoft 的 AI Toolkit 下载。 微软必须调整这些模型,以优化它们,使其能够在配备 NPU 的设备上运行。严重依赖内存访问的操作在 CPU 上运行,而计算密集型操作(如变压器块)则在 NPU 上运行。通过优化,微软成功实现了快速的第一个令牌时间(130 毫秒)和短提示(少于 64 个令牌)每秒 16 个令牌的吞吐率。请注意,“令牌”类似于元音(重要的是,一个令牌通常不止一个字符长)。 微软是 OpenAI(ChatGPT 和 GPT-4o 的制造者)的坚定支持者和大量投资,但它似乎并不偏袒任何一方——它的 Azure Playground 有 GPT 模型(OpenAI)、Llama(Meta)、Mistral(一家 AI 公司),现在也有 DeepSeek。 Azure AI Foundry 游乐场中的 DeepSeek R1无论如何,如果您更喜欢本地 AI,请先下载适用于 VS Code 的 AI 工具包。从那里,您应该能够在本地下载模型(例如,“deepseek_r1_1_5”是 1.5B 模型)。最后,点击 Playground 中的“尝试”,看看这个精简版 R1 有多智能。 “模型蒸馏”有时也被称为“知识蒸馏”,是将大型 AI 模型(完整的 DeepSeek R1 有 6710 亿个参数)尽可能多地将其知识转移到较小的模型(例如 15 亿个参数)的过程。这不是一个完美的过程,蒸馏后的模型不如完整模型那么强大——但其较小的尺寸使其可以直接在消费级硬件上运行(而不是花费数万美元的专用 AI 硬件)。 来源 |
>>: Caviar 宣布推出受比特币启发的 iPhone 16 Pro 系列,采用 24k 黄金打造
HMD 在 MWC 上发布了 Fusion X1 之后,又推出了多款功能手机。该公司发布了四款功能手...
印度是 WhatsApp 目前最大的市场,拥有超过 5 亿用户。因此,WhatsApp 希望让自...
Tecno 在过去几年中取得了巨大的进步,该品牌又迎来了成功的一年。作为与 Infinix 和 i...
Redmi 14C 5G 是一款售价 10,000 卢比的手机,据称拥有该领域最高效的 4nm 芯片...
三星使用 FE(又名“粉丝版”)系列推出具有不错的高端规格且价格低于其旗舰产品的设备,现在看来华硕是...
三星已开始试运行一项名为 Galaxy Trade-In Program 的新手机以旧换新计划。该计...
Oppo 于 11 月在中国发布了 Reno13 和 Reno13 Pro 中端产品,今天该公司印度...
小米刚刚向印度市场推出了其最新旗舰设备,并宣布将于 3 月 19 日开始接受预订。小米 15 和小米...
今天是 OnePlus 13 系列的国际发布日。我们将见证 OnePlus 13 的全球发布和 On...
上周,三星在印度推出了 Galaxy A06 5G,现在看来该国还将推出另外两款产品:Galaxy ...
新款三星 Galaxy S25 Ultra 独家使用了新款 Gorilla Armor 2 玻璃,这...
Realme 于去年 11 月推出了 GT 7 Pro,今天,该品牌如约推出了 Racing Edi...
如果您在下一次升级时考虑使用新的 Galaxy S25 系列,并且大屏幕体验是必须的,那么您可能想知...
还记得几周前有消息泄露了一款苹果 iPhone 17 Pro,它配备了遮阳板式摄像头吗?事实证明那不...
小米将于本周在中国发布备受期待的 15 Ultra 旗舰产品,随后在巴塞罗那 MWC 上进行全球发布...