记者 钱玉娟 2月14日,大模子云奇迹商硅基流动(SilliconFlow)晓示皆集北京昇腾东说念主工智能贪图中心,全面支握基于昇腾算力的DeepSeek系列模子的特殊化集群部署。
此前,硅基流动大模子云奇迹平台SiliconCloud首发上线了基于昇腾算力的满血版DeepSeek R1/V3模子,领先走通了在国产芯片部署DeepSeek模子的旅途。
时刻倒回至春节假期的2月1日,华为云晓示皆集硅基流动推出基于昇腾云奇迹的DeepSeek R1/V3推理奇迹。彼时,华为云、硅基流动的官方公众号相隔一分钟官宣,标题均超越“首发”二字,内文用“连日攻坚”空洞了团队的竭力于。
首发
硅基流动首创东说念主袁进辉曾总结,硅基流动的时期中枢是提供一个推理引擎,主要向企业提供高性能LLM推理和考验责罚决议,匡助企业高效地部署AI期骗。DeepSeek V3是惊怖大家科技圈的开源、推理大模子,硅基流动与之适配提供奇迹尤其对口。
张开剩余85%在DeepSeek V3大模子发布前,DeepSeek首创东说念主梁文锋就曾问袁进辉,硅基流动要不要部署?彼时,梁文锋甚而给出了建议:最少20台H800(英伟达GPU芯片),80台最佳,10台也不错,即是有点慢。
袁进辉算了一笔账:一个月80台奇迹器的净消耗就得五六百万,“还不一定能用满,风险太大了”。他莫得下注。
看到DeepSeek创造一个又一个遗址,袁进辉着急且苦于莫得充沛的算力资源,直到一位共事突发奇想,“国产卡多,用国产卡吧”。
硅基流动向华为云主动提倡了配合想法。
华为收受自研的达芬奇架构,开发了昇腾910和昇腾310两款AI处理器芯片,而华为云又上线了昇腾AI云奇迹,于今约一年半时刻,面向企业提供一键接入获得AI算力的奇迹。
华为昇腾AI云奇迹有一个“百模千态”专区,其中除了华为自家的盘古大模子外,还能适配业界主流的上百个开源大模子,从而支撑企业和开发者更快速地创建我方的大模子期骗。
开源的DeepSeek何其火爆,接入想法让硅基流动和华为云一拍即合。华为云追究调配算力资源,硅基流动追究让模子在GPU上不错运转并具备问答材干,同期确保模子运转巩固、不赔本精度,且运转速率尽可能快。
2025年春节,硅基流动团队和华为云各业务团队险些无休,DeepSeek团队也在全程提供了许多告诫。
2月1日凌晨1点多,距离官宣基于华为昇腾的DeepSeek R1/V3推理奇迹上线还有10个多小时,硅基流动的一位高管发了一条一又友圈:平台接入了DeepSeek系列模子,且API奇迹价钱与DeepSeek官网同价。
2月1日今日,“硅基流动”的微信指数从往时的险些为0环比飙升了8831.35%。那时,硅基流动是DeepSeek官方以外,第一个提供基于国产芯片的671B满血模子MaaS云奇迹的平台。
趁着热度,硅基流动也发布了一波招聘贪图,其中绽开的视觉生成推理引擎工程师、异构硬件适配工程师、录用研发工程师等全职岗亭有15个,还有与生成式AI有关的算法、平台前端、平台后端等标的的实习工程师职位8个。
API奇迹竞争暗涌
“要酌量并发,以及后续并发是否有轨则。”一位与华为云配合接入DeepSeek-R1的AI期骗厂商追究东说念主称,这是通盘要接入的平台企业大约期骗家具都会酌量的事情,背后的贫寒主要由华为云方面在责罚。
布局DeepSeek API奇迹,不仅仅腾讯、阿里、百度等巨头争抢的买卖,不少模子翻新企业也参与其中。
提供模子云奇迹的供应商虽多,但上述硅基流动高管看到,还是有模子测试有关东说念主士给用户提供了一些判断的依据,比如供应商提供的是否为原版的671B参数边界?供应商提供奇迹的高下文窗口(言语模子在进行臆测或生成文本时,所酌量的前一个词元即Token或文本片断的大小范围)大小是否为平常的64K+?终末还有AI接济编程苦求的通过情况,供应商对AI模子时期的期骗是否受TPM(开采不停,一般在10W台以上)的轨则。
陈天楚在浙江大学ARClab追究大模子有关筹商,他看到,接入DeepSeek的各个云厂商,面向的客户、官宣的资本箝制和订价贪图有分手。举例,有的厂商提供满血版,有的则是量化压缩版,还有提供蒸馏后的小模子。
陈天楚以为,除了提供圭表化的模子API奇迹外,云厂商间的较量主要集聚在能否提供个性化奇迹。像硅基流动就在上线671B的DeepSeek V3/R1旗舰模子后,又上线了6款DeepSeek R1蒸馏版模子,其中的8B、7B、1.5B模子免费,企业或个东说念主用户、开发者使用模子或基于模子开发AI期骗时,能径直调用硅基流动的SiliconCloud平台上的API,绵薄易用。
为止2月13日,有来自模子测试东说念主士的扫尾反馈,在提供DeepSeek API奇迹的主流供应商中,和华为云深度配合的硅基流动,其AI奇迹反馈的推理、生成以及平均速率,不仅优于承载压力过大的DeepSeek官方,更与腾讯云、阿里云等厂商拉开了距离。
“+DeepSeek”后果待定
收货于春节假期的突击作战,年后上班第一天(2月5日),华为推出了基于原生鸿蒙操作系统的小艺助手App,既接入了DeepSeek模子推理材干,还在“智能体”选项中上架了DeepSeek-R1的Beta版。
短短5天后,华为智高东说念主机纯血鸿蒙版小艺App的DeepSeek-R1智能体升级为郑再版,新增“联网搜索”功能,学问库变得更丰富,时效性也更强。
2月13日,记者在广州一家华为手机线下销售门店体验。通盘更新为纯血鸿蒙系统的手机上,小艺从往时在系统内可被叫醒的贤惠语音助手奇迹,变成一个独处的期骗家具。进入小艺App,便不错与“她”问答对话,也能在第三方智能体中径直点击DeepSeek-R1,进入深度念念考对话,无须下载第三方App。
华为领有自研的盘古AI大模子,小艺即是通过盘古大模子考验出来的。纯血鸿蒙中的小艺,在成为一个独处期骗后,其使用界面中有超越DeepSeek的方面。
记者看到,门店销售东说念主员手中的参考长途上,除了有“怎么说”“怎么作念”来体验小艺,还有盘古大模子分手等闲数据模子的一些对比,会强调盘古大模子领有扎根汉文的特殊上风。对DeepSeek,材料并未说起。
上述AI期骗厂商追究东说念主在接管经济不雅察网记者采访时,给出了家具接入DeepSeek模子材干后关键目的的变化。
“大模子幻觉变少,任务得胜率变高。”该追究东说念主泄漏,其团队在用DeepSeek的模子践诺某项任务时,失败率基本为0。接入这一明星大模子后,模子幻觉有所减少,但他指出,大模子幻觉动作共性问题,仍有待责罚。
其实,该追究东说念主地点的AI企业也有无数插足翻新自研的通用大模子以及针对行业期骗的专属大模子。他告诉记者,现在业内集体涌向DeepSeek,普遍作念法并非是用DeepSeek系列模子与自己现存模子交融,而是用DeepSeek的模子来开拓新的期骗场景。
这位追究东说念主与陈天楚有共鸣,DeepSeek是推理模子,实效性并非其的上风,但却不错通过模子云奇迹商等AI基础步调赋能。
一位平台高管跟许多主流大模子厂参谋论过智能体在各个硬件末端上买通的问题,在她看来,这亦然DeepSeek改日时期落地以及刻下业内“+DeepSeek”风潮后的发展标的,“每个硬件都可能成为智能体的进口,通过践诺东说念主类的任务来考验专属个东说念主的智能体”。
为什么是硅基流动
硅基流动首创东说念主袁进辉是又名趋承创业者,他在2017年修复的一流科技(OneFlow),在国内2023年涌起AI大模子风潮后,估值一度超数亿好意思元。
同庚,好意思团皆集首创东说念主王慧文创业了大模子公司光年以外,他提倡通过并购OneFlow的步地,邀请袁进辉加入光年以外成为皆集首创东说念主。光年以外后被好意思团收购,袁进辉在2023年8月晓示追想到AI基础步调边界连接创业,创立了硅基流动。
硅基即芯片,而流动有软件之意,这一称号也与袁进辉此前创立的一流科技酿成呼应,让芯片的算力在软件基础上跑起来。
加快AGI普惠东说念主类,是硅基流动官方公众号上的简介,袁进辉不啻一次在公开场所暗示,其目的是为广泛的开发者提供基于AI模子进行期骗翻新的关键“铲子”,让路发者杀青Token解放。
硅基流动前年年中推出SiliconCloud后,不仅日均调用量超千亿Token,针对多个主流模子的奇迹还提倡了恒久免费。
“面向C端用户的大模子App,以后都全面免费了。”袁进辉2月14日暗示,国内模子厂商很难对C端用户收取订阅费,多是厂商我方使命算力资本。
在袁进辉看来,模子厂商只须获得用户后才有成见去变现。
数据自满赌钱app下载,DeepSeek的期骗访谒使用量正呈现指数级上涨,成为现在最快龙套3000万日活跃用户量的期骗门径。
发布于:北京市