1. 首页
  2. 公司简介 / 用户投稿

小米加速AI大模型布局:高薪聘请DeepSeek-V2开发者罗福莉,搭建GPU万卡集群

天才劳模雷军_雷军天才程序员_

曾经在大型AI模型布局上相对“佛系”的小米,也开始加快步伐。近日,小米花高年薪聘请了AI行业的大佬。

12月20日,据第一财经报道,开源大模型-V2的关键开发者罗福利将加盟小米。她可能在小米AI实验室工作,领导小米大模型团队。

据知情人士透露,雷军担心小米在大机型领域发展较晚,因此亲自前去挖人。罗福利的薪资水平可能在数千万元。

据界面新闻12月26日消息,小米开始自建GPU万卡集群。小米大模型团队成立时拥有6500个GPU资源。

种种迹象表明,小米明年将大力投资大机型。

01.罗福利是谁?

12月初,小红书博主AI Dance透露,雷军近期亲自交流或采访了多家LLM(大语言模型)公司的CTO和核心算法人才。

被雷军重金招揽的罗芙丽,被大模圈称为“1995年后天才少女”。

罗福利毕业于北京大学计算语言学研究所,获硕士学位。 2019年,颜二在NLP(自然语言处理)国际顶级会议ACL发表论文8篇,其中第一作者2篇,并登上知乎热搜。当时,经常在知乎上回答问题的罗福利,也一夜之间成为了“知乎名人”。

硕士毕业后,罗福利顶着“8篇ACL论文作者”的光环加入阿里巴巴达摩院机器智能实验室。在此期间,她主导开发了多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),并纳入阿里巴巴达摩院深度语言模型体系。此外,她还领导了开源工作。

2022年,罗福利离开阿里巴巴达摩院,加入环泉量化(一家量化对冲基金公司),从事深度学习相关的策略建模和算法研究。之后,罗福利作为深度学习研究员加入,参与了教育部大型模型-V2的开发。

天才劳模雷军__雷军天才程序员

▲图片来源/罗福利公众号

罗芙丽加入小米不仅因为她过硬的技术实力,还因为她“天才AI少女”、“95后AI萝莉”的标签,这也符合小米的“营销团队”。

今年5月,-V2模型发布后,罗芙丽在知乎上回答了她如何看待该模型的问题。与GPT4的价格相比,她称-V2为“性价比之王”。这种“接地气”的互动可以说是相当符合小米的风格。

罗馥莉将加盟小米的消息,证实了小米将加大在大机型领域投入的传言。

2023年4月,小米在AI实验室成立了大型模型团队。同年11月接受媒体采访时,AI实验室主任王斌表示,小米“不会在AI上搞军备竞赛”。 “内部认为轻量化车型也有自己的市场空间,在某些特定任务上相比千亿级的大车型也能有一定的优势。”

当时,王斌还透露,“团队的目标仍然是大型通用语言模型。第一步的目标基础模型参数是百亿,然后根据前期爬坡的结果来决定下一步的投资。”

相比之下,友好的商人正在一步步前进。在2023年11月的vivo开发者大会上,vivo发布了自主研发的蓝心大模型矩阵,由十亿、百亿、千亿三个参数级别的五个大语言模型组成。

在“烧录”大型预训练模型方面,小米比其他厂商更加谨慎。

在2023年度演讲中,雷军公开表示:“我们做大模型的思路可能和很多公司不一样,我们主要突破的是轻量化和本地化部署。”

这也是同时还在造车的小米在成本上必须优先保住“现金王”的原因。

在保证巨大算力的前提下,云端的大型模型需要按调用付费,成本极其高昂。然而,客户端的大型模型是在本地计算的。如果大部分AI推理场景放在客户端,可以大大节省云算力开支。

对于一向以产品为主的小米来说,小米用户在芯片性能、拍照技术、屏幕显示等方面都有着相对更高的要求,因此端侧大机型虽然在效果上很难与云端抗衡而其在隐私保护、低时延、成本控制等方面的优势也可以为其产品的“性价比”提供保障。

然而,随着各厂商芯片算力的不断提升,AI Agent与手机硬件的融合已经势不可挡。 AI Agent能够在人机交互中更准确地理解用户需求,更高效地完成任务。

尤其是,随着国产手机价格突破4000元大关,AI支持有无将成为区分高低端手机的关键。 IDC预计,2025年中国新一代AI手机市场出货量将达到1.18亿台,同比增长59.8%,整体市场份额将达到40.7%。

在此背景下,小米手机如果不在AI方面深挖护城河,其高端战略将面临巨大挑战。

02.为什么小米的大机型先到后到?

据媒体人士透露,此次雷军亲自去招揽人才,是因为担心小米在大机型领域来不及。看来雷军已经开始担心小米并不像友商那样在大机型上“激进”。

今年年底,各大手机厂商的旗舰手机发布会上,AI能力的介绍占据了很大篇幅。 vivo不遗余力地宣传蓝心机型,荣耀CEO赵明甚至在发布会现场请AI特工点咖啡。

小米在宣传自家手机的AI能力方面似乎低调得多。在小米15的新品发布会上,其AI功能较为常规的AI书写、AI语音识别等功能。在讲解上,小米也更侧重于性能车SU7 Ultra,对于大车型和AI能力的介绍显得有些平淡。

这也引起了市场的诸多猜测:小米手机的AI能力够硬核吗?

事实上,小米在AI布局上有天然的场景和必要性。除了手机之外,小米还是全球最大的物联网设备制造商。它有很多设备可以连接“小爱同学”智能体,也可以用于信息采集和场景联动。

此外,小米还拥有自研系统The Paper OS,未来将面向“人车”全生态布局。对于小米来说,大机型的困难或许并不在于认识到其必要性,而更多的是如何将大机型与小米产品以及不同的系统生态充分融合。

事实上,小米发展AI现在还不算太晚。雷军在2023年8月的年度演讲中表示,小米从2016年7月开始布局AI。

_雷军天才程序员_天才劳模雷军

2017年,小米正式成立AI实验室。当时,团队只有4人。仅用4个月时间,小米就推出了第一代语音识别系统,并公开了电视语音交互中端到端语音识别的研究成果。当时,小米将其定义为中国端到端语音识别技术的最佳识别率,语音助手“小爱同学”也同步推出。

此后,小米持续加大在AI领域的研发投入。 2019年,小米开放了人工智能平台,开发者可以利用小米的AI技术来开发和发布应用。

2020年,雷军在小米内部信中宣布,未来十年,小米的核心战略将升级为“手机×AIoT”。

此后,小米发布了自研芯片澎湃C1,成立了自动驾驶团队、小米机器人实验室,进一步深化在AI领域的布局。雷军在去年8月的年度演讲中表示,AI相关团队的数量已超过3000人。

未来,随着罗馥莉的加入,小米将继续加大AI方面的布局。

11月12日,小米大机型团队宣布,小米大机型已升级至第二代。大机型在10大能力维度的性能较上一代平均提升45%以上。同时,参数矩阵也得到了丰富,拥有从0.3B到30B的多个参数大小,可以适应云端和边缘设备的各个方面。

在去年底的“智能未来大会”上,AI实验室大模型团队负责人栾健曾表示,小米认为云大模型的结合在未来设计中至关重要。

从第二代大模型的参数规模来看,30B级别已经可以满足云场景的需求,并且具有相当扎实的零样本/上下文学习或者一些泛化能力。小米对于大机型的适配场景可以逐渐不再局限于终端侧。

以上部分内容由“文心一言”整理拓展,转载请注明出处:https://www.2sg.net.cn//62322.html

联系我们

在线咨询:点击这里给我发消息

微信号:手机号码调用

工作日:9:30-18:30,节假日休息