小米在AI大模型领域的战略调整与投资
近期,小米在人工智能大模型领域的动作引起了业界的广泛关注。这家曾经在大模型布局上相对保守的公司,似乎已经开始加快步伐。根据第一财经的消息,小米通过高薪吸引AI行业的重要人才,罗福莉——DeepSeek开源大模型DeepSeek-V2的关键开发者——即将加入小米,并可能领导其大模型团队。这一举措显示了小米在AI领域加大投资的决心,同时也表明了公司创始人雷军对于小米在大模型领域发力较晚的担忧。
罗福莉的加入预示着小米在大模型领域的重要一步。据知情人士透露,雷军亲自下场挖人,罗福莉的薪酬可能高达千万元人民币。这一高薪聘请不仅体现了罗福莉在AI领域的技术实力,也符合小米的营销策略。罗福莉在北京大学计算语言学研究所获得硕士学位,并在NLP领域有着显著的成就,包括在ACL上发表8篇本文,并因此成为知乎红人。她的加入,无疑将为小米在AI大模型领域的发展带来新的活力。
小米的大模型团队在成立之初就拥有了6500张GPU资源,显示出公司对于这一领域的重视。12月26日,界面新闻报道小米正在搭建自己的GPU万卡集群,进一步证实了小米在大模型领域的投入。
罗福莉的背景和成就
罗福莉以其在大模型圈内的95后天才少女之称而闻名。她在北京大学计算语言学研究所取得硕士学位,并在NLP国际顶级会议ACL上发表了8篇本文,其中2篇为第一作者。她的学术成就和知乎红人的身份,使其成为了AI行业的知名人物。
硕士毕业后,罗福莉加入了阿里达摩院机器智能实验室,并主导开发了多语言预训练模型VECO,该模型被纳入阿里达摩院深度语言模型体系AliceMind。她还主导了AliceMind的开源工作。2022年,罗福莉离开阿里达摩院,加入幻方量化从事深度学习相关策略建模和算法研究,并最终加入DeepSeek,参与了MoE大模型DeepSeek-V2的研发。
小米的战略调整
小米在大模型领域的战略调整,体现了公司对于轻量化和本地部署的重视。AI实验室主任王斌曾表示,小米不搞AI的军备竞赛,而是认为轻量级模型也有其市场空间和优势。小米的大模型团队目标是开发通用语言大模型,初步目标是几百亿参数的基座模型,并根据前期的结果决定后续投入。
与友商的竞争
与此同时,其他厂商如vivo也在推动大模型的发展。vivo在2023年发布了自研的蓝心大模型矩阵,涵盖了十亿、百亿、千亿不同参数量级的语言大模型。相较之下,小米对于预训练大模型显得更加谨慎。雷军在年度演讲中提到,小米选择主力突破轻量化和本地部署,这也是考虑到同步造车的情况下,保护现金流量和成本控制的重要性。
小米的用户需求和产品定位
对于小米而言,用户在芯片性能、摄像头技术和屏幕显示等方面的需求较高。尽管端侧大模型在效果上可能难以与云端大模型相比,但在隐私保护、低延迟和成本控制方面具有优势。随着AIAgent与人机交互的融合,国产手机市场的竞争将更加激烈,特别是在高端手机市场,AI已成为区分手机高低端的关键因素。IDC预测,到2025年,中国新一代AI手机市场出货量将达到1.1亿部。
总结
小米的这一战略调整,不仅反映了公司对AI大模型领域的重视,也显示了小米在市场竞争中寻求差异化的决心。罗福莉的加入,以及小米在GPU资源和大模型团队建设上的投入,预示着小米在AI领域将会有更多的动作和创新。
本文来自作者[scysry]投稿,不代表杨森号立场,如若转载,请注明出处:https://vip.scysry.com/zixue/202412-103322.html
评论列表(4条)
我是杨森号的签约作者“scysry”!
希望本篇文章《引发业界震动 成功招揽95后天才少女 互联网巨头雷军豪掷千万年薪 (引发业界震动的原因)》能对你有所帮助!
本站[杨森号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:小米在AI大模型领域的战略调整与投资近期,小米在人工智能大模型领域的动作引起了业界的广泛关注,这家曾经在大模型布局上相对保守的公司,似乎已经开始加快步伐,根据第一财经的消息,小...