近期,杭州的AI领域取得了令人瞩目的进展,这一成就不仅在国内引起了广泛的关注,也在国际上产生了深远的影响。杭州AI的一夜成名,被网友们形象地比喻为“小小的杭州,干掉美国三大科技巨头”,这并非夸张之词,而是对杭州AI产业实力的一种肯定。
AI四小龙与六小虎
在科技圈,AI技术的发展一直受到广泛关注。中国的AI四小龙——商汤、旷视、云从、依图科技,以及大模型六小虎——智谱、MiniMax、月之暗面、百川、零一万物、阶跃星辰,都是AI领域内的佼佼者。现在,杭州也拥有了属于自己的AI三支柱,这一成就标志着杭州在AI领域的崛起。
AI时代底层逻辑的变革
AI大模型的智能化程度与其支持的场景数量成正比,这直接关系到所需的芯片和算力。随着全球算力需求的增加,半导体公司如英伟达市值飙升至三万亿美元。即便全球半导体公司的全部算力也无法满足AI市场对算力需求的增长。
幻方量化的DeepSeek-V3
在这样的背景下,杭州的AI创业公司幻方量化发布了参数量高达671B的大模型DeepSeek-V3,这一参数量达到了行业领先水平。更令人惊讶的是,DeepSeek-V3仅用了2048块GPU训练了2个月,总花费仅为557.6万美元,相比之下,OpenAI的GPT-4o训练成本约为1亿美元,且至少需要在10000个GPU的计算集群上训练。幻方量化的这一成就,无疑给AI市场带来了巨大的冲击。
DeepSeek-V3的技术优势
幻方量化之所以能够在资源受限的情况下完成高难度的大模型训练,主要归功于其采用的高效推理多头潜在注意力(MLA)和用于经济训练的DeepSeekMoE技术。多Token预测目标(MTP)提高了模型性能,推测解码技术的应用加速了推理过程。DeepSeek-V3还采用了一种创新方法,将长思维链模型的推理能力通过蒸馏技术转移到标准模型上。
分布式推理的前景
分布式推理的概念已经有人提出,如OpenAI的联合创始人IlyaSutskever,他认为AI预训练时代将终结。杭州的企业在这一领域取得了领先地位,用技术给美国企业上了一课。DeepSeek-V3的成功,不仅让AI世界享受到了拼多多式的快乐,也展示了中国AI产业的进步速度。
宇树和毫微的创新
除了DeepSeek-V3,杭州的宇树(Unitree)和毫微(NanoLabs)也在国际上引起了关注。宇树发布的B2-W机器狗视频展示了其在各种复杂地形下的能力,包括爬山、涉水、越障等,甚至能够完成高难度的杂技动作。B2-W机器狗不仅是一个高价宠物,它更适合在安防巡检、勘测探索、公共救援、医疗防疫陪护等专业领域应用,减少人员事故风险。
杭州AI产业的国际影响力
杭州AI产业的迅速发展,不仅在国内引起了轰动,也在国际上产生了影响。美国企业曾将中国大模型视为廉价替代品,但现在,杭州的企业在分布式推理领域先拔头筹,用技术证明了自己的实力。杭州AI产业的进步,不仅是技术上的突破,也是中国在全球科技竞争中地位提升的体现。
本文来自作者[scysry]投稿,不代表杨森号立场,如若转载,请注明出处:https://vip.scysry.com/zixue/202412-103989.html
评论列表(4条)
我是杨森号的签约作者“scysry”!
希望本篇文章《力压美国巨头 这几家企业如何成为行业新星 杭州企业的崛起 (打压美国企业)》能对你有所帮助!
本站[杨森号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:近期,杭州的AI领域取得了令人瞩目的进展,这一成就不仅在国内引起了广泛的关注,也在国际上产生了深远的影响,杭州AI的一夜成名,被网友们形象地比喻为,小小的杭州,干掉美国三大科技...