华为开发者大会2024(HDC 2024)现场
今年5月,大模型厂商你来我往,将价格战的氛围烘托至高点,希望以此来推动商业应用进程。
月之暗面创始人杨植麟在刚刚召开的北京智源大会表态称,今天AI在人的工作流中占比还很低,可能只有1%,未来AI做的事情会在某个时间节点超过人做的事情,这时就可能产生新的商业模式――不再是像今天在B端API调用上打价格战,而可能是一个普惠的AI,最终形成根据大模型产生的价值,从中分成的商业模式。
而通往“AI比人足够智能”终点的路径,多样却也局限。多样体现在,模型层面的模态、文本长度、AI原生、参数等依旧是大模型的兵家必争之地;而局限体现在,产业链整体的贯通程度还不明朗――所需的AI算力芯片短缺;大模型核心技术短期内难以实现跨跃性突破;应用层面难以找到适配的场景,或者说大模型能为应用提供的创新不足以打动用户。
6月21日,华为开发者大会2024(HDC 2024)在东莞篮球中心揭幕。期间,华为常务董事、华为云CEO张平安发布了***大模型5.0。张平安提到,***大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体内容生产和应用、高铁、钢铁、气象等领域进行了丰富的创新应用和落地实践。
可见,先让一只脚迈进场景,再结合场景需求不断迭代从而反哺模型层,最终完成技术与场景的对齐,是华为应对竞争的策略。
一只脚先迈进场景
于大模型而言,市场的需求一直都在。数字化市场服务平台爱分析发布的《中国市场大模型落地进展与趋势洞察》表示,目前大模型的主要场景分生成场景和决策场景。在预期价值更高的决策场景中,客户企业对大模型的专业性要求也水涨船高,往往倾向于自己着手调适。
在张平安看来,***大模型5.0在全系列、多模态、强思维三个方面进行了升级。其一是全系列升级。***大模型5.0包含不同参数规格的模型,以适配不同的业务场景。十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。
其次,***大模型5.0通过模态升级来更精准地定位物理世界,以适配不同的业务需求。张平安表示,最新的***大模型包括文本、图片、***、雷达、红外、遥感等更多模态。在图片和***识别方面,可支持10K超高分辨率;在内容生成方面,***用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。
最后,张平安提到,***大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。他称,复杂逻辑推理是大模型成为行业助手的关键,提升AI理解物理世界的核心能力,是保证大模型的稳定与效率的关键。
目前,基于业务场景的深化、业务需求的适配与模型核心能力的增强,***大模型已经得到了下游企业的正向反馈。
时代周报记者了解到,上海宝武钢铁热轧生产线每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,耗时约5天。而***大模型能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。
目前***大模型目前已在宝钢1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,***大模型还将应用于高炉场景,对炉温、铁水温度、硅含量等炉况进行仿真,从而***高炉精准控制,充分利用每一分能源,降低能源成本。
谁来充当大模型的底座?
大模型充当产业底座为各行各业送去了便利,那么在算力掣肘的情况下,谁能为大模型保驾护航?
事实上,大模型所需的暴力算力和稳定的服务运营环境,都离不***原生的支撑。据Gartner称,2023年70%的AI应用会基于云容器和Serverless(云原生开发)技术,在实际生产中,越来越多的AI业务,比如自动驾驶、NLP等,也正在转向容器化部署――相比于自行搭建开发平台、数据中心和GPU集群,模型厂商更倾向于在云服务平台这一现成的算力基础设施上完成模型的训练和推理。
尽管云原生与大模型天然适配,但随着模型参数的增大、形态更加多样化,云原生的计算、网络储存等基础架构也面临的迭代压力。
在华为开发者大会2024(HDC 2024)上,华为云CTO张宇昕表示,公司希望通过云系统创新,打造AI Native的云。
所谓AI Native,是指在华为云提供服务的层级结构中,除了底层提供硬件的算力基础之外,还包括AI开发平台及大模型,以及面向不同行业的AI云服务器。张宇昕称,全栈系统性创新,能够让大模型的数据准备、训练、推理、应用实现全流程的高效率和高性能。
华为诺亚方舟实验室主任姚骏从数据高效、参数高效和算力高效三个方面介绍了基于华为云展开的***大模型5.0的训练过程。他表示,数据合成技术已成为未来构建大模型核心竞争力的关键抓手。***大模型依托weak2strong数据合成技术,强化长序列、复杂推理等高阶数据分布。同时,结合类人的阶梯式数据课程,让模型以更加像人的方式从易到难地学习知识,实现更加可控、可预期的能力涌现。
从算力到存储,从开发工具到大模型本身,华为云所谓的全栈能力,实则暗合了其向来倾向于打造操作系统的逻辑――比起软硬件的打造,操作系统的独立与升级对用户产生的价值更加全面和彻底。
会上,华为常务董事、终端业务集团(BG)余承东介绍道,具有里程碑意义的鸿蒙系统新版本Harmony OS NEXT不再建立在安卓架构上,而是鸿蒙自研的底层架构,预计在2024年第四季度正式商用。他还表示,目前鸿蒙生态设备突破9亿台,5000个应用已全部加入鸿蒙生态。这也意味着,纯血鸿蒙即将与IOS、Android三分天下。
余承东介绍道,华为此次AI功能升级为系统级别,不仅仅停留在用户界面或应用层面,而是嵌入到操作系统的最基础层面。结合对各子系统进行智能化升级,构筑原生智能的系统底座,“有底座,有生态,才是有价值的操作系统”。
标签: #模型