ChatGPT的出现,使人工智能成为当前最热门的话题,整个社会对人工智能可以发挥的作用,产生了空前高涨的期待。目前,我国10亿级参数规模以上大模型已超80个,仅次于美国。其中,通用大模型较多,应用型大模型较少。作为布局大模型较早的中国科技公司,华为从2020年开始立项做华为云盘古大模型(以下简称“盘古大模型”),到2021年4月发布,盘古大模型一直颇受业界关注。与百度的文心一言、阿里的通义千问不同,盘古大模型强调在细分场景的落地应用,主要解决商业环境中低成本大规模定制的问题,用AI赋能千行百业。
“盘古药物分子大模型助力发现世界40年来首个抗生素”、“盘古气象大模型相比传统数值预测方法速度提升10000倍,能够提供秒级的全球气象预报”……7日,华为云盘古大模型迎来重大升级。华为常务董事、华为云CEO张平安在华为开发者大会2023上发布了华为云盘古大模型3.0,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。
会上,华为云盘古大模型3.0首次明确定位“为行业而生”;盘古大模型的全栈创新和行业大模型的“炼成术”也首次对外公布。张平安表示,“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行,我坚信大模型将重塑千行百业,而每一个开发者都将是改变世界的英雄。”面对核心技术容易被美国“卡脖子”的被动局面,华为持续发力基础研究。盘古大模型从芯片使能、AI框架、AI平台全栈创新,实现极致效能,打造世界AI另一极。未来,AI for Industries或将是人工智能新的爆发点。
【资料图】
AI开发从“作坊式”到“工业化”升级 赋能千行百业
IDC预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能进入大规模落地应用关键期。“人工智能的发展,关键是要‘走深向实’,赋能产业升级。” 华为轮值董事长胡厚崑在6日召开的世界人工智能大会上如是说。
通用大模型是人类最高智慧“大脑”,工业领域大模型则是“手”和“脚”。为了解决当前人工智能开发者“小作坊模式”应用开发效率较低的问题,盘古大模型带来了一系列解决方案。华为本次升级的盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构,几乎涵盖当前人工智能的各个主流方向,其核心定位是为各行各业进行赋能。
在“5+N+X”三层架构中,L0提供5大基础模型,包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、预测大模型、科学计算大模型。其中,盘古NLP大模型是业界首个千亿参数中文语言预训练模型,是最接近人类中文理解能力的AI大模型。盘古CV大模型首次兼顾了图像判别与生成能力,在ImageNet 1%、10%数据集上的小样本分类精度上,达到了业界最高水平。
L1是基于基础大模型+行业知识,提供适配行业特征的N个行业大模型;包括政务,金融,制造,药物分子,矿山,铁路,气象等。
L2提供X个场景模型服务,更加专注于某个具体的应用场景或特定业务,提供开箱即用的模型服务。
华为云推出的盘古大模型解决了传统AI作坊式开发模式下不能解决的AI规模化、产业化的问题,改变了传统的“小作坊开发模式”,让AI开发走向新的“工业化开发模式”。如今,盘古大模型已经深入金融、制造、政务、电力、煤矿、医疗、铁路等10多个行业,支撑400多个业务场景的AI应用落地。
在煤矿行业,盘古矿山大模型已经在全国 8 个矿井规模使用。原来井下异常看不清、看不全,需要人工巡检;现在盘古矿山大模型可覆盖矿山7大业务流程1000+场景,让煤矿工人做到“穿西装打领带工作”,实现矿下无人少人安全作业。
在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上,可以在秒级时间内完成未来全球一个小时到7天的天气预报。7月6日,国际科技期刊《nature》刊发盘古气象大模型文章,审稿人称,“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
在交通运输行业,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,综合准确性高达99.8%。通过盘古铁路大模型的 “慧眼”,无故障图片的筛除率为95%,效率得以提升。
在医药行业,原来一款新药研发需要10年时间、花费10亿美金;现在通过盘古药物分子大模型,可将先导药物研发周期缩短至1个月,研发成本降低70%。值得一提的是,盘古药物分子大模型助力西交大一附院刘冰教授团队发现世界40年来首个抗生素(肉桂酰菌素),目前已进入临床阶段。
在政务方面,盘古政务大模型学习了超过20万条政务数据,包括12345热线、政策文件、政务百科等。大模型能够精准地理解民众咨询意图,把老百姓的话语转化为政府办事的语言,打造双向奔赴的便民服务。
在金融行业,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。
在制造业领域,生产和供应链作为制造业的核心环节,传统计划方式很难考虑到全局。盘古制造大模型根据知识资产,通过复杂的演算分析,找到降本增效的最优解。原来3小时完成1天的生产计划,现在1分钟生成3天的排产计划。
行业重塑,技术扎根,开放同飞 打造世界AI另一极
科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国。人工智能大模型领域的全球竞争已趋白热化。
面对核心技术容易被美国“卡脖子”的被动局面,业内专家表示,大模型是新型关键基础设施的底座之一,大模型的竞争也是国家科技战略的竞争,中国需要布局全栈自主创新的大模型产品,同时要构建国产化算力。
华为本次发布的盘古大模型3.0,围绕行业重塑,技术扎根,开放同飞三大方向,持续打造核心竞争力,为更加专注于具体的应用场景或特定业务。目前,华为云AI在各行业有超过1000个项目,盘古大模型能够更好地落地在行业主业务场景。
大模型的创新不仅仅是模型自身的创新,而是需要全栈的创新,对算力,算子,计算框架及平台进行全面优化。华为方面向记者透露,通过持续研发,目前盘古大模型在性能、深度、架构及数据增强方面均进行了升级。盘古大模型实现了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore、AI开发生产线ModelArts的全栈自主创新,实现极致效能,打造世界AI另一极。
此外,端到端的技术优化为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力,使盘古大模型训练效率对比业界主流GPU平均提升1.1倍。
同时,昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。
盘古大模型要帮助每个企业、每个人都拥有自己的专家助手。 华为云提供易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,希望与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。
据悉,华为云盘古研发团队由华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE Fellow田奇教授带领,包括多位华为天才少年,博士比例超过60%。田奇教授表示,“大模型已经成为科研创新走向产业应用的重要枢纽。未来,AI for Industries或将是人工智能新的爆发点。”(中国经济网记者 王惠绵)
关键词: