实际使用感受如何？来看看这份《人工智能大模型体验报告》-当前快看

近年来，人工智能技术迎来了新一轮大变革，其中由OpenAI开发的ChatGPT在推出短短2个月后便成为了月活破亿的应用。随着海外科技巨头微软、谷歌、Meta等加大投入，国内科技企业如百度、华为、阿里等纷纷布局，人工智能大模型的发展日新月异。

为直观感受我国当前主流科技企业所推出的大模型产品的现状、优势和特点，新华社研究院中国企业发展研究中心于今年4月启动了人工智能产业创新活力研究。本次研究设置了用户体验项目，抓取了05月22日—05月26日数据，通过人机互动提问等形式，对国内主流大模型进行使用体验评测，旨在为科技企业调整努力方向提供参考。

(相关资料图)

在综合指数评价方面，本次评测选取4大维度（基础能力、智商测试、情商测试、工作提效能力）、36个子能力，共300个问题，对目前主流大模型产品进行测试，并邀请相关专家组成评测团队深入分析各个产品的语义理解、知识储备、逻辑能力等，最终得出各厂商的大模型综合指数评价。

在评价规则上，课题组以各个大模型对参与测评的题目回答完成度，进行了综合考量，其中评测规则分为：答案较为完美，内容可在实际场景中直接使用；基本可用，可在实际场景中使用；调整可用，但需人工进行调整后方可使用；大略可用，需要较多人工调整方可使用；不可用，答非所问、语言不通等五个层级。

注：基于评测条件、评测时间等限制，本次评测结果存在一定主观性，未来将进一步优化完善评测模型，提供更精确结果。

通过围绕四个维度的综合测试，课题组发现，由OpenAI开发的Chat-GPT系列模型各项指标表现优异，且Chat-GPT4.0版本各项能力在3.5版本的基础上均有一定程度提升。而由百度开发的人工智能大模型文心一言表现较为抢眼，是目前国内自主研发的大模型中具有优势的产品。其余大模型产品也在基础能力方面表现优良，但面对较复杂的工作内容或情商环境仍有不同程度的进步空间。

针对各维度能力测评，该报告还给出了相应的案例展示和分析。

在基础能力部分，百度文心一言表现最为抢眼，讯飞星火、阿里巴巴通义千问、智谱ChatGLM表现优良；商汤商量、Vicuna-13B表现尚佳。

在智商测试部分，百度文心一言在该环节意外超过ChatGPT3.5，表现突出，阿里巴巴通义千问分数接近GPT3.5，商汤商量、讯飞星火、智谱ChatGLM表现尚佳；Vicuna-13B表现有待改进。

在情商测试部分，百度文心一言表现最佳；阿里巴巴通义千问与讯飞星火表现优良；商汤商量、智谱ChatGLM表现尚可；Vicuna-13B表现一般。

在工作提效部分，百度文心一言与智谱ChatGLM最佳，讯飞星火次之；阿里巴巴通义千问及Vicuna-13B表现尚可；商汤商量表现一般。

研究发现，人工智能与各行业的深度融合是促进产业升级和转型的重要方式之一，“大模型+行业”的发展应用尤为重要。目前大模型在金融、工业、医疗等领域已经取得了显著的成果，如何为行业领域提供更为精准、更为高效的解决方案，成为大模型厂商未来弯道超车的机会。

报告指出，随着人工智能的地位和作用越来越重要，政府、企业和社会需要共同努力，各大厂商应投入更多资源，头部企业可以持续发力自研大模型，而专注于解决方案的行业厂商可以考虑通过深耕行业来彰显特色。

研判该报告的测评结果，浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林建议，国内大模型发展应从两方面着力，一方面是大语言模型，中文并非ChatGPT的强项，OpenAI主业在英语，所以中文大语言模型对于中国市场还是有发展空间的；另一方面则是在细分领域应用，比如编程、专业知识问答、中文PPT制作等，这些细分的功能领域才是未来大模型真正需要关注的领域，也是从单个应用转变为生态应用的关键。

扫码查看

AI大模型体验报告

↓↓↓

关键词：

实际使用感受如何？来看看这份《人工智能大模型体验报告》-当前快看	苹果手机通话杂音滋滋声怎么办（iphone听筒有杂音滋滋怎么办）\|当前要闻
南漳：水稻插秧忙沃野披绿装	今日视点：6月广州将有3次高温过程，下旬将受热带气旋影响
焦点速读：金陵体育：2022年度权益分派10派1.199987元股权登记日6月8日	天天热推荐：中国“黑黄金”打破美日40年垄断，抢回80%市场！外媒：防不胜防
焦点简讯:防城港市防城区山里孩子过别样儿童节	世界报道:北京出让4宗地收金95亿元 45家房企抢夺北京顺义地块
与你“童”行｜如果可以，“我想永远做个孩子”-世界快看	每日聚焦：开封市禹王台区：多措并举赴全力抢收夏粮保丰收
大宗交易：机构账户买入科蓝软件778.4万元（06-01）	WTI原油日内大涨3%
公告精选丨四川路桥中标300亿元以上的重大工程项目；建发股份拟62.86亿元购买美凯龙股份并取得控制权-焦点信息	天天快播：全球财经连线｜通胀逐步降温欧美经济前景几何？
欧洲央行副行长：加息25个基点是“新常态”_世界报道	动态焦点:三爱健康集团(01889)：法院尚未就上诉作出判决
vivos6支持指纹解锁吗\|每日焦点	【环球报资讯】港股异动 \| 赤子城科技(09911)涨超7% 公司社交业务稳健增长精品游戏陆续上线打开变现空间
ESR(01821.HK)6月1日耗资464.1万港元回购40万股	沃尔沃雨刮器怎么拆（沃尔沃雨刮器的更换方法是什么？）环球热推荐
绿茵场上“嗨”起来！2023年全国“奔跑吧·少年”儿童青少年主题健身活动（河北会场）在张家口市启动每日速递	#大华·紫悦府汉文带你观澜时代，见证大华墅作！一墅擎启未来远见宏伟蓝图#大连 #大连房产 #大连同城
黑糯玉米的功效与作用（糯玉米的功效与作用）	全市范围清理整顿！举报电话公布全球今亮点
这位厦门小学生找到了！他的快乐会传染！\|天天简讯	ul认证机构有几家（ul认证机构）
天天快讯:2023西安城市旅游观光车游览线路	天猫618搭台，苹果不唱戏？全球首播不带货，百万人围观看了个寂寞当前焦点
今日热文：鱼儿_关于鱼儿简述	【当前独家】徐州2023年中考成绩查询时间+查询入口
白夫人_关于白夫人的介绍	会计处理和税务处理视同销售全球观速讯
世界快播：定向就业和非定向就业有区别_定向就业和非定向就业	吃鸡行动火线精英官网在哪下载最新官方下载安装地址全球速讯
今日关注：山西五台山景区端午节免费吗？	每日速看!风吹麦浪遍地黄，颗粒归仓丰收忙。昆山张浦满屏“麦”香
1日起多地执行输配电价新规：变了啥，谁受益？-天天热资讯	热门：筑牢粮食安全“压舱石” 书写“天府粮仓”南充答卷
当前速看：首批深蓝S7量产下线，长安首个零排放工厂在南京启用	【环球聚看点】海南省琼海市举办2023年青少年科技创新大会
天天百事通！静等雏鹰飞翔，金水六幼赴纬三路小学参加六一活动暨学生综合素质展	世界看热讯：【豫筑平安】“六一”快乐！警花姐姐为孩子们送上“安全大礼包”
每日观察!全省排查整治	当前视讯！瞭望 \| 一首新“黄河谣”，在山东黄河滩区响起
每日讯息!AutoNation聘请Thomas Szlosek担任执行副总裁兼首席财务官	Doinb爆料只差3%就成！随后被BLG否认此事，网友：这下尴尬了_世界热讯
全球热推荐：力量钻石(301071.SZ)累计回购66.83万股耗资5238.12万元	湖媒：雄鹿前锋波蒂斯对加盟湖人感兴趣想与湖人主教练哈姆重聚今日聚焦
菲尔-琼斯发文：感谢曼联球迷的支持和爱，周末我们一起支持曼联	半程西甲降级区，下赛季却能打欧冠！这就是杯主的底蕴_头条焦点
BBC：梅西将会很快做出对未来的决定，但他的下家肯定不会是巴萨	环球新消息丨保真吗西媒：收到沙特3年1.2亿欧报价，魔笛向皇马表示想离开
每日热点：极目漫观察\|牛来了，票黄了	美元兑加元汇率今日预期趋势：看跌（2023/6/1）
莱克斯顿男装旗舰店_莱克斯顿男装环球快消息	辅仁药业集团因生产、销售劣药清热解毒口服液被罚没超158万元
天天快报!被人类幼崽萌化的瞬间具体是什么情况	对故意毁坏财物行为规定的刑罚条件有哪些-精彩看点
追星人｜从未见过发射的航天人	大摩：予九毛九目标价23港元评级“增持”
聚辰股份(688123.SH)：制定更高的产品目标，开发满足不同等级的ISO 26262功能安全标准的汽车级EEPROM产品	热讯：最小的质数是几_最小的质数是多少
实时焦点：文化和旅游部发布暑期、汛期出游提醒	【观察】字母哥为何钦点雄鹿新帅？菜鸟教头压力巨大
“珠峰家乡”日喀则大打卡景点等你来	焦点报道:高温来袭！今年空调业有望“翻盘”
国道G239线沽源段交通安全设施精细化提升工程将开工-世界最新	全球观察：让中年女人动情的男人，身上大都有这3种“味道”
焦点短讯！5月零跑交付量达12058台环比增长超38%	移动营销AI进阶之路：超个性化营销+情感智能互动_世界视讯
中央网信办：严厉打击雇佣网络水军对企业进行诋毁、抹黑等行为_环球视讯	火场演练检验应急预案，2023全国安全生产月启动
360智脑发布大模型，开启Alot新时代	一图解码：众淼创科赴港IPO 背靠海尔的保险代理商业绩稳增_热闻
张译与张颂文的宣传图，把《狂飙》的“区别对待”体现得淋漓尽致	稳如磐石，助力物联网无限畅通——揭秘这款DTU产品为何如此稳定-最新资讯
合肥市包河区第五届“临工工匠”技能大赛举行_世界今亮点	坚持长期主义践行绿色发展，横琴人寿发布2022年度ESG报告
世界观点：刚提不久的北京BJ90简单升级一下奔驰GLS内饰中控以及按键移植	环球要闻：10月英国建筑业下滑几乎没有放缓
姜枣茶的正确做法视频_姜枣茶的正确做法	华为Pocket S折叠屏手机等升级鸿蒙HarmonyOS 3新体验
领克01 2023款 EM-F PM，油电混动，搭载1.5T+3挡DHT 环球新要闻	PS5版《街霸6》上架百亿补贴：售价低至326元！_全球资讯
哪个网贷可以分24期36期？网贷逾期有什么影响？	最新日语能力测试官方真题及标准答案精解_对于最新日语能力测试官方真题及标准答案精解简单介绍\|焦点资讯
巨化集团副总经理王晓宇一行莅临网盛生意宝考察交流世界热议	焦点速看：大南环高速前期工作正在推进，济南“三环”即将落下最后一子
建研院：子公司联合预中标3.42亿元工程项目	工信部副部长辛国斌：加强发展新能源产业推广新能源汽车、绿色智能船舶
南方航空: 南方航空H股公告-月报表天天速讯	渭南高新区行政审批服务局：多措并举提效能便民利企促发展环球快资讯
当前热门：最新日语能力测试1级词汇必备_对于最新日语能力测试1级词汇必备简单介绍	首次统筹开展投入产出调查！第五次全国经济普查这些新变化值得关注
【新视野】最新托福词汇科学快捷记忆手册_对于最新托福词汇科学快捷记忆手册简单介绍	徐锦江骑单车逃跑怎么回事？徐锦江骑单车逃跑做什么？天天微速讯
雨生红球藻虾青素精华市场报价_雨生红球藻虾青素\|世界今热点	世界看点：山西通报12款侵害用户权益APP 山西银行晋商银行在列
最资讯丨集团破产重整资产被轮番拍卖！众泰董事长辞职	江苏首个海洋生态环境损害赔偿替代修复示范基地启动

实际使用感受如何？来看看这份《人工智能大模型体验报告》-当前快看

相关阅读

精彩推送

每日推荐

天天热推荐：中国“黑黄金”打破美日40年垄断，抢回80%市场！外媒：防不胜防

要闻

资讯新闻