最近,美国人工智能企业OpenAI研发的聊天机器人程序ChatGPT“火”遍全球,人工智能再度引发行业热议。
新当选的第十四届全国政协委员、民建四川省委副主委、西南财经大学大数据研究院院长寇纲在2月26日接受红星新闻记者采访时表示,今年参加全国两会,他带去的提案关注人工智能领域,建议大力发展自主创新的“人工智能通用基石模型”。
(资料图片仅供参考)
“近两年来,以OpenAI等机构为代表,GPT3等人工智能通用基石模型获得全球关注,它在文本生成、图像生成、音频生成、视频生成、虚拟人、元宇宙等场景均有着丰富应用场景。”寇纲看来,我国目前发展人工智能通用基石模型,亟待解决技术、算力、生态、法律等方面的问题。
全国政协委员寇纲
算力资源调配协同能力有待加强
产业生态待完善
“在人工智能大模型领域,底层架构软硬件几乎都被国外公司垄断,同时,高质量的数据集已经成为制约我国人工智能领域发展的瓶颈之一,而国外数据集很多限制国内IP或直接不向国内用户提供服务。”在寇纲看来,抢滩人工智能领域,拼的就是技术,我国的自主研发能力亟待提升。
人工智能技术对算力提出了全新要求和挑战。寇纲认为,我国算力资源调配协同能力有待加强。据他分析,人工智能通用基石模型的开发需要强大的算力支撑,我国算力基础设施虽然规模雄厚,但当前各地算力使用存在波峰、波谷,无法实现跨省域的动态调配,各地区人工智能计算中心相对独立,未能形成跨区域的联合科研和应用创新、资源互补。
算力方面还面临的“窘境”是,我国各超算中心使用的前端系统不同,规则也不同,专业化、高品质服务仍旧缺乏。而在使用端,很多中小企业、科研单位囿于高昂成本,面临算力不足。
技术和算力之外,更需要完善的产业生态。寇纲道出了存在的问题。当前,我国人工智能大模型的研发成了少数机构的竞赛,在此过程中,相互之间的模仿和竞争效应大于协同和合作效应,“这对于一项基础研究的开拓来说是资源的浪费。”
潜在的法律风险也不容忽视。“由于大模型依托海量数据库信息存在,且对信息、数据来源无法进行事实核查,可能存在个人数据与商业秘密泄露和提供虛假信息两大隐患,对于一些受著作权保护的文本、视频、代码等,如果没有经过权利主体的授权,直接获取、修改、拼凑,可能涉及新型版权侵权。”寇纲说。
现实“尴尬”如何破?
亟需打出一套“组合拳”
针对我国在技术研发存在的短板,寇纲建议,加大人工智能基础领域自主研发创新扶持。
围绕上述建议的细化举措是,由工信部和科技部牵头,出台激励和引导人工智能大模型关键技术攻关和应用生态建设专项政策,实施应急重大科技专项,加快技术攻关、系统研发和应用推广;通过科技部、自然基金委等发布专项支持高质量人工智能数据集建设,严格把控标注规范、标注质量及更新频率;构建平台和生态系统,建立高校、科研机构与企业开展联合创新的机制,促进技术成果转化。
瞄准算力方面存在的问题,寇纲建议,应实现全国一体化算力网络统筹调度。比如,在使用端,探索建立面向中小微企业、科研单位的合理付费算力共享机制,共同促进技术的发展和资源的节约。
当前,我国布局了不少算力平台,寇纲建议将各地分布的超算、智算、人工智能计算中心节点通过专线连接,形成全国范围内一体化感知、分配、调度人工智能算力网络,在此基础上实现资源弹性分配。他还建议统一超算前端系统,打通不同系统和应用之间的壁垒,实现一键登录及新老系统的数据互通,提升客户体验。
我国的人工智能产业生态正在形成,然而,如何深入推动人工智能基础模型创新生态建设?这是解决从“1-100”的问题,而市场主体培育将成为第一步。
寇纲建议,孵化一批真正面向市场需求的创业公司,打破行业垄断。此外,可在国家机构监管和宏观把控的前提下,将政府数据对白名单企业、机构、高校适当开放,探索面向城市治理等领域的大模型应用和服务,通过数据银行、数据信托等模式赋能行业。
如何应对人工智能带来的潜在法律法规风险?在寇纲看来,应加快互联网相关法律法规修订和伦理规范制定,明确人工智能通用基石模型及生成式AI技术和应用中的法律底线和红线问题,加快人工智能通用基石模型带来的知识产权保护研究,推进AI内容监控平台建设。
红星新闻记者 叶燕 宋嘉问