每经记者 陈婷 每经编辑 刘雪梅
【资料图】
“两百多年前我们有了机器,所以人类进入了机械化时代,几十年前有了电子设备,所以人类进入电子化时代。未来几十年,算法是推动技术创新、科研社会发展的主要动力,未来我们进入算法时代。”2月25日,在2023全球人工智能开发者先锋大会开幕式上,中国科学院院士、上海算法创新研究院院长鄂维南说。
在演讲中,他分析了我国在人工智能领域的优势和劣势。他认为,我国人工智能领域注意力更多集中在工程层面,算法层面原始创新动力很明显不足。顶尖算法人才比较缺乏,更重要的是缺乏整个算法创新体系。
“但是我们也有优势,我们有大量基础人才,有广泛的应用场景,在有限领域里有一定的先发优势。”鄂维南表示。
值得一提的是,他还聊到了时下大火的ChatGPT。在他看来,我国人工智能发展的数据量巨大,场景极具挑战性,理想的情况就是利用挑战性场景推动底层算法、系统的原始创新。但实际情况是,我们的注意力很多时候更多集中在应用和跟风上,“ChatGPT一出来,我们马上就跟上了,有很多企业来扶植它,这样的情况并不是我们希望看到的。”
2月25日、26日,2023年全球人工智能开发者先锋大会(GAIDC)在上海临港举办,《每日经济新闻》记者现场获悉,包括鄂维南院士在内,阿里云创始人王坚、商汤科技董事长兼CEO徐立等领域内顶尖专家都热聊起了ChatGpt。
“ChatGPT的成功给了大家完全不一样的思考。”在开幕式上,商汤科技董事长兼CEO徐立在回答现场提问时表示,“生成式的内容,不光是可以解决单一目标下的优化问题,是给出很多的问题不同的解法的路径。”
对于基于人工智能大模型的生成式AI应用的商业化前景,徐立也表达了自己的看法。
他表示,OpenAI打开了一个出口,让ChatGPT很快成为第一个突破上亿用户的触达终端的应用,在这个行业里的下游诸多应用都会随着这种大模型的思维模式而改变。
“人工智能对于开发者来说是一种模式的变化,下一步对很多内容创作者来说,一样会面临工作模式的巨大变化,未来人们不需要具备底层的制作能力,而是需要更多畅想、连接、协同的能力,这些能力才是跟AI协同共创的核心商业能力。”徐立认为,伴随着生产力模型的变革,可能会产生类似于Photoshop这样的互联网SaaS应用和工具链,或者基于这些工具链新生成的社区,也就是可能会拥有下一阶段的“小红书”、B站等一系列互联网应用。
而在中国工程院院士、阿里云创始人王坚看来,ChatGPT表面上是应用的发展,但本质上其背后的方法论发生了一次天翻地覆的变化。
王坚表示,在十多年前,互联网就已经存在,但当时的互联网并没有成为开发者必须依赖的东西。当年超级计算机的资源只有极少数开发者可以获取。计算能力是所有开发者的瓶颈。但云计算给世界带来了天翻地覆的变化。
“算力从哪里来,随着技术的进步,可能每年都会不一样,每十年不一样。但是用云计算的方式为开发者提供算力,让他们在全世界范围能够公平地获取算力,这一点是不会改变的。”王坚说,在他看来,从做云计算的角度看,计算能力的获取再也不会变成开发者的瓶颈。
对于ChatGPT,在王坚看来,在过去十几年,人工智能真正发生的天翻地覆变化是方法论趋向统一,他认为,语言的差别不再重要,这是一次非常革命性的变化。ChatGPT表面上是应用的发展,本质上是其背后的方法论发生了变化。
“事实上今天我们看到的ChatGPT,没有超出当年比尔·盖茨对一台PC的希望,当时比尔·盖茨说,希望PC能够像跟人一样的方法来与用户交流,只不过当时只是PC时代,没有互联网带来的数据,也没有数据带来的人工智能,所以他这个愿景没有实现。”他认为,比尔·盖茨的愿景在今天已经被实现了,“尽管PC时代过去,我们应该创造下一个时代。”
大模型,是ChatGPT的基座,2023全球人工智能开发者先锋大会期间,不少顶尖专家也对大模型的发展发表了自己的见解。
昇思MindSpore业务总经理丁诚给出了一个形象的比喻。丁诚认为,大语言模型数据结构很简单,是矩阵成,它特点是参数量特别大,就好比人类具备了超级大脑,“接下去大模型训练过程中是通过大数据大算力来喂,在这个过程中好比本身聪明绝顶拥有超级大脑的人接受了博览群书,接受了各种知识的训练,这样的人类到各行各业里应用,都是大有可为的。”
在2月26日下午的“智领未来:大模型技术与应用论坛”上,对于大模型,百度飞桨总架构师于佃海给出了他的定义。
于佃海表示,AI预训练大模型,是深度学习崛起以来最重要的一次技术变革。大模型不只是模型参数规模更大,同时也对应着学习机制和AI研发应用范式的改变。自监督学习模式突破了数据标注的困境,可以从海量数据中学习到丰富的通用知识。基于大模型,只需要通过模型微调或是提示等方式,就可以在广泛下游任务中取得优异效果,极大降低了AI开发和应用的门槛。
复旦大学计算机学院教授邱锡鹏也在论坛上表示:“从早期的预训练模型,一直到GPT3,GPT3的规模远超过之前的模型,之前的模型是千万到亿级别,GPT3直接到了千亿级别。”
他提到,当模型从小规模发展到大规模的时候,发展到一定阶段会涌现出一些原来小模型上观测不到的能力,“我们把这一能力称为‘涌现’。”
邱锡鹏表示,对大模型,主要观察数学建模能力、上下文的理解能力、学习能力等,会发现大概在百亿规模之后就会发生突变。
“能力不再是线性增长,之前是线性或者类线性增长,随着规模增长,收益或者边际效应越来越弱的,但是突然在百亿规模之后,能力就会大幅度增长。我们把这些能力归结为在模型大了以后,就涌现出来了。”
那么,大模型到底有多大?分水岭在哪?
“一个标志性的分水岭就是百亿规模,百亿以下我们不再认为是大模型。”邱锡鹏表示,“我们自己开发一个智能涌现能力的模型,至少应该是百亿起步的。”
邱锡鹏表示,如今大模型已经承载了非常多的知识,但是文本知识写完了之后,下一步怎么发展,一个非常重要的就是要把大语言模型和现实世界打通,让它与现实世界不断交互,才能学到更多的文本无法表达的知识。
2月20日,国内第一个对话式大型语言模型MOSS便是由邱锡鹏团队发布至公开平台。在2023全球人工智能开发者先锋大会上,邱锡鹏也谈到了MOSS。
邱锡鹏透露:“MOSS大模型计划在一个月之内,和人类不断交互,进行优化,顺利的话将于3月底开源。”
值得关注的是,在论坛现场,邱锡鹏提到了ChatGPT与实现通用人工智能之间的关系。
“通用人工智能应当具备听说读写、思考推理以及行动等能力,就ChatGPT目前的表现来看,目前虽然不具备听觉、视觉能力,但我相信未来接入这方面的能力不是特别难的事情。这样的话,可以把它当成类似智能体,以及把它和现实世界打通。”邱锡鹏说。
他认为,ChatGPT展示出了非常好的通向人工智能的潜力,“也就是说ChatGPT的出现,或者说涌现出来的很多能力,大大缩短了我们此前实现通用人工智能的时间预期。”