“无论是伏羲、女娲,还是光语和未来更多的可信大模型,都是通过对复杂世界的建模,来理解和预测真实的世界。”漆远和团队摩拳擦掌,“我们做不一样的东西,不是‘为了新而新’,而是为了构建未来的通用人工智能和应用,解决真实世界的问题”。
第二件事是复旦智算平台CFFF的上线。考虑到人工智能计算底层能力的重要性,漆远2021年下半年加盟复旦时,提议建设计算平台,2022年以来参与推动CFFF智算异构平台建设和管理,下了复旦在人工智能浪潮中的一步“先手棋”。
“第一件事是做科研。认识了很好的科学家,大家合作,做交叉学科的研究。”与复旦和国内各学科领域的科学家交流合作,碰撞思想火花,这让漆远欣喜。
“今天的人工智能突破不仅来自底层原理的创新,更有面向社会需求的产品驱动。社会需要的不仅是理论文章的发表或者商业模式的创新,而是科技创新与产业创新深度融合,是基于第一性原理的突破。”在上智院联合多个企业联合技术攻关的同时,漆远带领团队创建和孵化公司,做产品落地。一个在打造的样本就是他创建的可信大模型公司——无限光年。在今年的世界人工智能大会,无限光年将发布百亿参数的可信光语大模型。这一大模型在金融和医疗垂直领域测试超越OPENAI的万亿参数大模型GPT4-Turbo。
谈及联盟成立,漆远犹是欣喜,因为“将人工智能与实际应用相结合”是他一直以来的坚持与探索。“大模型要成为一个重要的新质生产力工具,就必须瞄准实际产业落地,切切实实地发挥作用。”漆远说,“AI赋能千行百业,垂直产业化落地应用是关键。”
十年前,怀揣着“让人工智能有用”的想法,漆远带领团队把核心机器学习系统第一次从200万参数百倍提升到几亿参数,取得了大规模的业务效果提升,彰显出数据、算法和工程能力的集成变革,正是今天人工智能圈津津乐道的Scaling law(注:尺度定律)的体现。
千行百业,每一行有各自特点,每一业有各自要求。比如金融行业中的会计、财务、投资,以及建筑设计等领域都具有严谨的要求与规则。“目前大模型落地,我觉得最大的问题就是:猛一看好像有用,真的一用又不行。”漆远指出,针对大模型现有的不靠谱、解释性不高、成本高等特点,一个真正有效的解决方向不是现在流行的检索增强生成技术,这只是打补丁的方法,而是把概率的神经网络推理与逻辑的符号计算结合起来,类似于《快思考与慢思考》书里所说的人类系统一与系统二能力的结合,走向“灰盒”大模型。
更多的时间,漆远往返于上智院与复旦张江校区,与团队们交流;飞行于各座城市,与合作者们畅谈。“说不忙是假的,但是非常充实。”他的脚步不曾停歇,把焦虑化为动力,视野愈见深远。
梅雨季,阴雨连绵的天气会持续多久?“暴力雨”可否更提早、更精准地预测?亚热带风暴对海运的影响有多大?复旦人的“老朋友”——升级后的“伏羲”,可以“透露天机”。它针对极端天气优化,提升台风、极端降水等更多灾害性场景的预测精度,助力城市规划与生产生活。
漆远对未来通用人工智能的发展充满信心。在他看来,上海是一座海纳百川的城市,知名高校、科研机构、行业龙头云集于此,拥有得天独厚的科创环境。复旦发展AI4S魄力大、目光远,学科与师资优势众多。身处这所高校,身处这座城市,漆远期待为人工智能的发展和落地贡献更大力量。
从学生到教授,从工程师到管理者,再到教授、院长,和初创公司的创始人,无论身份如何改变,漆远不变的是人工智能的初心。“我一直喜欢做人工智能,做人工智能的原创科技和成果转化。”漆远说,“天时地利人和,让我来到复旦。复旦的支持和包容的环境,让我得到超出想象的机遇,做‘自由而有用’的成果。”
AI已是“热词中的热词”,关于AI的新闻频登热搜热榜。面对层出不穷的新成果,即便在这条路上走了20多年,漆远也难免有些焦虑。“我现在每天拿AI总结AI。”他笑道,“用大模型总结一天的大模型的新发展,然后来学习。”
今年9月新学期复旦将推出“AI大课”,漆远参与打造“AI-BEST”课程体系中的“AI-T”垂直领域应用课程,上智院6楼将成为课程实训主要空间。“我们在项目实习中培养学生。不是传统的‘拿着锤子找钉子’,而是在项目中提升学生人工智能的实践能力和理论知识。”漆远介绍,“只有知识还不够,要真正地理解社会、产业的需求在哪里,以逆向思维牵引底层能力的培养,比如新能源、新材料、金融、健康、农业等等。从这些领域倒推、打造AI工具,构建垂直领域的可信大模型,这是未来越来越重要的方向。”
从硕士期间在国际会议上发表用遗传算法调整神经网络超参的指纹识别文章,到后来的人脸识别与贝叶斯机器学习,再到新计算生物学和材料设计,到工业界后关注大数据大算力的融合,回学术界推动AI4S,到无限光年公司的产品落地……见证和推动人工智能的发展与应用,漆远对AI的想法也逐步深化,有了螺旋式的上升。
而“AI爱因斯坦”也正是AI for Science(注:科学智能,下文简称AI4S)的一个关键目标。科学智能在加速求解已知的物理方程中已经发挥重要作用,但是科学智能更需要结合已知知识规则与数据,既减少对数据对算力的严重依赖,提升推理预测的精准性,更可以根据数据来调整知识规则,提出崭新的科学理论。
漆远认为,scaling law还有红利,但是基于transformer(注:变压器)自回归架构的大模型不足够走到通用人工智能,无论是从AI技术本身角度还是从能耗的角度而言。未来要要把人工智能的逻辑推理为代表的符号主义和深度学习为代表的联结主义结合在一起,融合知识规则、数字世界与物理世界里的数据,去探索与发现世界里的未知规律。今天的深度学习是对数据的模拟和压缩,擅长对观测数据的概率内插预测,并不擅长对数据之外的外插推演,更不擅长多步的逻辑推演。而爱因斯坦的大脑,作为人类智能一个巅峰体现,结合有限的物理观测数据、自己的“合成数据”和黎曼几何等数学工具,提出狭义和广义相对论,适用于广阔的宇宙。漆远认为实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”,发现复杂世界的未知规律。
与AI对话,欣赏与传播AI生成的文本、图片与视频……AI已经为人们的生活带来便利与乐趣。但是“所有的大模型都是‘做梦的机器’,都有幻觉的特点”,漆远坦言,“幻觉和幻想类似,在情感对话和艺术创作里可以发挥作用。但是如果想把大模型作为生产力工具,在科研、医学、金融等领域的核心业务里发挥重要作用,大模型的幻觉就是个大问题,可能会违背基础规律,导致差之毫厘,谬以千里。”“从微观的分子,到宏观的人体表型、到更宏观的气象气候和复杂的经济金融系统,我们需要AI大模型做出精准预测,给出靠谱的答案,甚至发现未知的规律。”
在上海市与复旦的支持下,上海科学智能研究院成立,打造有组织科研的灵活机制与载体。这是第三件让漆远欣喜的事。“不仅做科研,培养人才,还在推进产业化落地。上智院现在的发展速度超越了我原来的规划期望。”
“现在大模型通过庞大的规模达到的惊人功能,对世界产生很大震撼。但是Scaling law的红利不会一直下去,同时幻觉问题不解决,大模型就不能在金融、医疗、制造等垂直行业很好地落地。”
棋牌十大他曾是一名教授,而后去了产业界,做推荐、风控等智能产品落地。2021年,他从产业界重返学界,来到复旦,成为中国高校最大的云上智算平台-CFFF、伏羲气象大模型、女娲生命科学大模型“背后的男人”。而他的创业梦也正在路上,一个大模型创业公司——无限光年,在他的带领下初露峥嵘。
十年后,凭借强大澎湃的算力,一个个参数规模更大的大模型被各国科学家训练出来,漆远团队的“伏羲”“女娲”也崭露头角。大模型如雨后春笋,推动人工智能如火如荼,日益成为时代的重大机遇与热门方向。
坐落于徐汇滨江的上智院,一群思维活跃的青年科学家和工程师在地球科学、气候政策、生命科学、物质科学等领域施展才能。“李昊、程远等年轻老师非常能干。去年举办的第一届世界智能科学大赛也吸引了各类人才加入。他们的创新能力非常强。”
他在努力打通从底层科研的原始创新到产业应用的创新全链条,探索AI赋能千行百业的变革性技术。他是上海科学智能研究院(下文简称:上智院)院长、复旦大学浩清特聘教授、无限光年创始人漆远。
“在AI 1.0时代,从风控到搜索、推荐,每个具体任务都训练出一个模型,聚焦同一个任务或领域的具体任务。”漆远说,“在今天的AI 2.0时代,大模型有更好的泛化能力,可以在很多领域或某一类垂直领域的多项任务中发挥接近或超越人类的能力。我们看到了通用人工智能的火花。”
2004年他获得美国麻省理工学院机器学习领域博士,然后展开计算生物学博士后研究;随后,任教于普渡大学,开设该校计算机系的第一门机器学习、计算生物学课程;2014年回国,加入企业。2021年秋,漆远重返学界,加盟复旦大学。
“原来认为深度学习是‘黑盒子’,现在我们把逻辑推理的‘白盒子’跟深度学习结合起来,就变成‘灰盒子’了。”漆远笑着解释说,“原来是‘黑盒子’关在那里面,你完全不知道深度学习网络为什么就给你这个答案。而‘灰盒’大模型借助逻辑推理可以‘知其然,更知其所以然’。同时,从另外一个角度来看,‘灰盒’大模型可以用深度学习来减少不符合现实世界观测数据的规则。”
就在上个月初,全新升级、面向产业应用的“伏羲”系列气象大模型2.0发布,复旦、上智院联合中远海运、国家气候中心、上海科创集团等13家单位联合成立智能气象创新生态联盟,推动智能气象领域的产学研用深度融合。
明天(7月4日),汇聚全球顶尖科学家“最强大脑”的2024世界人工智能大会将在上海世博中心拉开帷幕。在当天下午的“人工智能:科研范式变革与产业发展”主题论坛上,漆远领衔的重大科研成果——百亿参数的可信光语大模型将正式亮相,第二届世界科学智能大赛也将启动。会前,我们采访了漆远,听他谈通用人工智能与“灰盒”大模型。
要让各行业的复杂场景成为AI发挥核心作用的新战场,无论是在金融保险、风电能源,还是远洋运输、医疗制药的场景,需要将系统的行业知识、推理逻辑和决策机制与大模型结合。“灰盒”大模型既是通用人工智能的大方向,更是大模型在垂直领域里深度渗透、真正解决实际问题的利器。