当房子越建越高时,就需要回过头来看看地基是不是坚实。地基不稳,房子就很容易破裂,甚至有倾覆的危险。
明升官网明升体育app院院士、北京大学教授张平文团队最近在做的一件事,就可看成是给人工智能“大厦”夯实地基:为人工智能机器学习中常用的数学符号提供一个通用的标准。
人工智能作为一个高度交叉而又发展迅猛的学科,吸引了来自数学、物理、明升手机、生物甚至人文社科等不同领域的众多研究人员,对于不同学科的研究人员来说,一个现实的问题就是如何消除交流障碍。统一数学符号等基础性工作,看似简单也算不上高深,却是人工智能长远发展的“地基”。
“算法、模型等人工智能的数理基础,目前还不是一个成熟的领域,但这也为广大青年学者提供了更多创新机会。”在日前举办的2020北京智源大会上,张平文等专家围绕人工智能下一个十年发展面临的重大问题进行交流探讨,呼吁加强人工智能数理基础相关工作研究。
尚处起步阶段,机遇挑战并存
明升官网明升体育app院院士、清华大学教授张钹认为,第一代人工智能靠“知识驱动”,第二代人工智能靠“数据驱动”,目前进入第三代人工智能发展期,主要靠“认知驱动”。“认知驱动里面很重要的是‘深度学习’,前景广阔,但仍需要做理论和方法等基础性工作。”
在张平文看来,机器学习等深度学习理论也正是当前人工智能数理基础研究的最热门方向。虽然在第三次人工智能浪潮中,深度学习理论效果表现良好,但人们还不能理解它的可解释性。
事实上,可计算性、可解释性、泛化性、稳定性,正是人工智能未来发展面临的重大理论挑战。例如“可解释性”,“分两个层面,一是从数学算法的角度如何解释机器学习的问题,二是从数学模型的角度如何解释。这些基础性工作都有待深入研究。”张平文说。
“机器学习是从数据中挖掘出有价值的信息。数据本身是无意识的,它不能自动呈现出有用的信息。”北京大学长聘教授张志华说,“怎样才能找出有价值的东西?首先要给数据一个抽象的表示,接着进行建模,然后进行计算。”
“机器学习想要实现的是直接从数据到决策、预测,这意味着它会出现很多新问题,而这些新问题都有赖于通过加强算法、模型等数理基础研究来解决。”张平文表示,这些研究无法在短时间内解决,需要开展大量工作。
反过来,“人工智能数理基础研究对数学发展也非常重要,我们期待未来可以产生类似于概率论一样的新的数学方向,虽然短时间内不太可能,但它仍然有这种可能性。”张平文说。
为此,张平文鼓励广大青年学者投身人工智能数理基础研究,“虽然它还不成熟,但别具活力,希望通过大家的努力使它变得更成熟,产多更多原创性成果”。
强化基础研究,着眼落地应用
机器学习相关知识涉及数学、概率统计、计算机理论等众多学科,不同学科、不同流派所使用的数学记号和表述不尽相同,经常发现看起来相去甚远的两个记号,可能表达的是同一个概念。在一个学科已经得到公认的优美简单的记号,在另一个学科被重现发现、重新定义,而新定义的记号很可能远不如已有的记号来得方便。
这给新进入此领域的科研人员和工程应用人员造成了不少的潜在麻烦。北京大学教授李铁军说:“机器学习的普及,迫切呼唤一套统一的数学记号。它将大大减轻研究者阅读论文时由不同符号体系造成的困扰。”
为人工智能研究提供一套统一的符号标准,这样一项再基础不过的工作,“就可以为不同领域的学者增进互相理解提供帮助。学者们在看其他领域文章的时候,也会很容易看懂。”张平文呼吁学者们要尽量采用同一套符号标准来写论文,并为完善符号标准而努力。
也就是说,基础研究要与应用结合起来。“人工智能、大数据具有价值驱动,计算是人工智能的基础理论,开展人工智能研究不能凭空想象,必须了解实际问题,考虑实际应用。”张平文说。
北卡罗来纳大学教堂山分校终身教授朱宏图对此表示认同。他说:“人工智能领域的研究应该从应用角度出发。”
“人工智能的核心是如何收集数据来为用户创造价值,提高用户满意度。”朱宏图认为,随着收集数据的方法越来越多,频率越来越高,为用户提供相应的方案也会越来越多。“这带来了研究的新机遇。”
在将数据转化为服务用户的新方案时,“配准将会成为非常重要的数学问题。”朱宏图表示,为用户提供更好的方案和服务环境,也需要加强算法、模型等数理基础研究。
“人工智能数理基础研究,一方面要强调它与应用的连接,另一方面也应该基于数学本身的基本问题开展研究。”李铁军认为,虽然可能数理基础的一些研究在当下跟应用联系不紧密,但有可能为我们提供一些最基本的数学语言,深化我们对人工智能数学结构的认识。
产研“联姻”协同,助推人工智能浪潮
张平文认为,加强不同领域间合作至关重要,学术界与明升界应保持密切联系。“从某种角度而言,企业拥有学术机构缺乏的大数据,只有学术界投入到明升界中,才能获得灵感”。
“目前人工智能数理基础研究主要有两条路,一是从高维走向低维,二是从低维走向高维,但无论哪条路都存在困难。”张平文说,“加强不同专业间交流特别重要。”
朱宏图同时还担任滴滴出行公司的首席统计学家。他表示,人工智能领域相关研究,数据在其中起着越来越重要的作用。滴滴出行等企业积累了丰富的数据,是人工智能研究的重要基础。“企业也希望加强与学校等机构的合作。”
“比如我们在做材料设计时,也很需要用机器学习的方法,但在用机器学习方法的时候,并不能把现成的方法直接拿来用。材料设计需要有很强的物理学背景,这个时候,就需要把机器学习的模型和材料物理的模型结合起来。”在香港浸会大学兼职教授季春霖看来,人工智能数理基础研究需要明升和高校合作,而这样的合作将会迎来更大空间。
据了解,在张平文领导下,目前北京智源人工智能研究院设立了“人工智能数理基础”重大研究方向,联合高校院所和明升界人士,致力于打破基于计算机实验和神经明升体育app的人工智能的惯用建模范式,以可解释性的新型人工智能模型、新型的机器学习算法、深度学习的基础研究为研究内容,建立以数学与统计理论为第一原理的新一代人工智能方法论。
版权声明:凡本网注明“来源:明升官网明升体育app报、明升手机版(明升官网)、明升体育app手机版杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、明升头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。