今天的人工智能还不算完美,安全隐患、失灵易错.....这些都掣肘着人工智能的应用和发展。
10多年来,清华大学计算机系教授、人工智能研究院副院长朱军致力于解决人工智能安全性问题,在他看来,做科研,并不是以成果转化作为直接目的,只是到了一定阶段,我们觉得成果技术有用,才会最终推向市场。
日前,朱军获得第二十五届中国科协求是杰出青年成果转化奖,他突破了经典的贝叶斯基础理论和关键技术,提出扩散模型的高效算法,通过成果转化孵化国家级专精特新“小巨人”企业,为安全可靠的人工智能发展奠定坚实基础。
(相关资料图)
5年突破基础原理
博士期间,朱军做的研究课题便是机器学习与贝叶斯理论。贝叶斯方法是自然语言处理、机器学习、图像识别等人工智能领域的重要基础。
在人工智能应用中,“不确定性”是一大问题。例如无人驾驶,其环境和系统就存在很多我们未知的随机因素,基于概率的贝叶斯理论方法可以给出最优决策。
经典贝叶斯理论已存在260余年,它有两大关键要素:先验分布和似然函数,过去,大家公认“非先验即似然”的框架,即通常是假设一个先验分布或是假设一个似然函数进行运算,2011年的图灵奖获得者Judea Pearl教授将概率统计引入人工智能,成为现代人工智能的重要理论基础。但是,在大数据环境下,贝叶斯学习面临着多方面的挑战。
“不是那么直接,例如诸多场景无法转换成先验分布或是似然函数,这种情况下,贝叶斯理论就失灵了。”朱军告诉《中国科学报》,他希望贝叶斯方法变得更灵活,在新的框架下,能够很容易考虑优化目标或领域知识。
有了初步的想法,朱军从一个个实际案例开始探索,为了有更深入的研究,朱军前往美国卡内基梅隆大学担任访问学者和博士后。
从博士到博士后的5年里,一个个微小案例逐渐在朱军头脑中组合成一幅广阔的理论图景。他试着做了一个整合和推广:把经典的贝叶斯推理看成最优化问题,在最优化的框架下找出后验分布,针对目标做约束、根据需要进行模型预测 。
“作为目标函数直接引导机器学习,这样训练出的后验分布预测准确度更高、在性能上会有更好的表现。”朱军说。
这便是他后来提出的正则化贝叶斯理论:它基于贝叶斯定理的信息论描述, 通过引入后验正则化, 在变分优化的框架下可以灵活地考虑领域知识 (如基于逻辑表达式的知识) 或者学习任务优化的目标 (如最大间隔损失)。
朱军所提出的正则化贝叶斯理论,被认为是跳脱过去260余多年历史的经典贝叶斯“非先验即似然”框架,为贝叶斯推理提供第三维自由度,并带来了应用价值上的全新发展方向。在正则化贝叶斯框架下,朱军所提出的贝叶斯模型的最大间隔学习理论以及高效算法,将过去20多年来相互分离的两大方向进行了有机融合。
科研积累让转化“水到渠成”
2018年,朱军第一次尝试把基础科研推向应用市场。他的初衷是,“我做科研将近15年了,其中积累了一些算法和模型,究竟能不能有效、有没有用,能否真正解决行业问题,我想和实际场景做一个结合。”
朱军将目光聚焦在了人工智能安全场景中。
例如:智能手机中常用的“刷脸”功能,但一双“打印”的眼睛就能欺骗这些智能系统,解锁手机,给用户带来巨大风险。传统深度学习和神经网络的方法难以解决这一问题,朱军基于贝叶斯理论作出算法模型,可以发现具有欺骗性的“眼睛”,并进行防护,这一“人脸防火墙”已成功在银行应用。
科研界与产业界的对话“鸿沟”在朱军身上也发生了。
朱军告诉《中国科学报》,科研人员习惯的场景是问题定义比较明确、数据非常清晰,他们来解决问题。而现实世界并非如此,许多条件都不具备、数据缺损严重、任务定义不甚清晰。
朱军记得,在与一家头部工业厂商交流时,他和团队成员都觉得算法性能能够帮助厂商优化工艺参数、流程控制等,但在具体操作过程中,他发现,很多算法实现的前提条件都不存在,这让他们走了许多的弯路。“我们需要不断地与企业交流,了解对方需求,后来的合作才不断成熟起来。”
服务产业,还需要标准化,依托技术和理论,朱军建立了面向产业的通用平台——贝叶斯人工智能技术与平台,提供自动检测人工智能生成内容的技术能力和标准化服务能力。
近年来, 人工智能算法方面取得了很多突破进展。同时,也发展了性能良好的概率编程库, 支持贝叶斯深度学习模型的开发和部署,朱军团队研制的 “珠算”,是最早的系统支持贝叶斯深度学习的开源库之一,推动了深度学习与贝叶斯两者之间的有机融合。
基于一系列的技术,朱军团队成功孵化了一家人工智能公司,推动贝叶斯深度学习、可解释学习、AI对抗攻防等领域的前沿技术研究以及技术落地。
在朱军心里,科学研究和技术突破还是第一位,成果转化还让他收获了“意外”惊喜。“通过产学研合作,实际案例的反馈,让我们更容易找到真正有价值、重要的问题,或是对问题有着更深入的理解,促进科研的发展。”
艰难挑战呼吁更多人才加入
对朱军来说,从基础科研到成果转化,这条路并非一帆风顺。尝试5次、10次,最终才有1次成功是常态。
但面对挑战、迎接挑战,也早已深深刻在朱军的骨子里。在清华大学,朱军曾利用很多时间寻找和培养自己的兴趣,为学习英文思维方式,他在大一时选择了全英文物理课,确定了计算机方面的兴趣后,他大二开始进入实验室,了解如何开展一个课题,大三暑假选择了有挑战性的课题,用一个暑假的时间设计CPU。
也大约在这个时候,朱军正式确立从事人工智能研究的目标,之后,他前往微软亚洲研究院实习,最先接触的是概率图模型,这种模型将概率论与图论优美地融合在一起,深深吸引了朱军。对于他来说,选择做什么,体现一个人的科研品味,尽管有困难,但也不能降低水准。
如今,还有更多的挑战摆在朱军面前。
安全可靠的人工智能还需要从技术上进行突破,数据安全、系统安全也仍需要被关注。要想打造负责任的人工智能技术和应用,还需群策群力和产学研用的深度合作。
2019年,朱军作为发起人之一,联合清华大学和阿里巴巴发起了“安全AI挑战者计划”,主打“高难度、高创新、高趣味、高回报”的题目任务和运营,将参赛选手的思路方法沉淀在技术社区,旨在探索高校企业协同,为新基建建设培养一流的实战型网络安全人才。
“我们希望以竞赛的形式吸引更多年轻人关注人工智能安全,通过技术创新为人工智能保驾护航。”朱军很欣慰,该竞赛成效显著,全球26个国家或地区、900余家校企、上万名选手参与其中。
“越多人关注,对一个新赛道、新行业有越大的价值。”朱军说。