新华网上海7月10日电(李硕)2020世界人工智能大会于7月9日至11日在上海召开。人工智能和信息科学领域国际知名学者、澳大利亚科学院院士陶大程接受新华网采访,畅谈人工智能重要技术——深度学习理论研究的新进展。
问:深度学习作为人工智能的关键技术之一,发挥着怎样的作用?
陶大程:说到深度学习,首先我们探讨一下,什么是人工智能?人工智能就是机器所展示出来的智能,人工智能的目的是用机器模仿人的智能,那就要求我们理解人的智能。人的智能包括四个方面:感知(Perceiving)、学习(Learning)、推理(Reasoning)和行为(Behaving)。所以我们对人工智能期望是:在符合人的伦理道德规范的框架下,能够有效地去实现并且整合这四个方面的智能。
目前,由于深度学习的突出表现,它已经渗透到了人工智能的各个子领域,比如机器视觉、自然语言处理、语音识别等。利用深度学习,我们取得了重要进展。深度学习的作用和优势主要体现在以下五个方面:第一,相对多阶段或多模块的传统模型来讲,深度学习模型大多是端到端,更加可靠,也更容易训练。第二,深度学习可以很容易地和传统的统计学习方法融合。第三,深度学习已经拥有成熟高效的通用实验平台,例如Pytorch和TensorFlow。第四,深度学习模型的训练方法非常简单、高效,包括通用性很强的梯度反向传播和随机梯度下降法。第五,深度学习模型规模庞大,表示能力极强,可以有效的通过数据驱动的方式去拟合任意分布。
问:目前您在深度学习领域有哪些研究进展?
陶大程:深度学习理论是我们接下来的研究重点之一。深度学习正在重塑我们的产业,其中很多方面对技术的安全性非常敏感,例如无人驾驶、药物设计、疾病的诊断等。然而,深度学习模型在很大程度上仍然还是一个“黑盒”,我们不完全了解深度学习的工作原理,不完全知道深度学习在什么时候会失败,这样我们很难去管理使用深度学习所带来的风险。而想解决这些问题,就需要建立深度学习理论。
我们的短期目标是解决深度神经网络在感知任务面临的数据集标注、泛化性等方面的问题,从而进一步提升网络在无标注样本、少标注样本、有噪声标注样本,以及训练和测试数据集不一致等条件下的模型学习效率和泛化能力,提升机器人的视觉感知能力。长期目标是研究多视觉感知任务协同的高效学习框架、探索新的表示和推理框架,关注模型的可解释性,研究机器人学习中的偏见问题,从而提升机器人的自主、高效、持续地学习、推理和行为能力。当然,不管是短期还是长期,我们都会十分关注基于深度学习的人工智能的基础理论。
问:公共数据开放对基础研究的意义如何?
陶大程:公共数据的开放对基础研究的意义非常大,高校和科研院所是基础研究的发源地,需要大量的实际数据,但是高校和研究机构自己并不拥有数据和标注,获取具有一定规模的高精度标注的数据是一个巨大的工程。因此,通过公共数据开放的实施,可以很好地帮助我们解决数据不足的问题,减少了不必要的、重复的用于数据获取方面的开销。
大量的公开数据就能支持高校和研究机构的从业者更好的探求深度学习模型和训练算法,提出更加有效的算法对相关领域数据进行建模,分析和挖掘。这些能够促进基础研究的进展,能够支撑实际产业的进展,最终能够惠及大众。
同时,数据的共享也需要充分满足数据监管的规定,避免出现伦理道德的问题。
问:上海发展人工智能的独特优势是什么?
陶大程:上海拥有世界一流的高等院校和研究机构,是进行人工智能创新研究的重要力量。作为一个千万级人口规模的国际化大都市,其庞大的市场蕴藏着丰富的人工智能应用场景和所需的大数据资源。在金融、汽车、集成电路、软件信息技术、生物医药等产业优势明显,与人工智能的深度融合可以促进产业的再造和升级,创造巨大的经济和社会价值。上海的传统基建发展较为成熟,以5G、数据中心、工业互联网等为代表的新基建发展迅猛,为后期人工智能产业的发展奠定了很好的基础。
同时,上海出台大量的相关政策。通过规划、资金等方面的支持充分利用技术创新资源、人才与市场优势打造人工智能聚集区。依托海量应用场景优势,上海在全国率先发布AI应用场景建设实施计划,引导社会各界开放AI场景,打造了一批世界级场景、城市级应用。
目前,上海已经确立了打造人工智能高地的目标,在国家新基建战略背景下,应进一步加强和扶持人工智能应用落地,为智能机器人及解决方案的落地提供更多的场景。另外,加强人工智能教育的普及,让全上海的每一个学生都有机会学习人工智能,让有潜力的学生可以继续深造,从而为智能时代孕育更多的人才。最后,需要进一步完善人工智能学科建设和人才培养的机制,更多的引进具备多学科知识结构背景的复合型人才,这些基础资源的投入将对自主研发人工智能前沿核心技术形成有效的支撑。
问:您已参加三届世界人工智能大会,感觉有什么变化吗?
陶大程:上海已经连续举办了三届世界人工智能大会,我也连续参加了三次。每一次到上海都有不一样的感受,一路走来,我觉得大会的品质和水平稳步提升,特别是去年我参加的大会,对会议的规模、规格、影响力、组织安排等方面都印象很深刻。这几届人工智能大会最深的印象可以用四个字表达:热、实、多、快。首先是越来越热,体现在参与机构、公司、人数越来越多,公众关注度和参与度也越来越高;其次是越来越实,人工智能开始从概念、实验室算法落地成为实际技术和产品,创造出实际商业和市场价值;第三是应用场景越来越多,产品形态越来越丰富;第四是技术发展和产品迭代速度越来越快,每年都能看到更新的前沿研究和更智能的产品。