专访国际人工智能理事会主席杨强:步入下一个AI寒冬的隐患

  • 时间:
  • 浏览:2

  “我现在就在做一线的事情,外理(人工智能)冷下去。”当被问及眼下你这人 波人工智能热潮是否会像历史上的几波一样昙花一现,国际人工智能理事会(IJCAI)主席、香港科技大学计算机科学与工程系主任杨强曾经告诉澎湃新闻记者。

  在他看来,如今的人工智能虽已突破了计算能力和数据资源的瓶颈,但隐患埋伏在4个 “偏”字上。这人 学术研究方面,国内高校实在现在日后开始设立人工智能学院和专业,五年内有望培育出一批AI人才,但不少大学直接将机器学习等同于人工智能,逻辑学、神经学等冷门领域研究和国外的差距很大。

  这人 地,人工智能产业发展越快,却太多地偏重计算机视觉在安防领域的布局,而且 需求未得到充分挖掘。

  近年来,杨强所做的什么都超陷得度1学习专用于4个 领域的框架,开拓出迁移学习、联邦学习等在4个 或4个 以上的领域之间进行的机器学习法子。

  他希望能让多方在不泄露本人数据隐私的状态下实现数据的共享和模型的共建,打破数据割裂的孤岛。在曾经的媒体媒体合作框架下,各方享有平等的地位和一定的“主权”,但走向“一起富裕”,就像4个 联邦国家。

  杨强正与微众银行等机构媒体媒体合作,试图用联邦学习打通人工智能应用的最后一一百公里,助于人工智能在金融、城市管理等领域的落地。“人工智能算法的数据得只有更新,就像一台好车这麼汽油。”

  这位1961年出生的计算机科学家是首位当选国际人工智能应学(AAAI)院士的华人。他似乎很擅长突然出现主流偏重的视角来看间题。这人 ,.我.我.我.我 在讨论机器能只有像人一样实现无监督的学习,杨强却认为无监督学习是这人 假象,人类的监督学习隐藏得陷得。原应分析算法做得足够好,就能像人类一样从简单的一张照片上提取到无数个标签。

  此外,人类的大脑“软件”得到无数称颂,但“硬件”优势却往往被忽略。杨强注意到,人浑身上下有的是精妙的传感器,帮助人脑获取信息。在硬件发展这麼跟上的状态下,光用算法实现通用的强人工智能只有是奢望。

  “只不过.我.我.我 现在有的是摘比较低垂的果子,还这麼深入去想。”杨强说道。

  以下为澎湃新闻记者与杨强的对话实录。

  联邦学习:人工智能应用的最后一一百公里

  澎湃新闻:能只有说从深度1学习到迁徙学习、联邦学习,居于这人 递进的关系?

  杨强:迁移学习和心邦学习之间的共性有的是在4个 或4个 以上的领域之间进行,这和深度1学习是截然不同的。深度1学习和日后的各种学习有的是在4个 领域进行。

  在4个 领域进行,第一层的考虑是知识的迁移共享,第二层考虑什么都加密和安全。

  比如说曾经4个 保险公司,它对车险的定价基于而且 很粗的维度,像驾驶员的年龄和车龄。为哪哪几个只有做这麼粗的定价?原应分析它对用户的了解非常少。原应分析4个 码农张三年纪很轻,但开车却很小心,你这人 点它就无法了解,也无法进行个性化。

  现在它能只有和4个 移动互联网媒体媒体合作协议。运营商那边有张三的行为数据,但对保险领域从不了解。它们两边前要媒体媒体合作,但又不你都都能否 把数据暴露给对方,以防失控和监管不严的间题。

  联邦学习恰恰什么都在这能只有帮忙,不交换数据,但能只有在重叠的数据上建立4个 更好的模型。

  澎湃新闻:目前联邦学习有哪哪几个落地场景?

  杨强:横向联邦学习的场景是各方有的是一累积用户数据,哪哪几个用户有的是一样,.我.我.我 能只有利用加密的共享共建模型来得到4个 更好的模型。而且你这人 模型从太多到所有用户的数据,.我.我.我 假设有800万的手机用户,我能 在顶端选比较有用的80万,建立起横向的模型,分散到上千万的用户。

  还4个 是纵向联邦学习,意思是4个 机构同样进入你这人 数据,而且维护不一样。比如4个 收集用户的年龄性别,自己收集用户的学习成绩和平时的衣食住行。

  具体到金融领域的案例,横向联邦学习的场景是什么都有家不同银行的维度是一样的,都了解信用、还款状态等信息,但用户是不一样的,原应分析它们居于不同的城市。

  而纵向联邦学习是同4个 城市,同样4个 用户,而且他在接受不同的金融服务。比如面对小微企业的贷款,.我.我.我 前要了解哪哪几个企业的税收状态和经营状态,但银行这麼这累积数据。.我.我.我 就能只有找而且 专门外理发票的机构来媒体媒体合作。

  除此之外,.我.我.我 也在探索而且 非常不一样的业务。举个例子,.我.我.我 跟4个 深圳的媒体媒体合作协议,.我.我.我 是做工地安全的视频检测,有这麼着火、工人有这麼戴帽子等等。但不同的工地、不同的公司不你都都能否 交换你这人 数据,就能只有用联邦学习来建立4个 联邦模型,曾经4个 工具要比单独的数据更靠谱。

  澎湃新闻:从实验室走向产业落地的困难主要有哪哪几个?

  杨强:联邦学习是4个 多方参与,什么都有首不难 在机制设计上保证每个联盟都实在受益,才有参与的兴趣。其次是.我.我.我 本人数据的维度不同,大小不同,质量什么都一样,做算法设计的日后就要考虑到异构框架,比同构框架更难。最后是要达成4个 共识,什么都哪哪几个才算成功?

  这就像是从4个 人打乒乓到五人团队打篮球,.我.我.我 希望能形成4个 滚雪球的效果,能只有说联邦学习在算法上原应分析铺垫好了,关键要都看方的投入。

  澎湃新闻:在AI赋能产业的过程中,联邦学习会扮演4个 要怎样的角色?

  杨强:我管你这人 叫人工智能应用的最后一一百公里。最后一一百公里的意思是说,除非你能到用户的那一段,不然你搭得再好最后还是这麼衔接上。这麼哪哪几个东西这麼衔接上?什么都数据。

  人工智能算法都前要什么都有数据,数据得只有更新,最后就像一台好车这麼汽油。

  什么都有在我看来,这最后一一百公里实在一阵一阵关键。只有通过你这人 媒体媒体合作的法子,太多 把大数据真正建立起来。

  无监督学习是“假象”

  澎湃新闻:人工智能是是否一天能做到举一反三、融会贯通?

  杨强:路还很长,但.我.我.我 现在做的而且 实验证明是能只有的。像迁移学习日后有的是而且 博士生、研究人员来设计,现在有个算法叫自动机器学习,和迁移学习结合就变成自动迁移学习。

  自动迁移学习是要怎样的?比如在自然语言领域都看4个 新的需求,它会把自己建好的模型和新的应用之间的差别变成4个 目标函数,从而设计算法。整个过程是能只有自动化的。原应分析甚儿 能只有做,让机器最终应学举一反三原应分析的,但路还很长。

  澎湃新闻:针对现在.我.我.我 比较关注的而且 深度1学习的瓶颈,你有哪哪几个看法?

  杨强:实在现在.我.我.我 比较关注的4个 间题是可解释性,原应分析深度1学习是个黑箱。我实在你这人 间题迟早会外理。为哪哪几个呢?你看人脑实在在这人 程度上也在做深度1学习,每自己的大脑有的是好多神经元在做肉体的深度1学习,一起.我.我.我 能只有对自己的而且 决策作解释。医生能只有给病人解释为哪哪几个开你这人 药,老师太多 只有给学生解释说错在哪里。人有你这人 功能,我相信机器一定能只有发展出这人 的功能,只不过.我.我.我 现在这麼找到路子。

  除此之外,深度1学习的稳定性间题也是国际上的研究热点,现在有什么都一帮人工智能只有只有通过假数据来欺骗,这说明现在人工智能的鲁棒性还有的是很好。

  这是很自然的,4个 技术突然出现后,.我.我.我 就会现在日后开始关注鲁棒性、可扩展性、透明性等非功能性性质,引起第二波研究。日后的数据库和互联网技术也是曾经。

  澎湃新闻:有这麼原应分析实现无监督的深度1学习?

  杨强:我实在无监督是4个 假象。.我.我.我 有的是借喻人会做无监督学习,但我的观点是人做的是有监督学习,只不过监督藏得陷得。

  比方说给人看一朵花,日后都看花都能认出来。这原应分析甚儿 例子顶端实在带有 了什么都有的信息,现在的算法只有从顶端得到4个 下皮 信息,而且还有而且 深度1的信息。

  什么都有这是算法的不足英文。算法做好了日后,会都看所有的无监督数据实在是有标签的。包括小孩为哪几自己学变快?这原应分析他父母日后做了预训练,这和迁移学习的法子非常像。

  我实在日后一定能只有从一幅图像中找到什么都有深度1信息,而且太多 训练个八九不离十。只不过.我.我.我 现在有的是摘比较低垂的果子,还这麼深入去想。

  澎湃新闻:你对强人工智能有要怎样的展望?

  杨强:强人工智能什么都通用的,4个 模型能只有做N件事。人肯定是4个 模型做N件事,但机器现在是4个 模型只做一件事。我实在强人工智能未来是能只有实现,但原应分析有的是用.我.我.我 现在你这人 法子。

  为哪哪几个呢?现在的法子是.我.我.我 准备什么都有数据,而且去训练出4个 模型,这是人的运作法子。人浑身上下有的是传感器,哪哪几个传感器比现在的物联网要强什么都有。什么都有除非硬件到了你这人 程度,而且只谈人工智能算法什么都奢望。现在的状态是硬件远远落后,要等那边跟上来。

  要去研究而且 冷门领域

  澎湃新闻:从学术到产业,你对现在国内的人工智能生态有哪哪几个宏观的观察?

  杨强:首先,我实在国内在人才培养上突然出现了非常可喜的局面,好多大学在建人工智能学院、人工智能专业。五年以有的是涌现一大批人工智能从业者,原应分析会突然出现良莠不齐的状态,但没关系,顶端肯定会突然出现而且 精英。其次,国内人工智能产业发展也比较兴旺,而且 公司设立了人工智能部门,哪哪几个有的是一阵一阵好的事。

  但在比较冷门的研究领域,国内和国外还有很大的差距。比原应分析甚都有有国外的大学有的是逻辑推理这方面的教授,但国内一般就把机器学习等同于人工智能。另外,国内研究神经学和人工智能结合的也比国外少。在哪哪几个方面,倘若还是从不这麼功利,要去研究而且 眼下这麼大的进展、比较冷门、好奇心驱使的方向。

  澎湃新闻:总体来说,眼下你这人 波人工智能热潮会冷下去吗?原应分析冷下去原应分析原应分析哪哪几个原应分析?

  杨强:我现在就在做一线的事情,外理它们冷下去。过去冷下去有好哪几个主要原应分析,4个 是计算能力跟不上,4个 是数据资源不足英文。现在计算资源和数据资源有的是了,但案例制造还不足英文。

  比如说,现在计算机视觉主要还是用在政府安防等领域。实在产业里有极少量的需求,但.我.我.我 做得太偏了,这麼充分地挖掘。4个 产业原应分析只4个 支柱,这麼它是很危险的。人工智能原应分析只有视觉、原应分析政府安防你这人 支柱也很危险。

  什么都有.我.我.我 说有这麼危险进入到曾经寒冬?是有的。下4个 寒冬原应分析是.我.我.我 一蜂窝做的那件事这麼真的做出来,你这人 批人原应分析就会很失望。但现在努力做不同的事情的,.我.我.我 说会有新的惊喜。(澎湃新闻记者 虞涵棋)