谷歌大脑负责人撰文介绍谷歌大脑的 2016 实现的八个目标,和2017年目标

人工智能学家 2017-01-14 23:13

人工智能学家 而在今天,Jeff Dean 代表整个团队撰文回顾了谷歌大脑的 2016 年,并发表于 Google Research Blog 上,这个为世'...

人工智能学家

而在今天,Jeff Dean 代表整个团队撰文回顾了谷歌大脑的 2016 年,并发表于 Google Research Blog 上,这个为世界带来科技惊喜的团队究竟如何看待自己的 2016 年吧。

谷歌大脑团队的宏愿一如既往:团队致力于通过多领域的纯研究及应用性研究,创造更多的智能软件及智能系统,以此提升人们的生活水平。

“虽然这一蓝图是我们仰望星空的长期愿景,但我们也需要脚踏实地,回顾一下我们过去一年完成的小目标,并与你们一同分享那些会为 2017 年新成就奠基的点点滴滴。”

一、科研刊发,硕果累累

在国际顶级的期刊及学术会议(如 ICML、NIPS 及 ICLR)上提交论文是科研水平的质量保证,谷歌大脑团队同样寄望于此。过去一年间,团队共有 27 篇论文实现了这个小目标,领域涉猎广泛

程序合成:《Neural Programmer: Inducing Latent Programs with Gradient Descent》;

链接:

http://jamanetwork.com/journals/jama/article-abstract/2588763

神经网络间的知识迁移:《Net2Net: Accelerating Learning via Knowledge Transfer》;

链接:

https://arxiv.org/abs/1511.05641

机器学习的分发式训练:《Revisiting Distributed Synchronous SGD》;

链接:

https://openreview.net/pdf?id=D1VDZ5kMAu5jEJ1zfEWL

语言的生成式模型:《Generating Sentences from a Continuous Space》;

链接:

https://openreview.net/forum?id=D1VVBv7BKS5jEJ1zfxJg

机器人的无监督学习:《Unsupervised Learning for Physical Interaction through Video Prediction》;

链接:

http://papers.nips.cc/paper/6161-unsupervised-learning-for-physical-interaction-through-video-prediction

定理的自动证明:《DeepMath - Deep Sequence Models for Premise Selection》;

链接:

http://papers.nips.cc/paper/6280-deepmath-deep-sequence-models-for-premise-selection

神经网络理论理解:《Toward Deeper Understanding of Neural Networks: The Power of Initialization and a Dual View on Expressivity》;

链接:

http://papers.nips.cc/paper/6427-toward-deeper-understanding-of-neural-networks-the-power-of-initialization-and-a-dual-view-on-expressivity

改进强化学习的算法:《Continuous Deep Q-Learning with Model-based Acceleration》

链接:

http://jmlr.org/proceedings/papers/v48/gu16.html;

谷歌大脑还在许多其它优秀期刊及学术会议上提交了论文,包括:

自然语言处理(ACL 及 CoNNL);

语音识别(ICASSP);

视觉领域(CVPR);

机器人(ISER);

计算机系统(OSDI)等。

团队目前已经向机器学习研究的顶尖学术会议 ICLR 2017 提交了 34 篇论文。AI 科技评论附上了提交论文的清单,如果感兴趣的用户可以点击查看。

链接:https://research.google.com/pubs/BrainTeam.html

二、自然语言理解

谷歌大脑研究的重点方向之一在于如何让计算机更好地理解人类语言。

2014 年年底,三位谷歌大脑团队的成员发布了一篇名为《利用神经网络实现序列到序列的学习》的论文,提出了此方法可应用于机器翻译。

2015 年,团队证明了此方法同样能够应用于生成图像标题、分析句子成分及解决计算化的几何问题当中。

2016 年,谷歌大脑团队与谷歌翻译团队进行密切合作,将谷歌翻译算法以一种完全端到端的学习系统所取代。该系统缩小了原有系统与人类高质量翻译之间的差距,而这一数字达到了 85%。

在数周后,谷歌大脑团队又发布了「zero-shot」翻译系统,即使是系统之前从没学习过的样本对,机器也能够顺利翻译出来。目前,这一系统已经顺利上线谷歌翻译,而它所处理的语言对数量也在不断增加。

「zero-shot」链接:

https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html

Jeff Dean 还特别专门提及了 AI 科技评论于本文开始时提及的文章,这篇发布于《纽约时报》,原名为《超级 AI 正在觉醒》的文章详细描述了谷歌翻译是如何一步步进阶深度学习的。

《超级 AI 正在觉醒》链接:

https://www.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.html?_r=0

三、教机器人学会学习

Jeff Dean 也回顾了谷歌大脑在机器人领域取得的成果,他表示,传统机器人的控制算法是通过精心设计并进行人工编程而实现的,因此,如何将新的能力「传授」给原有的机器人也成为一个挑战。谷歌大脑团队相信,机器人如果能掌握机器学习能力,那么让它自动掌握这些新的技能也绝非难事。

在 2016 年,谷歌大脑团队与 Google X 团队合作实现了机械臂的手眼协调功能,并经过 80 万次的抓取实验,让它们在不断的学习过程中汲取自学经验,雷锋网此前也做过报道和覆盖。

链接:https://arxiv.org/abs/1603.02199

“随后,我们探索了三种机器人学习新技能的三种可能方式,包括强化学习、通过机器与物体的交互,以及人类的操作示范等。谷歌大脑团队将在这些工作的基础上继续前行,以实现让机器人在复杂的现实环境中习得新技能,并成功运用的目标。”

三种机器人学习新技能链接:

https://research.googleblog.com/2016/10/how-robots-can-acquire-new-skills-from.html

值得一提的是,为了让其它机器人研究者也能尝试在该领域探索,谷歌大脑团队共享了数个机器人数据库。

链接:https://sites.google.com/site/brainrobotdata/home

四、医学影像领域:提升诊断效率

机器学习有着巨大潜力,包括应用于医学诊断领域。谷歌大脑同样注意到了这一进步,并在今年 6 月的美国医学学会刊物上(Journal of the American Medical Association)发布了一篇名为《深度学习算法的应用及有效性:因糖尿病引致的视网膜病变》的论文,详细了目前机器学习系统在疾病诊断上的新成果。「如果没能筛查出早期的视网膜病变,将会有四亿人面临失明风险。通过这项技术,我们希望能够帮助更多人口在眼科医生稀缺的情况下获得适当的检查。」AI 科技评论了解到,谷歌 DeepMind 目前已经与英国国家医疗服务体系(NHS)进行了二度合作,将和 Moorfields 眼科医院一同开发识别视觉疾病的机器学习系统。

论文链接:http://jamanetwork.com/journals/jama/article-abstract/2588763

除此之外,谷歌大脑团队也致力于拓展医学影像的其它领域,并相信机器学习能够在接下来一年内又好又快地提升医患的就医体验。

五、创作,从音乐到艺术

不论是印刷出版、电影或是电吉他,人们利用科技定义媒体内容的创造与分享。在 2016 年,谷歌大脑成立了一个名为 Magenta 的项目,以探索艺术与机器智能的灵感火花,并利用机器学习丰富人类的创造力。

最新文章
猜你喜欢