AI大事件 | Geoffrey Hinton决定抛弃反向传播，预期策略梯度算法-白红宇

呜啦啦啦啦啦大家好呀，又到了本周的AI大事件时间了。过去的一周中AI圈都发生了什么？大佬们互撕了哪些问题？研究者们发布了哪些值得一读的论文？又有哪些开源的代码和数据库可以使用了？文摘菌带你盘点过去一周AI大事件！

了解过去一周AI爆点，一篇就够啦！

新闻

Geoffrey Hinton决定抛弃反向传播

来源：WWW.AXIOS.COM

链接：

现在几乎所有神经网络都会经过反向传播的训练。然而在最近的一次采访中，Hinton，深度学习之父却表示，他将“抛开一切重新开始”。要想在深度学习上向前推进，就必须发明全新的方法。

Facebook人工智能研究登陆蒙特利尔

来源：NEWSROOM.FB.COM

链接：

作为Facebook的人工智能研究的一部分（FAIR），这个新的团队将由超过100名来自门洛帕克、纽约和巴黎的科学家组成，他们将努力推进人工智能领域的研究。

蒙特利尔实验室将对AI领域进行广泛的研究，但它也将特别关注强化学习和对话系统。

Sophia Genetics筹集了3000万美元帮助医生使用人工智能和基因组数据进行诊断

来源：VENTUREBEAT.COM

链接：

9月13日消息，瑞士医疗数据分析公司Sophia Genetics宣布完成3000万美元D轮融资，Balderton Capital领投，Alychlo、Invoke Capital Partners、360 Capital Partners等跟投。

Sophia Genetics成立于2011年，是一家遗传信息数据分析公司，专注于通过人工智能找出患者基因突变原理，并结合专家意见提供个性化的治疗诊断方案。

文章&教程

学习其他代理想法的模型（OpenAI）

来源：BLOG.OPENAI.COM

链接：

一种算法，它解释了其他代理也在学习的事实，并在迭代囚徒困境中发现了类似于针锋相对的合作策略。

AI健身房

来源：LEARNINGAI.IO

链接：

一个易于理解的近端策略优化（ Proximal Policy Optimization）的介绍（PPO）并且能够很好的应对MuJoCo 和 RoboSchool 的环境。点击这里查看代码：

使用强化学习达到最优化

来源：BAIR.BERKELEY.EDU

链接：

机器学习的算法仍然是人工设计的。这就引出了一个自然的问题：我们可以学习这些算法吗？

项目&数据

使用TensorBoard API完成自定义可视化

来源：RESEARCH.GOOGLEBLOG.COM

链接：

为了让学习者能够使用新的和有用的可视化进行创作，谷歌公布了一组API，允许开发人员添加自定义的可视化插件到TensorBoard。

膨胀残留网络（Dilated Residual Network）的实现

来源：GITHUB.COM

链接：

基于膨胀卷积的多元内容集成和膨胀残留网络的官方PyTorch实现。

对TensorFlow数据集和估计机制（Estimators）的介绍

来源：DEVELOPERS.GOOGLEBLOG.COM

链接：

TensorFlow 1.3介绍了两个重要的特点：数据集和估计机制。这篇文章显示了他们如何适应TensorFlow架构。

数据集 | 一万本最受欢迎的书：一万本书，六百万次阅读

来源：GITHUB.COM

链接：

该数据集包含了goodreads.com上一万本最受欢迎的书，其中最受欢迎的被阅读了六百万次。

爆款论文

针对工程师的机器学习简介

来源：ARXIV.ORG

链接:

一个200页的“简短”的介绍。这项工作旨在介绍机器学习中的关键概念、算法和理论框架，包括监督和无监督学习、统计学习理论、概率图形模型和近似推理。

把所有东西都嵌入进去！

来源：ARXIV.ORG

链接：

一个通用的神经嵌入模型，可以解决各种各样的问题：标签型任务，如文本分类；排序型任务，如信息检索、网络搜索、基于协同过滤和基于内容的推荐；多关系图的嵌入，并能够实现单词、句子或文档级的嵌入。在每种情况下，模型都是通过嵌入由离散特征组成的实体来实现的，并将对它们进行比较——学习依赖于任务的相似性。

预期策略梯度算法

来源：ARXIV.ORG

链接：

预期策略梯度算法（EPG：Expected policy gradients）使强化学习中的随机策略梯度算法（SPG： stochastic policy gradients ）和确定性策略梯度算法（DPG： deterministic policy gradients ）达成了一致。这一算法的灵感来自于预期的SARSA算法，EPG在估计梯度的时候整合了整个操作，而不是仅仅依赖于采样轨迹。

原文发布时间为：2017-09-19

编译 | 宁云州

本文来自云栖社区合作伙伴“大数据文摘”，了解相关信息可以关注“大数据文摘”微信公众号