财新传媒
财新传媒
1111111
财新通行证
公司

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25
T中
目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习

  【财新网】(记者 叶展旗 发自圣何塞)AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

  “飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

责任编辑:黄凯茜
版面编辑:邱楠添

首席赞赏官虚位以待

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读

当社保缴费基数渐渐高过工资|养老算账之一

北上广深多地禁止酒店入住强制“刷脸”

最新财新周刊|香港楼市“小阳春”

四川信托风险处置再进一步 法院正式裁定受理破产重整申请

火线评论|重庆燃气费调查报告已出,公众还在担忧什么

财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功