财新传媒

公司

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25

T中

目前主流的AI应用多是通过大量人工标注的数据来训练，成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习

　　【财新网】（记者叶展旗发自圣何塞）AlphaGo学棋三天胜人千年，诀窍是增强学习。简单地说，AlphaGo并不需要理解围棋，它每一步只追求极致的胜率，就像人类训练小狗捡东西一般：做对了奖励，做错了惩罚。但人类学习其实大多没有这么强的外界激励。

　　“飞行学院的学生从上第一堂课，到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日，加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示，很多现实世界的场景，都只有很少的外界激励，甚至没有激励。在这种情况中，好奇心会扮演内在激励的角色，驱动人不断探索外部世界和学习技艺。

推荐进入财新数据库，可随时查阅公司股价走势、结构人员变化等投资信息。

本文共计1070字订阅后继续阅读

登录后获取已订阅的阅读权限

财新通会员
可畅读全文

订阅/会员升级

您正在阅读

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

￥0 购买单篇继续阅读

恭喜购买成功

有效期：-

您可在个人中心 - 我的权限 - 单篇找到购买的文章

您正在阅读

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

￥0 购买单篇继续阅读

限时优惠，共可读 1 篇相关稿件

我已订阅，切换账号登录

您已经购买了次单篇文章
订阅后阅读更优惠

日更新文章超50篇每篇文章不到5分钱

坚持0元购买单篇

责任编辑：黄凯茜
版面编辑：邱楠添

首席赞赏官虚位以待

相关阅读

: 豪华海归阵容纷纷出走创业百度AI何去何从
2018年02月24日APP打开

: 【封面报道】抢跑AI视觉
2017年12月29日APP打开

: 【封面报道】法律AI起步
2017年12月08日APP打开

: AI·教育| 教育部启动AI人才计划 5年培养500教师5000学生
2018年04月03日APP打开

: AI·硬件|英伟达与Arm合作发力智能终端市场
2018年03月28日APP打开

: AI·出行|英伟达暂停自动驾驶路测黄仁勋欲吸取Uber教训
2018年03月28日APP打开

: AI·研究院|谷歌、IBM和百度齐聚人工智能有哪些推进？
2018年03月26日APP打开

: AI·出行|北京定百公里自动驾驶测试路段百度获路测号牌
2018年03月23日APP打开

: AI·硬件|猎豹发布特定场景机器人通用机器人仍遥远
2018年03月22日APP打开

: AI正一步步取代房地产中介的工作
2018年03月21日APP打开

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载，请发邮件至hello@caixin.com，获得书面确认及授权后，方可转载。

推荐阅读

私房课

向松祚：宏观经济70讲，带你了解国内外经济大局
2022年04月06日
In Depth: As Tencent Lays Off Staff, Is Its ‘Winter’ Approaching?
2022年04月01日

: 财新观察｜特朗普经济政策能走多远
2025年04月05日

: 显影｜罕见病患儿父母直播跳舞抓住悬浮在流量中的救命稻草
2025年04月06日

: 专题｜特朗普关税战巨震
2025年04月06日

: 最新封面报道之二｜中国产业链大考
2025年04月06日

: 新加坡总理黄循财：不实施报复性关税将与志同道合国家强化伙伴关系
2025年04月06日

财新移动

发表评论得积分

0条评论

收藏

分享

取消

发送

注册