财新传媒
财新传媒
财新通行证
公司

AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

2018年04月08日 14:25
T中
目前主流的AI应用多是通过大量人工标注的数据来训练,成本高昂。AI研究者希望打造好奇心驱动的AI来自我学习

  【财新网】(记者 叶展旗 发自圣何塞)AlphaGo学棋三天胜人千年,诀窍是增强学习。简单地说,AlphaGo并不需要理解围棋,它每一步只追求极致的胜率,就像人类训练小狗捡东西一般:做对了奖励,做错了惩罚。但人类学习其实大多没有这么强的外界激励。

  “飞行学院的学生从上第一堂课,到成为飞行员。并不是每一次飞行都会有强烈的外界激励。”近日,加州大学伯克利分校的博士生Deepak Pathak在接受财新记者采访时表示,很多现实世界的场景,都只有很少的外界激励,甚至没有激励。在这种情况中,好奇心会扮演内在激励的角色,驱动人不断探索外部世界和学习技艺。

推荐进入财新数据库,可随时查阅公司股价走势、结构人员变化等投资信息。

登录 后获取已订阅的阅读权限
财新通会员
可畅读全文
订阅/会员升级
您正在阅读
AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》
0  购买单篇 继续阅读
恭喜 购买成功
有效期:-
您可在 个人中心 - 我的权限 - 单篇 找到购买的文章
您正在阅读
AI·研究院|AI如何无师自通闯关《超级马里奥兄弟》

0  购买单篇 继续阅读

限时优惠,共可读 1 篇相关稿件

我已订阅,切换账号登录
您已经购买了 次单篇文章
订阅后阅读更优惠
日更新文章超50篇 每篇文章不到5分钱

责任编辑:黄凯茜
版面编辑:邱楠添

首席赞赏官虚位以待

财新网所刊载内容之知识产权为财新传媒及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

如有意愿转载,请发邮件至hello@caixin.com,获得书面确认及授权后,方可转载。

推荐阅读

财新观察|特朗普经济政策能走多远

2025年04月05日

显影|罕见病患儿父母直播跳舞 抓住悬浮在流量中的救命稻草

2025年04月06日

专题|特朗普关税战巨震

2025年04月06日

最新封面报道之二|中国产业链大考

2025年04月06日

新加坡总理黄循财:不实施报复性关税 将与志同道合国家强化伙伴关系

2025年04月06日
财新移动
发表评论得积分
收藏
分享
取消
发送
注册
 分享成功