AI里程碑!AlphaGo Zero不靠人类知识成长,靠3天自学围棋

10 个月前
6.8k 次浏览
本地新鲜事
 

围棋是至今最复杂的双人棋盘游戏,已有数千年历史的围棋排列组合可能性比宇宙原子数还多。人工智能 AlphaGo 在2016年3月对弈18度荣获世界棋王头衔的李世石,以4胜1败战绩成为全球焦点;在2017年5月,高端版的 AlphaGo Master 对战世界棋王柯洁,3战3胜的战绩也同样让全球印象深刻。

而在这些人机比赛之后,Google旗下的AI实验室 DeepMind 近期宣布开发出更强大的人工智能 「AlphaGo Zero」,与前一代 AlphaGo 不同的是,AlphaGo Zero 仅靠自我学习,3天就自学会围棋,打败当初击倒李世石的 AlphaGo;自学21天就达到之前击败柯洁的 AlphaGo Master 水准。而在与 AlphaGo 对弈的100场棋局,AlphaGo Zero 全胜。

一般的人工智能(包含AlphaGo)是要借由事前输入大量数据来学习训练并累积大数据。而AlphaGo Zero完全不用靠任何人类指导或数据输入就能自我快速成长,只需要将围棋规则输入AlphaGo Zero,它就会开始与自己下棋,并从中不断自我学习,验证了即使像围棋这种最具挑战性的领域,人工智能也能透过自我强化学习的方法进行训练并随时更新调整,并用于预测下一步落子和最终输赢。

DeepMind表示,对于AlphaGo Zero崭新的自我学习人工智能技术,将不会仅局限在围棋界、给予新的游戏策略,将会运用在新药开发、量子化学、材料设计等人类重大挑战的多元领域,以解析复杂的大量数据数据。DeepMind CEO Demis Hassabis则认为,虽然目前这项AI技术还在早期阶段,但坚信未来AlphaGo Zero以科学或医药专家的角色与人类并肩工作是有可能的。

责任编辑:  
来源:  The Guardian
点赞 (1)
脸书分享
微信分享
0条评论