当前位置:首页 >娱乐 >

Facebook的AI击败人类扑克冠军

来源:   2021-03-01 14:44:44

Facebook人工智能研究和卡内基梅隆大学今天详细介绍了Pluribus的创建,这是一款扑克玩家AI,Facebook称其是第一个击败德州扑克专业人士的人工智能。扑克是一种有时用来衡量人工智能或游戏理论表现的游戏。

该机器人击败了15名专业人士,他们都赢得了至少100万美元的扑克玩家,例如2000年世界扑克锦标赛冠军克里斯“耶稣”弗格森和4次世界扑克巡回赛冠军达伦埃利亚斯。

Facebook AI声称Pluribus是第一个在基准游戏中持续击败2个以上人类玩家的人工智能。在“科学”杂志上发表的一篇论文中详细介绍了人工智能是如何构建的。研究人员表示,它能够在训练后20小时内超越人类最佳表现。

Pluribus通过价值150美元的云计算进行培训,实现了其目标。

就像人工智能人员训练过玩Pluribus之前的Go,Dota II和星际争霸II等游戏一样,人工智能通过对自己的比赛进行训练来实现其成果。研究人员表示,训练超过20小时可以产生比顶级人类玩家更好的AI玩家。

“Pluribus战略的核心是通过自我游戏来计算的,其中AI与其自身的副本进行比赛,而没有任何人类或先前AI游戏的数据用作输入。人工智能通过随机播放从头开始,并逐渐改进,因为它确定哪些动作,以及哪些动作的概率分布,导致更好的结果对其早期版本的策略,“科学论文读到。

人工智能是卡内基梅隆大学计算机科学系和Facebook AI Research之间的合作,以及战略机器,战略机器人和优化市场等公司。

在研究人员的测试中,Pluribus赢得了5场人类和1场AI比赛,以及5场AI和1场人类比赛。Facebook AI表示,如果每个芯片价值1美元,那么Pluribus每只手的价格大约为5美元,每小时可以赢得大约1000美元的奖金。

“根据情况,它所考虑的确切投注数量在1到14之间变化。尽管Pluribus可以将自己限制为只投注100到10,000美元之间的几个不同大小中的一个,但实际上玩无限制扑克时,对手并不局限于那些少数选项,“科学论文读到。

Pluribus建立在Libratus的基础之上,Libratus是卡内基梅隆在2017年制作的AI扑克玩家,但它附带了一些额外的功能,比如搜索算法来评估未来的几个结果。

抽象也被用来推理未来轮次的投注和批量策略性相似的牌。人工智能还使用反事实后悔最小化,这是一种迭代的自我发挥算法,可以对抗自身以进行改进。

相关文章

TOP