2048最高纪录(AI的最高分纪录:401912,你呢?)
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
如果让AI来玩《2048》这样的游戏,那会是怎样一种画面?
现在,有人用强化学习方法实践了起来。
于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:
一起手,是不是就有内味了?
这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫症们不禁纷纷点赞,给这只AI贡献了800+ reddit热度。
用DQN玩《2048》
调教出这只会玩《2048》的AI的,是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。
首先,他采用OpenAI Gym构建了自定义强化学习环境。
其中包括两种2048棋盘表示方式:
二进制——使用二次幂矩阵表示棋盘中的每一块区域非二进制——原始数字矩阵
模型包含两种类型的神经网络:CNN和MLP(多层感知机)。
据Felipe介绍,与MLP相比,以CNN作为特征提取器的智能体表现得更好。
训完之后,老哥测试了一下,在1000把游戏中,AI有100次达到了2048。
玩《2048》的AI们
目前,这只用DQN训练出的AI玩到2048就打住了。
不过,巴西老哥抛砖,又吸引了不少来献玉的盆友。
比如,同样采用强化学习方法,将时序差分学习和最大期望搜索相结合的2048控制器。
在10步/秒的策略下,它最高能凑出32768。
而在追求高分的路上,有一位来自日本的选手表现亮眼。
依靠7个卷积层的深度卷积网络,这只在《2048》这个游戏中最高拿到了401912分。
正如一位网友所说:这正是一个足够有趣,又不太复杂的强化学习案例。
如果你是刚刚开始学习强化学习,也不妨拿这个小项目练练手~
参考链接
《2048》相关开源项目:
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/
相关论文:
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
-
鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI如果让AI来玩《2048》这样的游戏,那会是怎样一种画面?现在,有人用强化学习方法实践了起来。于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:一起手,是不是就有内味了?这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫
-
小米ai眼镜作为一款融合了先进科技的智能穿戴设备,正逐渐改变着人们与世界交互的方式,其功能丰富多样,从生活到工作,从娱乐到学习,全方位为用户带来便利与惊喜。
-
当你决定关闭抖音月付,却发现还有欠款未结清时,不必惊慌,以下是一些应对方法。
-
甜盐相机是一款备受欢迎的拍摄软件,它为用户提供了丰富多样的拍摄功能,其中实况拍摄就是一项很有趣的功能。下面就来详细介绍一下甜盐相机如何开启实况。
-
在日常生活中,微信支付给我们带来了极大的便利,但提现手续费有时也会让人小小烦恼一下。不过,微信支付推出的提现免费券就能很好地解决这个问题。那么,微信支付提现免费券究竟该怎么用呢?
-
在甜瓜游乐场中,连接电线可是一项有趣又具有挑战性的任务。下面就为大家详细介绍怎么连接电线。
-
一、任务规划
-
在崩坏星穹铁道中,哀丽秘榭是一个充满机遇与挑战的地方,玩家们可以在这里获取各种珍贵的战利品。下面就为大家带来哀丽秘榭全战利品位置汇总攻略。
-
烧脑推球
v1.0.2 安卓版
2025年07月31日
-
绳索引力
v1.3.1 安卓版
2025年07月30日
-
小李菜刀
v1.0.9 安卓版
2025年07月30日
-
神奇三国(0.1折每日送6480)
v1.0 安卓版
2025年07月28日
-
幻域战魂(0.05折日送3280)
v1.1.0 安卓版
2025年07月28日
-
风之勇者(1折免费版)
v1.1.0 安卓版
2025年07月28日
-
绝世仙王(发育极速版)
v1.0.51 安卓版
2025年07月28日
-
萌斗魏蜀吴(0.1折魔幻三国)
v1.0 安卓版
2025年07月28日
-
魔物迷宫(0.1折石器世界)
v1.0.0 安卓版
2025年07月28日
-
阿尔卡纳战记(0.1折免费版)
v1.3.0 安卓版
2025年07月28日