经典区间 DP & 经典博弈游戏

这是我参与更文挑战的第 16 天,活动详情查看:更文挑战

题目描述

这是 LeetCode 上的 877. 石子游戏 ,难度为 中等

Tag : 「区间 DP」、「博弈论」

亚历克斯和李用几堆石子在做游戏。偶数堆石子排成一行,每堆都有正整数颗石子 piles[i] 。

游戏以谁手中的石子最多来决出胜负。石子的总数是奇数,所以没有平局。

亚历克斯和李轮流进行,亚历克斯先开始。 每回合,玩家从行的开始或结束处取走整堆石头。 这种情况一直持续到没有更多的石子堆为止,此时手中石子最多的玩家获胜。

假设亚历克斯和李都发挥出最佳水平,当亚历克斯赢得比赛时返回 true ,当李赢得比赛时返回 false 。

示例:

输入:[5,3,4,5]
输出:true
解释:
亚历克斯先开始,只能拿前 5 颗或后 5 颗石子 。
假设他取了前 5 颗,这一行就变成了 [3,4,5] 。
如果李拿走前 3 颗,那么剩下的是 [4,5],亚历克斯拿走后 5 颗赢得 10 分。
如果李拿走后 5 颗,那么剩下的是 [3,4],亚历克斯拿走后 4 颗赢得 9 分。
这表明,取前 5 颗石子对亚历克斯来说是一个胜利的举动,所以我们返回 true 。
复制代码

提示:

  • 2 <= piles.length <= 500
  • piles.length 是偶数。
  • 1 <= piles[i] <= 500
  • sum(piles) 是奇数。

动态规划

定义 f[l][r]f[l][r] 为考虑区间 [l,r][l,r],在双方都做最好选择的情况下,先手与后手的最大得分差值为多少。

那么 f[1][n]f[1][n] 为考虑所有石子,先手与后手的得分差值:

  • f[1][n]>0f[1][n] > 0,则先手必胜,返回 True
  • f[1][n]<0f[1][n] < 0,则先手必败,返回 False

不失一般性的考虑 f[l][r]f[l][r] 如何转移。根据题意,只能从两端取石子(令 pilespiles 下标从 11 开始),共两种情况:

  • 从左端取石子,价值为 piles[l1]piles[l – 1];取完石子后,原来的后手变为先手,从 [l+1,r][l + 1, r] 区间做最优决策,所得价值为 f[l+1][r]f[l + 1][r]因此本次先手从左端点取石子的话,双方差值为
piles[l1]f[l+1][r]piles[l – 1] – f[l + 1][r]

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享