
大菠萝(OFC)特有的难点
开放式中国扑克,通常简称 OFC(Open-Face Chinese Poker),中文圈一般叫「大菠萝」。它从手机牌局里的一个新鲜玩法,慢慢变成了今天分析难度最高的扑克变体之一。和大家熟悉的德州扑克、奥马哈(PLO)不一样,OFC 没有下注圈。玩家抽牌,把每张牌摆进三道(墩)之一:三张牌的「头道」(前墩)、五张牌的「中道」(中墩)、五张牌的「尾道」(后墩)。规则要求尾道必须大于中道,中道必须大于头道。一旦打破这个大小关系,就构成「犯规」(foul,又叫倒水)——这手牌作废,你要按规则给桌上每个对手赔罚分。
计分方式正是 OFC 和其它扑克的根本区别。分数来自两块:一是和对手逐道(墩)比大小,赢一道得一分;二是一整套「奖励分」(royalties,凤凰分)——把高牌型摆进特定位置会拿额外加分。尾道一个同花拿到的奖励分,明显比头道三条要多;葫芦、四条、同花顺的奖励分是逐级上涨的。唯一的例外是凤凰城(Fantasyland):当一名玩家在头道摆出一对 Q 或更大、且不犯规时,下一轮 13 张牌会一次性发齐,且是私下摆牌。凤凰城是扑克里最大的信息优势之一,期望值(EV)高达好几个大盲。
今天手机 App 上的主流变体是菠萝 OFC(Pineapple OFC):每名玩家每条街发三张、弃一张。菠萝把决策树压缩了,但把方差拉高了——弃牌这个动作制造了持续的信号问题,逼着你在「听牌价值」和「成牌价值」之间做更难的取舍。多数房间还会收紧凤凰城的「再进入」条件,要求头道三条、或尾道葫芦才能续命,目的是限制纯 QQ 进入带来的滚雪球效应。

为什么 OFC 对 AI 特别难
OFC 看着简单,从博弈论角度其实极其复杂。这里没有「读对手下注频率」的捷径,因为根本没有下注。每个决策都是一个顺序摆牌问题,要在一个不断变化的多道约束下进行,而收益只在所有对手都摆完、亮牌(摊牌)时才结算。分支因子很大——到第三条街时,一名玩家面对一张牌往往有几十种合法摆法——而奖励信号既稀疏又延迟。
这恰恰是通用扑克求解器最吃力的领域。现代德扑和奥马哈求解器高度依赖在抽象化的下注树上做反事实遗憾最小化(CFR);而 OFC 压根没有这样一棵下注树可供抽象。强力的 OFC 引擎转而依赖大规模的蒙特卡洛推演(Monte Carlo rollout),配合通过自我对弈(self-play)训练出来的神经价值网络。这套思路更接近 AlphaZero 式的学习,而不是传统基于 CFR 的扑克求解——是在一个爆炸式增长的状态空间上做模式识别,而不是在一张下注图上做遗憾最小化。
PokerBotAI 的 OFC 引擎
PokerBotAI 的旗舰引擎 PokerX,把开放式中国扑克作为一等公民来支持,和无限德州扑克(NLH)、PLO4/5/6 并列。这里的 OFC 引擎不是一个通用模型眯着眼套用另一套规则——它是一个用自己专属数据训练出来的「专科」模型。
底层上,PokerX 跑在 PokerBotAI 的 TriBrain Engine(三脑引擎)上,由三个组件构成:
- 手牌历史(Hand History)——一个对手历史数据库,用来为桌上每个玩家建立精确的画像。
- 神经网络(Neural Network)——一个自学习模型,训练数据包括 70 多亿手合成与求解器生成的牌局,外加自 2000 年代以来从各房间收集的 3 亿多手真实牌局。核心的摆牌决策由它做出。
- 专家算法(Experts)——叠在神经网络之上、针对特定情形的算法(多人底池、短牌、深筹码、非典型凤凰城进入等),在纯神经网络打法会漏掉边际价值的地方补上。
对 OFC 真正重要的细节是:PokerBotAI 不是用一个「通用大脑」跑所有玩法。每种牌型都单独训练一个专门的模型——NLH、PLO、OFC 各一个——再按级别、房间和牌局的地域进一步调优。OFC 模型是用资深 OFC 职业玩家的对局轨迹、通过遗传算法和真桌测试微调出来的,并且每月做一次重训练。算力后端跑在 Nvidia Tesla GPU(T4,16 GB 显存)上——是数据中心级硬件,不是票友的家用配置。
结果是一个比市面上老一代 OFC 工具可测量地更高胜率的引擎。在一次受控的 15 万手样本中,PokerX 同时跑赢了 NZT 和 Warbot——这两个引擎是 OFC 圈最常被当作基准来对比的。差距最大的是两个领域,恰恰是规则型引擎历来漏分的地方:边际的凤凰城进入决策,以及深筹码下的避免犯规。PokerX 用概率的方式处理这些决策——在一个临界的「头道 QQ」想冲凤凰城时,它会权衡这次尝试的胜率收益,对照已经锁死的牌和对手已经亮出的摆法所带来的犯规风险。
这个引擎已对接 OFC 玩家集中的几大手机扑克客户端:
在 PPPoker、X-Poker 和 PokerBROS 上,PokerX 可以直接跑在智能手机上。在其它客户端上,它通过 Windows 10+ 系统里的 LDPlayer 安卓模拟器运行,这也是多开(同时管理多个账号)时推荐的主力配置。每个房间都作为一条独立的「视觉+动作」流水线来运营,针对该客户端单独调校,这也是为什么 PokerBotAI 支持的 App 范围比它的纯模型实力看起来要窄。玩家可以用自动模式(在设定好级别、止损和时间参数后全自动打牌)或手动模式(引擎给出决策,玩家自己执行)来运行 PokerX,具体用哪种由对应俱乐部的规则决定。
高水平 OFC 策略和德扑哪里不一样
有三条原则把赢钱的 OFC 打法和输钱的打法区分开,它们也是一个认真的引擎必须内化的东西:
犯规率(倒水率)管理。对一个激进的玩家来说,5–8% 的犯规率算正常;超过 12% 就是严重漏洞了。功夫在于:什么时候该锁定一手保证得分的牌,什么时候可以赌一把去补成一道。
在正确的时机猎取奖励分。奖励分是非线性的:从「尾道没奖励分」到「尾道同花」之间的差距,远大于「尾道同花」到「尾道葫芦」之间的差距。强者会主攻早期的低门槛奖励分,只在追高价值奖励分的成本很低时才去追。
凤凰城的 EV 巨大,而且会扭曲判断。用一个典型摆法进入凤凰城的期望值大约在好几个大盲量级。玩家普遍低估了进入的价值、又高估了它的风险。一个好的引擎会推动那些直觉上「鲁莽」的头道 QQ 摆法,因为 EV 的数学是一边倒的。
PokerBotAI 的引擎会把这些决策显式地摆出来。当它被当作求解器在牌局结束后复盘使用时,会给每一次摆牌标注一个 EV 差值,对照引擎自己更偏好的那一手——这正是当年公开 GTO 工具成熟后、推动现代德扑水平整体跃升的那种复盘闭环。

求解器,不是「神器」
把话挑明:PokerX 不是什么「PPPoker 神器」,这个项目也不是冲着那类受众去做营销的。它是一款分析与决策辅助工具,和职业玩家在用的主流德扑、奥马哈求解器属于同一类。玩家用它在赛后复盘手牌、研究针对特定对手池的凤凰城进入门槛,以及在当地俱乐部规则和运营方条款允许的情况下,用实时辅助模式。
PokerX 真正的核心用户,是私人俱乐部里的职业 OFC 玩家——在那种水平的牌桌上,光凭直觉打就会明显地把钱留在桌上。对这些玩家来说,每一次摆牌都有一个量化严谨的「第二意见」,往往就是收支打平和真正有胜率之间的差别。
如果你经常打 OFC,想看看自己的牌技在一个现代引擎面前是什么样,可以通过官方渠道联系 PokerBotAI 团队。新用户有一段免费的评估期,可以把自己的牌拿去跑一跑这个工具。
常见问题
1. OFC 和其它扑克变体到底有什么不同?
它没有下注圈。牌被摆进三道分级的位置,分数靠逐道比大小和奖励分来算。这游戏更像一个带延迟奖励的「摆牌拼图」,而不是一个下注游戏——这正是它需要另一类 AI 引擎的原因。
2. PokerX 的 OFC 支持哪些 App?
PPPoker、X-Poker、Pokerrrr2、Suprema Poker、Fishpoker、PokerBROS。随着对接被在新版客户端界面上验证通过,覆盖范围会持续扩大。
3. 用 OFC 分析软件算作弊吗?
当作学习与复盘工具来用——不算。PokerX 和职业玩家用了多年的德扑、奥马哈求解器属于同一类。工具在实时对局里怎么用,受对应俱乐部规则和平台服务条款约束,遵守它们是用户自己的责任。
4. 这个引擎实际上有多大优势?
在一次受控的 15 万手样本里,PokerX 同时跑赢了 NZT 和 Warbot,差距最大的是凤凰城进入决策和深筹码避免犯规。相对一个强力人类玩家,优势会更小,但在足够大的样本上仍然稳定。
5. 它专门支持菠萝 OFC 吗?
支持。菠萝是主流的手机端格式,引擎是直接在菠萝的弃牌动态上原生训练的,而不是套用一个转换过的经典 OFC 模型。
6. 怎么开始?
通过官方渠道联系 PokerBotAI 团队。上手流程包括一段有人带的评估,以及针对你所玩的具体 App 和级别做引擎配置。Telegram 可联系 @PokerBotAI_ShopBot。
手机扫码直达