Skip to content
方法论阅读时长 8 分钟

Pokékipe 的数据从何而来?数据来源、方法和可靠性

Pokékipe 建立在 Smogon 公开统计数据之上,并辅以对位评分和历史背景。本页面会准确解释我们的数字来自哪里、如何计算,以及它们的边界。

Pokékipe 的数据从何而来?

主要数据源:Smogon 统计

Pokékipe 上的所有使用率数据都来自同一个公开来源:Smogon 每月发布在 smogon.com/stats 的统计。这些统计由参考级竞技模拟器 Pokémon Showdown 上的积分对战自动生成。

Pokémon Showdown 免费开放,每月承载数百万场积分对战。每场积分对战都会计入其所属格式和 ELO 档位的月度统计。

我们接入的其他数据源

在 Smogon 月度天梯统计之外,Pokékipe 还融合多个相邻公开数据源以丰富分析:

  • Pokémon Champions 社区比赛--每天两次从 Limitless API 拉取(16+ 玩家、格式 Reg M-A 的赛事),含完整战绩榜与 decklist。
  • 官方 VGC Masters 战绩榜--来源于 pokedata.ovh,覆盖每场 Play! Pokémon 赛事,含名次、战绩、decklist 与淘汰赛 bracket。
  • Smogon dex Sets--来自 smogon.com/dex 的精选配招,每年刷新数次,与基于使用率的热门 sets 并列展示。
  • PokeAPI--作为 sprite、种族值、属性以及招式 / 特性 / 道具字典的标准参考。

Smogon 与 Pokékipe 无关联

Pokékipe 是一个独立项目,我们依据 Smogon 公开数据的自由使用原则使用其数据。Pokékipe 与 Smogon、Pokémon Showdown、宝可梦公司或任天堂均无任何关联。

分析了多少数据?

每月数百万场对战

不同格式和月份体量有所不同,但作为基准:

每月 100 万+ 场对战

Gen 9 OU(阈值 0)

每月约 5 万场对战

Gen 9 OU(1695+)

每月 500 万+ 场对战

所有格式合计

这些数字会随竞技新闻自然波动:新补丁、规则更改或新游戏发行都可能显著改变体量。

历史覆盖范围

Pokékipe 对优先格式的数据回溯至 2022 年,对更老的分级则部分覆盖至 2014 年。最近的月份数据始终最完整、最可靠。

数据摄取流水线

在幕后,一个定时任务会检测 Smogon 新的统计文件、解析它们、对比上个月计算增量、在我们的参考图鉴中解析宝可梦名称,并将带版本的快照写入数据库。另有一个独立的时间线抓取器跟踪 Suspect 测试、Viability Ranking 更新、VGC 规则变化和重大赛事。

您在 Pokékipe 上看到的每个数字都绑定到特定快照(格式 + 月份 + ELO 档位),所以历史比较始终是同类可比的。

刷新频率一览

Smogon 月度统计在每月初发布,通常当天即整合。Pokémon Champions(Limitless)每天 04:00 与 16:00 UTC 重新扫描两次。Pokémon Showdown 天梯排名每 4 小时采样一次。Smogon dex Sets 每年人工刷新数次,通常在重大 retiers 或 VR 更新之后。

覆盖哪些对战格式?

Pokékipe 覆盖 Smogon 发布统计的每个格式。优先摄取的格式包括:

  • Gen 9 OU -- Smogon 单打参考格式(朱/紫)
  • Gen 9 Ubers -- 无禁用表,一切皆可
  • Gen 9 UU / RU / NU / PU -- 面向低使用率宝可梦的低分级
  • Gen 9 Doubles OU -- Smogon 的双打格式
  • Gen 9 Monotype -- 围绕同一属性搭建的队伍
  • Gen 9 Little Cup -- 仅限第一阶段宝可梦
  • Gen 9 National Dex -- 包含朱/紫中不存在的宝可梦
  • VGC -- 当前任天堂官方规则(以及历史规则)

更早的世代(第七世代、第八世代 OU 及其变体)和特殊格式(Random Battle 等)也有覆盖,但优先级较低。

使用率如何计算?

精确定义

一只宝可梦的使用率,是它在至少一方队伍中出现过的对战占比。公式很简单:

使用率 = (出现次数 / 总对战数) × 100

30% 的使用率意味着该宝可梦大约每 10 场对战中出现 3 场。这不是胜率--一只流行但表现平庸的宝可梦也可能拥有很高的使用率。

使用率不衡量什么

  • 它不衡量宝可梦是否真正被派上场(在 VGC 中需从 6 只中选 4 只)。
  • 它不衡量宝可梦在对战中是赢是输。
  • 所有宝可梦的使用率加起来不是 100%--如果每队都使用前 6 名,加起来约为 600%。

月度增量如何计算?

增量(在 Pokékipe 上以 ▲ / ▼ 表示)是当前月份与上个月同一格式、同一 ELO 档位之间使用率的绝对差值:

增量 = 使用率(第 N 月) − 使用率(第 N−1 月)

+2.1% 的增量意味着该宝可梦的使用率比上月上涨了 2.1 个百分点。增量是捕捉环境变化最快的指标:新配置的公布、Suspect 禁用或新克制方案往往最先体现在增量上。

ELO 阈值是什么意思?

ELO 衡量玩家在 Pokémon Showdown 天梯上的水平。Smogon 按多个阈值发布统计:

阈值纳入人群Pokékipe 上的使用率
0(ALL)所有积分对战,涵盖全部水平ALL 模式--完整玩家群体
1500+高于平均水平的玩家-
1630+天梯强手-
1695+天梯前约 5%ELITE 模式(默认)
1760+天梯前约 2%-
1825+天梯前 1%--高水平竞技对局-

Pokékipe 提供两种实用模式:ALL(阈值 0,涵盖所有对战)和 ELITE(该格式可用的最高阈值,通常为 1695 或 1760)。默认使用 ELITE,因为它更能反映真实的竞技环境。

克制关系得分

除了使用率,Pokékipe 还提供一个 0 到 100 的克制关系得分,表示宝可梦 A 在天梯的正面交锋中能够可靠击败宝可梦 B 的程度。得分高于 70 表示硬克制,高于 55 表示软克制。

该得分源自 Smogon 的克制关系数据,综合了换入生存力、击倒潜力以及首发对首发交互等因素。它不是单一的胜率,而是一个综合的可靠性评分。

Pokékipe 使用的指标术语表

使用率

宝可梦在至少一方队伍中出现的对战占比。

%(0–100)

增量(Δ)

相对上个月、同一格式和档位的使用率变化。

百分点

使用率排名

宝可梦在所选格式和快照中按使用率降序的名次。

整数名次

克制关系得分

宝可梦 A 击败宝可梦 B 的可靠性(0–100)。>70 为硬克制,>55 为软克制。

得分(0–100)

队友率

在包含目标宝可梦的队伍中,同时包含该队友的百分比。

%(0–100)

快照

某一格式在指定月份和 ELO 档位下的完整捕获。Pokékipe 保存自 2022 年以来的所有快照。

-

局限性与已知偏差

玩家选择偏差

数据反映的是 Pokémon Showdown 玩家,而非卡带玩家。Showdown 玩家倾向于尝试实验性配置,这可能夸大一些在任天堂天梯上从未出现的创意选择的使用率。

入场门槛偏差

ALL 模式(阈值 0)包含完全新手的对战,使用率会向新手友好型宝可梦倾斜。ELITE 模式能修正这一点,但总体样本量更低。

时间滞后

月初发布的数据反映的是上个月的情况。在变化剧烈的环境下(禁用后、补丁后、规则变更后),数据可能比当下的高水平现实滞后 4 到 6 周。

天梯 vs 线下赛

VGC 天梯数据并不能完美反映线下赛。在道具选择和适合三局两胜赛制的冷门高效配置上,天梯环境与赛事环境存在分歧。

Primary sources & references

Every number on Pokékipe traces back to a public source you can verify yourself :

  • Smogon usage statistics, smogon.com/stats, the monthly chaos JSON dumps that drive every usage rate, top-moves/items/abilities, teammates, and counters score on this site. Pokékipe ingests the latest snapshot the first week of each month.
  • Pokémon Showdown, play.pokemonshowdown.com, the open-source simulator hosting the rated ladder our data is derived from. Source code and battle mechanics live on github.com/smogon/pokemon-showdown.
  • PokéAPI, pokeapi.co, the public Pokémon database we use for static reference data : species names, base stats, type charts, ability and item dictionaries.
  • Limitless TCG (Pokémon Champions tournaments), play.limitlesstcg.com, the platform hosting Reg M-A community tournaments ; their public API powers our Champions standings and meta breakdowns.
  • Pokédata.ovh (VGC official events), pokedata.ovh, community-maintained mirror of official Pokémon Company VGC standings ; we ingest Masters-division decklists and Buchholz scores from there.
  • Our own public API, /faq/api, every endpoint we call from the frontend is also documented and rate-limited for public use. Verify any number on the site by hitting the corresponding JSON endpoint.

完全透明

我们的所有数据源都公开且可验证。如果您发现数据异常或计算错误,请在我们的 Discord 或通过支持页面反馈。 Discord · 支持