09. 从截图到排名图：官方资料如何变成用户能看懂的内容 · AI 做网站实践日记

从这里开始 ——
2026 年 5 月初。一个不懂代码的"追风少年" · 把日本官方公开的十几张资料照片发给一个 AI。
90 分钟后 · AI 给了他一张看起来非常专业的排名图。他看了 30 秒 · 删掉了。

本篇一句话

这一篇写的是 —— 官方资料的价值不在"搬运" · 在把来源、口径、单位、时间和风险边界排清楚。一张好排名图 · 不是替用户做决定 · 是帮用户建立优先级；一张坏排名图 · 不是难看 · 是"漂亮但站不住"。

结构图 · 一张照片如何变成一张可发布的排名图

diagram · CH09

照片 → 排名图

官方资料

来源核验

排名口径

风险标签

可下载图表

这张图说明 —— 用户最后只看见一张图 · 但这张图后面有 10 步流水线。流水线缺一步 · 排名就从"信息工具"变成"空壳排名"。前台展示的简单 · 必须由后台严肃换来。

1. 一开始只是几张照片

那天我给一个 AI 发了十几张图片。

图上是日本公开的官方资料 —— 地价、区域、表格、图。

对很多普通消费者来说 · 这些资料很有价值 · 但看不懂。

不是说一个字都看不懂。是看不懂它到底在说什么。

比如一张表里写着 —— 住宅地、商业地、平均价格、标准地点、変動率、R7、R8。

日本人也未必认真看。外国人更容易直接放弃。

我做房地产工作的时候 · 客户最常问的是这几个 ——

"这个地方贵不贵？"
"哪个区更方便？"
"这个价格是成交价吗？"
"涨了 3.7% · 是一个月涨了 3.7% 吗？"
"R8 是什么？2028 年吗？"

如果只是把日文表格翻译成中文 · 答案仍然不够。

因为翻译只能解决"看得懂字" · 不能解决"知道怎么判断"。

所以我后来想 —— 这类资料最好不要只是翻译成文章。

它应该变成图表 · 变成排名 · 变成一个普通人可以先看一眼、再决定要不要深入查的入口。

2. 翻译只能解决"看得懂字" · 不能解决"知道怎么判断"

人类看资料 · 常常凭感觉 ——

看见一张表 · 先看标题。
看见价格 · 先看最高和最低。
看见百分比 · 先看颜色和箭头。
看见密密麻麻的日文 —— 很多人直接关掉。

机器看资料 · 刚好相反 —— 机器需要字段。地区 / 指标 / 单位 / 时间 / sourceRef / riskBoundary —— 缺一不可。

这中间有一个很大的坑。

AI 很容易把照片里的内容 OCR 出来 · 然后直接写成"已整理"。

但 ——

OCR 不是正式来源。
照片不是正式来源。
看得清楚的数字 · 也不等于能公开引用。

自己研究 · 照片可以做 MVP 的起点。

要放到网站上 · 必须回到官方公开 URL / PDF / 表格 / API · 逐项核验。

我后来给这个项目立了一条铁律 ——

图片可以启动 MVP · 但不能替代官方来源。

这条看起来麻烦 · 但它决定了网站能不能建立信任。排名失去信任的速度 · 比文章失去信任的速度快 10 倍。

3. 排名的 5 类 · 为什么不做投资类

我给排名定了 5 类（在治理文件里叫 v1 五个 shells）——

类	范围	风险默认档
食 · 美食推荐	餐厅 / 小吃 / 咖啡馆 / 酒吧 / 外国人友好饮食	informational
住 · 房源推荐	适合外国人的区 / 价格趋势 / 通勤友好	investment-adjacent
行 · 交通	车站拥挤度 / 线路稳定性 / IC 卡覆盖 / 出租	informational
活 · 生活类	超市 / 药店 / 儿童游乐 / 社区中心	informational
服务 · 外国人友好服务	双语诊所 / 美发 / 房产中介 / 翻译 / 健身	cost-sensitive

但是没有：

❌ "投资 / 金融 / 贷款 / 税务" 类
❌ "安全 / 紧急" 类（这些不该是排名 · 该是热线 119/110）

为什么没有？因为这两类排名不该存在。

"投资 Top 10" → 价格预测 / 投资建议 / 房产交易推荐 / 移民资格 —— 每一项都需要持牌专业人士。
"安全 Top 10" → 排错一项 · 代价是人命。这不是排名能承担的责任。

排名的边界 · 不是"我们想做什么" · 是"我们能不能为这张图负责"。

做不到 · 就不做。留白比做坏更负责。

4. 一张排名图背后的 6 件套

每一张排名图 · 必须有 6 件套（来自治理文件 §3 schema）——

methodology —— 怎么排 / 候选怎么选 / 排除了什么。没有方法说明的 Top 10 · 一律不发。
sources[] —— ≥ 1 个可解析的官方 URL · 每个带 accessedAt 时间戳。
items[] —— Top-N 列表 · 每一项的 claim 通过 sourceRef 指回 sources[]。
riskLabel —— informational / cost-sensitive / investment-adjacent（==绝不== safety-critical）。
disclaimer —— 文案必须匹配 riskLabel（详见第 5 节）。
computedAt / lastReviewedAt —— 两个时间戳。没有时间戳的排名 · 一律 draft 状态。

6 件套缺一 · 排名一律 draft · 不渲染。

这 6 件套不是为了好看。是为了让"这张排名" 在一个不熟悉这个网站的人手里 · 仍然能独立成立=="。

一张图脱离网页 · 能自洽 —— 这是排名的基本及格线。

5. riskLabel · 4 档 · 投资相邻必须显式写边界

riskLabel 是排名最重要的字段。它分 4 档 ——

riskLabel	错答代价	例子
informational	错答只费几分钟	小吃店 Top 10
cost-sensitive	错答花小钱	手机费率 Top 5 / 搬家公司 Top 5
investment-adjacent	错答有重大财务伤害	房价上涨区域 / 租房区域 / 买房地段
safety-critical	错答有生命安全代价	此档永远禁用 · 路由到 119/110

投资相邻类的 disclaimer 必须含三句话 ——

本排名不构成投资建议。
本排名不构成价格预测。
本排名不构成房产交易推荐。

任何买卖 / 租赁决策 · 请咨询宅建士 / 税理士 / 弁護士等持有资格的专业人士。

为什么这么严？因为住宅 Top 10 看起来像信息 · 但用户脑子里读出来的是"哪里值得买"。

我们不能让"看起来像信息"的东西 · 实际上做了"投资建议"的工作。这是顺滑的失败在排名 surface 上的最贵姿势。

6. 工作矩阵 vs 前台一张图

排名做着做着 · 后台开始变成一个矩阵 ——

6 个地区 × 10 个指标 = 60 个格子
其中：
  - 已成图：N 个
  - 照片 MVP（待核验）：N 个
  - 待抽取：N 个
  - 需要外部 API 授权：N 个
  - blocked（不能公开）：N 个

这个矩阵对团队工作很重要。但绝对不能丢给用户。

我对 AI 做过一次很明确的纠偏 ——

消费者在前端 · 只看到一张张的图表 · 不是工作台里的汇总表。

工作台可以有 72 个格子 · 100 个格子。前台只展示已经完成核验、适合公开的那部分。

其他的 · 一律不显示。连"我们还有 N 个没做完"这种信息都不显示。

"我们还在做"是真诚 · 但放在前台是空壳排名的入口。

我后来给自己定了一条 ——

工作系统越复杂 · 用户界面越要简单。不是因为用户笨 · 是因为用户来网站 · 不是来帮我理解我的系统。用户来网站 · 是想少走弯路。

7. 排名不是建议 · 是优先级入口

做房地产排名 · 还有一条边界至关重要 ——

排名不是建议。

住宅地平均价格 Top 10 · 不等于"应该买这里"。
商业地涨幅 Top 10 · 不等于"这里以后还会涨"。
低价入口 Top 10 · 不等于"便宜就适合买"。

这些图最多帮用户理解 ——

哪里价格高、哪里价格低。
哪个地区变化快、变化慢。
哪个指标值得进一步查。
官方数据大概怎么呈现。

真正的买卖决定 · 还要回到预算、贷款、通勤、家庭、学校、防灾、建筑物状况、法律文件和持牌专业人士确认。

这是 CH04《T 型网站》的延伸 —— 横向（排名）负责触达 · 纵向（决策助手）负责接住第三层问题 · 有些第三层只能转给人====。

有用 · 不代表可以替用户决定。这条边界守不住 · 网站越强 · 风险越大。

8. 这一章给一个普通人的"做排名"观

如果你也想用 AI 做一个内容网站 · 我建议你 ——

先想"你有没有一批真实资料" —— 反复解释的流程、客户常问的问题、政府公开资料、踩坑后留下来的记录。没有资料的"排名" · 一定是空壳。
接受"==留白比做坏更负责==" —— 你做不到的类（投资、安全、法律），根本不要开。给排名留白 · 给读者诚实。
每一张图先回答 5 件事 —— 标题 / 时间口径 / 来源 / 用途 / 风险边界。少一件 · 这张图不发。
不要把工作矩阵丢给用户 —— 前台只展示已完成的 · 其他一律不显示。简单的前台是幕后严肃换来的 · 不是装出来的。
==投资相邻== 类 · disclaimer 不能省一个字 —— "不构成投资建议 / 价格预测 / 交易推荐" + "请咨询持牌专业人士" —— 这两句必须完整。
==排名不是建议 · 是优先级入口== —— 用户读完应该说"我下一步该查什么"· 不是"我该买什么"。
接受"==做排名比做文章贵 10 倍==" —— 排名错一次 · 网站的信任损失永久。贵 10 倍是因为对应了 10 倍的责任。

这一切 · 本质上是一句话 ——

图片可以启动 MVP · 但不能替代官方来源。
排名可以建立优先级 · 但不能替代专业判断。

做排名的工作 · 本质上是给信任搭一座桥 · 桥的每一块砖都必须能独立站住。

本篇方法卡

方法 09 · 一张可发布排名图的最小 6 件套 + 9 步 workflow
任何一张排名图 · 公开前必须备齐 6 件套 ——
1. methodology（怎么排 / 候选怎么选 / 排除了什么）
2. sources[]（≥ 1 个可解析官方 URL + accessedAt 时间戳）
3. items[]（每项的 claim 通过 sourceRef 指回 sources）
4. riskLabel（4 档 · 投资相邻必须显式）
5. disclaimer（文案匹配 riskLabel）
6. computedAt / lastReviewedAt
6 件套齐 · 进入 9 步 review workflow ——
1. draft · schema 全填。
2. 来源核验 · 每个 URL 解析。
3. methodology clarity · 圈外人能读懂。
4. riskLabel 设置。
5. disclaimer 匹配。
6. computedAt 打戳。
7. lastReviewedAt 打戳。
8. 操作者亲自审每一项。
9. reviewed → published。
跳一步 · 排名就变成空壳。空壳排名是网站信任的第一杀手。

本篇金句

参考与延伸

核心思想锚 ——

李笑来《自学是门手艺》—— 把经验转成可积累能力 · 而不是只停留在感受
吴军《信息传》—— 信息的价值在于减少不确定性 · 图表要减少用户判断的不确定性
Edward Tufte《信息可视化》—— 数据可视化的诚实原则
Stanford Lean LaunchPad —— MVP 不是漂亮样子 · 而是用户是否真的用它减少了成本
老A 本书 CH04《T 型网站》—— 横向负责触达 · 纵向负责解决
老A 本书 CH05《顺滑的失败》—— 排名 surface 上的"漂亮但站不住"
老A 本书 CH06《漂亮的 Markdown》—— 排名是它的视觉版