← 返回日记目录

chapter · AI diary

09. 从截图到排名图:官方资料如何变成用户能看懂的内容

从这里开始 —— 2026 年 5 月初 。一个不懂代码的"追风少年" 把日本官方公开的 十几张资料照片 发给一个 AI。 90 分钟后 AI 给了他一张 看起来非常专业的排名图 。 他看了 30 秒 删掉了 。 本篇一句话 这一篇写的是 —— 官方资料的价值不在"搬运" 在把来源、口径、单位、时间

从这里开始 ——

2026 年 5 月初。一个不懂代码的"追风少年" · 把日本官方公开的 十几张资料照片 发给一个 AI。

90 分钟后 · AI 给了他一张 看起来非常专业的排名图他看了 30 秒 · 删掉了

本篇一句话

这一篇写的是 —— 官方资料的价值不在"搬运" · 在把来源、口径、单位、时间和风险边界排清楚一张好排名图 · 不是替用户做决定 · 是帮用户建立优先级一张坏排名图 · 不是难看 · 是"漂亮但站不住"

结构图 · 一张照片如何变成一张可发布的排名图

diagram · CH09

照片 → 排名图

01

官方资料

02

来源核验

03

排名口径

04

风险标签

05

可下载图表

这张图说明 —— 用户最后只看见一张图 · 但这张图后面有 10 步流水线流水线缺一步 · 排名就从"信息工具"变成"空壳排名"前台展示的简单 · 必须由后台严肃换来


1. 一开始只是几张照片

那天我给一个 AI 发了 十几张图片

图上是日本公开的官方资料 —— 地价、区域、表格、图。

对很多普通消费者来说 · 这些资料很有价值 · 但看不懂

不是说一个字都看不懂。是看不懂它到底在说什么

比如一张表里写着 —— 住宅地、商业地、平均价格、标准地点、変動率、R7R8

日本人也未必认真看。外国人更容易直接放弃

我做房地产工作的时候 · 客户最常问的是这几个 ——

  • "这个地方贵不贵?"
  • "哪个区更方便?"
  • "这个价格是成交价吗?"
  • "涨了 3.7% · 是一个月涨了 3.7% 吗?"
  • "R8 是什么?2028 年吗?"

如果只是把日文表格翻译成中文 · 答案仍然不够

因为翻译只能解决"看得懂字" · 不能解决"知道怎么判断"

所以我后来想 —— 这类资料最好不要只是翻译成文章

它应该变成图表 · 变成排名 · 变成一个普通人可以先看一眼、再决定要不要深入查的入口

2. 翻译只能解决"看得懂字" · 不能解决"知道怎么判断"

人类看资料 · 常常凭感觉 ——

  • 看见一张表 · 先看标题。
  • 看见价格 · 先看最高和最低。
  • 看见百分比 · 先看颜色和箭头。
  • 看见密密麻麻的日文 —— 很多人直接关掉

机器看资料 · 刚好相反 —— 机器需要字段。地区 / 指标 / 单位 / 时间 / sourceRef / riskBoundary —— 缺一不可。

这中间有一个很大的坑

AI 很容易把照片里的内容 OCR 出来 · 然后直接写成"已整理"。

但 ——

  • OCR 不是正式来源
  • 照片不是正式来源
  • 看得清楚的数字 · 也不等于能公开引用

自己研究 · 照片可以做 MVP 的起点

要放到网站上 · 必须回到官方公开 URL / PDF / 表格 / API · 逐项核验

我后来给这个项目立了一条铁律 ——

图片可以启动 MVP · 但不能替代官方来源

这条看起来麻烦 · 但它决定了网站能不能建立信任排名失去信任的速度 · 比文章失去信任的速度快 10 倍

3. 排名的 5 类 · 为什么不做投资类

我给排名定了 5 类(在治理文件里叫 v1 五个 shells)——

范围风险默认档
· 美食推荐餐厅 / 小吃 / 咖啡馆 / 酒吧 / 外国人友好饮食informational
· 房源推荐适合外国人的区 / 价格趋势 / 通勤友好investment-adjacent
· 交通车站拥挤度 / 线路稳定性 / IC 卡覆盖 / 出租informational
· 生活类超市 / 药店 / 儿童游乐 / 社区中心informational
服务 · 外国人友好服务双语诊所 / 美发 / 房产中介 / 翻译 / 健身cost-sensitive

但是没有

  • ❌ "投资 / 金融 / 贷款 / 税务" 类
  • ❌ "安全 / 紧急" 类(这些不该是排名 · 该是热线 119/110

为什么没有?因为这两类排名不该存在

  • "投资 Top 10" → 价格预测 / 投资建议 / 房产交易推荐 / 移民资格 —— 每一项都需要持牌专业人士
  • "安全 Top 10" → 排错一项 · 代价是人命这不是排名能承担的责任

排名的边界 · 不是"我们想做什么" · 是"我们能不能为这张图负责"

做不到 · 就不做留白比做坏更负责

4. 一张排名图背后的 6 件套

每一张排名图 · 必须有 6 件套(来自治理文件 §3 schema)——

  1. methodology —— 怎么排 / 候选怎么选 / 排除了什么。没有方法说明的 Top 10 · 一律不发
  2. sources[] —— ≥ 1 个可解析的官方 URL · 每个带 accessedAt 时间戳
  3. items[] —— Top-N 列表 · 每一项的 claim 通过 sourceRef 指回 sources[]。
  4. riskLabel —— informational / cost-sensitive / investment-adjacent(==绝不== safety-critical)。
  5. disclaimer —— 文案必须匹配 riskLabel(详见第 5 节)。
  6. computedAt / lastReviewedAt —— 两个时间戳没有时间戳的排名 · 一律 draft 状态

6 件套缺一 · 排名一律 draft · 不渲染

这 6 件套不是为了好看。是为了让"这张排名" 在一个不熟悉这个网站的人手里 · 仍然能独立成立=="。

一张图脱离网页 · 能自洽 —— 这是排名的基本及格线

5. riskLabel · 4 档 · 投资相邻必须显式写边界

riskLabel 是排名最重要的字段。它分 4 档 ——

riskLabel错答代价例子
informational错答只费几分钟小吃店 Top 10
cost-sensitive错答花小钱手机费率 Top 5 / 搬家公司 Top 5
investment-adjacent错答有重大财务伤害房价上涨区域 / 租房区域 / 买房地段
safety-critical错答有生命安全代价此档永远禁用 · 路由到 119/110

投资相邻 类的 disclaimer 必须 含三句话 ——

本排名不构成投资建议

本排名不构成价格预测

本排名不构成房产交易推荐

任何买卖 / 租赁决策 · 请咨询宅建士 / 税理士 / 弁護士 等持有资格的专业人士

为什么这么严?因为住宅 Top 10 看起来像信息 · 但用户脑子里读出来的是"哪里值得买"

我们不能让"看起来像信息"的东西 · 实际上做了"投资建议"的工作这是 顺滑的失败 在排名 surface 上的最贵姿势

6. 工作矩阵 vs 前台一张图

排名做着做着 · 后台开始变成一个矩阵 ——

6 个地区 × 10 个指标 = 60 个格子
其中:
  - 已成图:N 个
  - 照片 MVP(待核验):N 个
  - 待抽取:N 个
  - 需要外部 API 授权:N 个
  - blocked(不能公开):N 个

这个矩阵对团队工作很重要但绝对不能丢给用户

我对 AI 做过一次很明确的纠偏 ——

消费者在前端 · 只看到一张张的图表 · 不是工作台里的汇总表

工作台可以有 72 个格子 · 100 个格子。前台只展示已经完成核验、适合公开的那部分

其他的 · 一律不显示连"我们还有 N 个没做完"这种信息都不显示

"我们还在做"是真诚 · 但放在前台是空壳排名 的入口

我后来给自己定了一条 ——

工作系统越复杂 · 用户界面越要简单不是因为用户笨 · 是因为用户来网站 · 不是来帮我理解我的系统用户来网站 · 是想少走弯路

7. 排名不是建议 · 是优先级入口

做房地产排名 · 还有一条边界至关重要 ——

排名不是建议

  • 住宅地平均价格 Top 10 · 不等于"应该买这里"
  • 商业地涨幅 Top 10 · 不等于"这里以后还会涨"
  • 低价入口 Top 10 · 不等于"便宜就适合买"

这些图最多帮用户理解 ——

  • 哪里价格高、哪里价格低。
  • 哪个地区变化快、变化慢。
  • 哪个指标值得进一步查。
  • 官方数据大概怎么呈现。

真正的买卖决定 · 还要回到预算、贷款、通勤、家庭、学校、防灾、建筑物状况、法律文件和持牌专业人士确认

这是 CH04《T 型网站》的延伸 —— 横向(排名)负责触达 · 纵向(决策助手)负责接住第三层问题 · 有些第三层只能转给人====。

有用 · 不代表可以替用户决定这条边界守不住 · 网站越强 · 风险越大

8. 这一章给一个普通人的"做排名"观

如果你也想用 AI 做一个内容网站 · 我建议你 ——

  1. 先想"你有没有一批真实资料" —— 反复解释的流程、客户常问的问题、政府公开资料、踩坑后留下来的记录。没有资料的"排名" · 一定是空壳
  2. 接受"==留白比做坏更负责==" —— 你做不到的类(投资、安全、法律),根本不要开给排名留白 · 给读者诚实
  3. 每一张图先回答 5 件事 —— 标题 / 时间口径 / 来源 / 用途 / 风险边界。少一件 · 这张图不发。
  4. 不要把工作矩阵丢给用户 —— 前台只展示已完成的 · 其他一律不显示。简单的前台是幕后严肃换来的 · 不是装出来的
  5. ==投资相邻== 类 · disclaimer 不能省一个字 —— "不构成投资建议 / 价格预测 / 交易推荐" + "请咨询持牌专业人士" —— 这两句必须完整
  6. ==排名不是建议 · 是优先级入口== —— 用户读完应该说"我下一步该查什么"· 不是"我该买什么"。
  7. 接受"==做排名比做文章贵 10 倍==" —— 排名错一次 · 网站的信任损失永久贵 10 倍是因为对应了 10 倍的责任

这一切 · 本质上是一句话 ——

图片可以启动 MVP · 但不能替代官方来源

排名可以建立优先级 · 但不能替代专业判断

做排名的工作 · 本质上是给信任搭一座桥 · 桥的每一块砖都必须能独立站住


本篇方法卡

方法 09 · 一张可发布排名图的最小 6 件套 + 9 步 workflow

任何一张排名图 · 公开前必须备齐 6 件套 ——

1. methodology(怎么排 / 候选怎么选 / 排除了什么)

2. sources[](≥ 1 个可解析官方 URL + accessedAt 时间戳)

3. items[](每项的 claim 通过 sourceRef 指回 sources)

4. riskLabel(4 档 · 投资相邻必须显式)

5. disclaimer(文案匹配 riskLabel)

6. computedAt / lastReviewedAt

6 件套齐 · 进入 9 步 review workflow ——

1. draft · schema 全填。

2. 来源核验 · 每个 URL 解析。

3. methodology clarity · 圈外人能读懂。

4. riskLabel 设置。

5. disclaimer 匹配。

6. computedAt 打戳。

7. lastReviewedAt 打戳。

8. 操作者亲自审每一项。

9. reviewed → published。

跳一步 · 排名就变成空壳空壳排名是网站信任的第一杀手

本篇金句

参考与延伸

核心思想锚 ——

  • 李笑来《自学是门手艺》—— 把经验转成可积累能力 · 而不是只停留在感受
  • 吴军《信息传》—— 信息的价值在于减少不确定性 · 图表要减少用户判断的不确定性
  • Edward Tufte《信息可视化》—— 数据可视化的诚实原则
  • Stanford Lean LaunchPad —— MVP 不是漂亮样子 · 而是用户是否真的用它减少了成本
  • 老A 本书 CH04《T 型网站》—— 横向负责触达 · 纵向负责解决
  • 老A 本书 CH05《顺滑的失败》—— 排名 surface 上的"漂亮但站不住"
  • 老A 本书 CH06《漂亮的 Markdown》—— 排名是它的视觉版


reader q&a

读者留言

留言会先进入人工审核。请不要写电话、住址、证件号、合同全文或他人隐私;本站回复只做信息整理, 不构成法律、税务、投资、医疗或房地产交易建议。

还没有公开留言。你可以提出一个具体问题,审核后会显示在这里。

为了减少广告、辱骂和隐私泄露,留言需要先登录。公开显示前仍会人工审核。