产品经理AI实战:7天上架AppStore-夜雨聆风

产品经理AI实战:7天上架AppStore

FIELD NOTES ／ NO.01

一个产品经理的 AI 造 APP 实录

— 2014 to 2026, twelve years later —

2014年5月19日，我是一个即将大学毕业的学生，那天我向appstore提交了一个我做的APP进行审核，被拒绝了，当然这在意料之中，我只是用前端组件”搭了”一个APP的壳，里面的所有功能都实际上并没有实现，我根本没有代码能力完成那项工作。

12年后，7天前我决定用AI从零做一个iOS APP并上架App Store，这篇文章记录了完整的过程、踩过的坑，以及我对“产品经理用AI做APP”这件事的真实感受。

01CHAPTER ONE

我为什么做这个APP

核心目的：加速学习AI，动脑不如动手

希望看看AI现在到底能做到什么程度，成本有多低，哪些能干哪些不能干

实操层面，AI有哪些局限性和坑，会带来哪些问题

AI对于产品经理的意义如何

❋ ❋ ❋

02CHAPTER TWO

我做了个什么APP

PRODUCT

WearRight — 一个穿衣推荐工具

核心想法很简单：我经常出门穿多了热，穿少了冷，我想每天早上出门前看一眼手机，APP告诉你今天、明天该穿什么。

但它和普通天气APP的穿衣指数不一样。所有现有穿衣推荐产品的问题是：

THE PROBLEM

用数字温度代替了人的真实体感。

一个怕冷的女生和一个壮实的男生，站在同一个8°的街头，需要穿的衣服可能差两个层级。普通天气APP说”今天适合穿外套”，WearRight会说”你今天傍晚6点在户外最冷只有14度，室内公司25度，建议室内穿短袖，出门加一件拉链外套方便脱”。

三大差异化

01	不是按实时温度推荐，而是按你真正会经历的最低户外温度
02	考虑个人体质（怕冷怕热、年龄、出行方式）
03	支持全家管理（给宝宝、给父母一起推荐）

❋ ❋ ❋

03THE TOOLKIT

用了哪些AI工具

核心工具链：我 + Claude Code

其他配套工具

技术栈	React Native + Expo SDK 54 + TypeScript
天气数据	和风天气API
部署	EAS Build + EAS Submit
页面托管	GitHub Pages（隐私政策等）
UI 设计	Claude

❋ ❋ ❋

04UNDER THE HOOD

这个项目的复杂度远超预期

“穿衣推荐”四个字听起来很简单，但做到第三天我就意识到，这个APP的复杂度被严重低估了。

No.1

算法不是查表，是多变量决策

不是”20度推荐薄外套”这种简单对应关系。一次完整的推荐要走6个计算环节：获取逐小时天气数据 → 找到用户户外时段内的最低温度 → 叠加体质修正 → 计算总保暖量需求 → 从70件单品库里按层级、温度范围、性别、场景筛选组合。

其中每一步的数值都不能靠AI拍脑袋，必须人工校准。我最后手写了42条真实场景的验收测试，逐条比对每个温度点的推荐结果，改了10+轮才全部通过。

No.2

四个时间维度，每个都不一样

APP有今天、明天、7天、旅行四个页面。看起来只是时间不同，但背后的数据源、计算逻辑、展示方式全不一样。最头疼的是数据一致性——同一天的推荐，在”今天”页面和”7天”页面里必须完全相同。这个问题我们修了不下5次，最终靠架构重构为”1个Store统一计算+所有页面只读缓存”才彻底解决。

No.3

多角色系统，隔离比想象中复杂

APP支持给家庭成员分别推荐——你的通勤穿搭、宝宝的外出穿搭、父母的散步穿搭。这意味着每个角色有独立的体质档案（怕冷程度、年龄段、出行方式、户外时段、室内温度），算法要按角色分别计算，但天气数据和城市又是全局共享的。

哪些数据跟着角色走、哪些数据全局共享，边界稍微没划清楚就会串数据。开发过程中确实遇到了引擎层计算正确、但UI层把数据写到了全局字段而不是当前角色字段的bug。

No.4

“其他”模块的触发规则全是特例

除了上衣裤子鞋袜这些”保暖量驱动”的推荐，还有一大类单品完全靠天气条件触发：推墨镜和防晒衣、加棒球帽、推遮阳伞；雨天推折叠雨伞、骑行加雨衣；推围巾手套帽子、加口罩、加耳罩。这些规则无法用统一公式覆盖，全是一条条手工定义的产品逻辑。

No.5

69件单品库，每件都要人审

每件单品有十几个属性——部位、层级、保暖度、温度适用范围、性别、正式度、常见度。这不是技术工作，是产品工作。

No.6

外部API集成的坑比代码还多

接入和风天气API要处理：专属Host域名配置、JWT鉴权和API Key两种认证方式的选择、逐小时预报和多日预报的数据格式差异、请求缓存策略、网络失败后的降级显示、以及后来上线后才暴露的——独立Host下不同API路径前缀不同。这些在文档角落里可能提了一句，不踩到坑你根本不会注意。

❋ ❋ ❋

05SEVEN DAYS

7天开发：从产品到上架的完整复盘

PHASE 01

产品定义 + 产品设计

这是整个项目里最重要、耗时最长、也最容易被低估的阶段。大部分人以为”用AI做APP”是从写代码开始的，但实际上，写代码之前的产品思考才是真正决定成败的东西。

我和Claude产出了一份完整的产品战略文档，涵盖：痛点分析、竞品差异化战略（竞品在”体质个性化”等维度全部空白）、产品架构设计、功能分期规划以及算法计算公式框架。

💡 阶段感悟　产品文档不是给别人看的，是给自己理清思路的。AI可以帮你讨论、写文档，但每个决策必须你自己拍。

PHASE 02

基础架构 + 代码开发

有了产品文档做输入，代码开发的效率高得惊人。Claude Code快速搭建了React Native项目骨架，接入和风天气API，并将文档里的算法框架（体感计算、保暖量分配、单品筛选）翻译成了代码。同时搞定了内购支付、状态管理等硬核功能。

💡 阶段感悟　确认了Claude Code确实能写出结构清晰的可运行代码。前提是大量逻辑讨论已经在阶段一完成了。

PHASE 03

UI完善 + 算法修复 + 架构重构

这是最痛苦的阶段。代码能跑了，但功能不对。第一次真机测试简直灾难：23度居然推荐穿厚卫衣+外套。

后来让Claude画出数据流图才发现是架构问题，4个页面各自独立计算导致参数不一致。最终将架构重构为”1个Store统一计算+4个页面只读缓存”才解决。

💡 阶段感悟　“代码跑通”和”功能正确”是两回事。Claude说”137个测试全通过”没意义，因为它自己mock数据自己测，相当于自己出题自己答。

PHASE 04

产品审核 + 最终修复 + 上架

这个阶段全是人工逐条审核。我让Claude生成算法逻辑和单品清单的中文文档，逐一排查。发现了体质修正值乱拍、逻辑写反等大量问题。经历了一轮大改，精简了单品库，跑通了5条我手写的真实场景验收测试。

💡 阶段感悟　如果没有人工审核，上架一定会被骂。PRD是理想，代码是现实，审核是把两者拉齐的过程。

❋ ❋ ❋

06PITFALLS

我踩过的那些大坑

PIT

AI说”已修复”但实际没修

　它每次都在修表面症状，改个变量名，调个函数。遇到顽疾，必须让它停下来，画数据流图，找到根因，出方案确认后再执行。

PIT

关键数值全靠AI拍脑门

　保暖量基准、体质修正数值，前3天我全放权给AI，结果一塌糊涂。经验：每个关键数值都要产品负责人”签字”。

PIT

改了A导致B出问题

　改了首页的温度显示，明天页就崩了。经验：每次改完代码，必须重跑全部功能，改动范围严格控制在5个文件内。

PIT

单品库偷懒不得

　一开始AI生成162件单品，审核发现背心、洞洞鞋全出来了，女性常见度全是0。这个工作必须人工一件件审，最终精简到69件。

PIT

验收用例比测试用例重要100倍

　开发自测和产品验收是两码事。我手写的5条真实生活场景用例，发现了3个致命bug，比跑137个自动化测试还管用。

PIT

开发模式正常 ≠ 生产模式正常

　这是上线翻车教给我的最贵一课。开发模式读的是本地配置文件，生产构建读的是云端环境变量——这两个是完全独立的来源。我在开发模式里测了无数遍”一切正常”，但生产环境里API密钥其实是空的。

以后的铁律：发版之前，必须用TestFlight装一遍生产构建版本，手动验证核心功能。开发模式下的测试只能算半个测试。

PIT

第三方API换了规则，你的代码就悄悄坏了

　和风天气启用独立Host后，城市搜索API需要加路径前缀。这不是代码问题，不是逻辑错误，是第三方平台的规则变了。经验：接入第三方API后，验收测试必须覆盖每一个独立接口，不能只测主流程。

PIT

“未来24小时”不等于”今天24小时”

　这个bug藏得最深。和风天气的逐小时预报API返回的是从当前时刻起的未来24小时，而不是今天0点到23点。这意味着如果你下午3点查看，API返回的”13点数据”其实是明天下午1点的——而代码只看了小时数字没看日期，把明天的数据当成今天的用了。

　结果就是：下午30度的天气，App算出来的体感温度是16度，推荐穿厚长袖加马甲。用户设了”上午””中午””下午”三个不同的时段，温度居然都是16度——因为拿到的全是明天同时段的数据。

　更可怕的是，这个bug在上午使用时完全不会暴露，因为上午查看时API里的上午数据确实是今天的。只有在下午或晚上打开App时才会触发，而开发阶段我恰好大部分测试都在上午做的。

PIT

算法正确≠推荐合理，有时候整个思路需要推翻重来

　1.0版本的核心逻辑是”按最低体感温度推荐衣服”。算法没bug，42条测试全通过。但上线后我自己用了一天就发现：杭州4月底，早上17度出门穿厚长袖加马甲确实合适，但到中午31度还穿着这身根本受不了。

　AI给了三个补丁方案：加提示文案、标记”午后可脱”、做双时段推荐。我全部否掉了。因为根本问题不是缺提示，是整个推荐思路就是反的——应该先按最高体感选一套不会热的基础层（短袖），然后往上叠加可脱的外层（针织衫+薄外套）来扛住最低温度。这就是所有穿搭博主教的”洋葱穿法”。

　这个改动牵一发动全身：保暖量计算要分层、上身选品逻辑要拆成基础层和外层两步、下身在高温时不能推荐两层、脚部要用折中温度。等于把推荐引擎的核心重写了一遍。但改完之后，推荐结果第一次让我觉得”这就是我会穿的”。

❋ ❋ ❋

07REFLECTIONS

关于AI协作，我想明白了这几件事

做完整个项目、经历了上线翻车和紧急修复之后，我对”产品经理用AI开发”这件事有了一些更深的认知。

AI协作不是”下指令”，是”一起想”

很多人以为用AI做APP就是”我说你做”。但实际上我和Claude的关系更像两个合伙人在白板前讨论。它提方案，我否掉。我提想法，它指出漏洞。

比如算法要怎么处理温差大的天气——早上17°出门穿厚长袖加马甲没问题，但中午31°还穿着这身就热死了。Claude给了3个方案（加提示文案、标记”午后可脱”、双时段推荐），我全部否掉，说”应该按最高体感选基础层，再往上叠可脱的外层”。它立刻理解了，帮我把这个直觉翻译成了精确的计算公式。

“

AI最大的价值不是替你想，而是帮你把模糊的直觉变成精确的方案。

但前提是——你得有那个直觉。

ii.

交接文档是AI时代的新型PRD

传统产品经理写PRD给工程师，AI时代的产品经理写”交接文档”给AI。

我维护了一份不断更新的交接文档，记录了所有架构决策、算法参数、已知bug、验收标准。每次开新对话，上传这份文档，AI就能无缝继续。上线翻车那天晚上，我开了一个全新的对话窗口，上传交接文档，Claude立刻恢复了对整个项目的理解，5分钟内就进入了诊断状态。

这份文档和传统PRD最大的区别是：

“

PRD描述”要做什么”，交接文档记录”做了什么、为什么这么做、哪些坑踩过了”。

它既是给AI的上下文，也是给未来的自己的备忘录。

iii.

最危险的时刻是AI说”全部通过”

AI跑完137个自动化测试告诉你”全部通过”的时候，恰恰是你最应该警惕的时刻。因为测试用例是AI自己写的，数据是AI自己造的——相当于自己出题自己答。

真正有价值的验收是：我手写了5条真实生活场景（”杭州春天打车通勤的成年人””北京冬天老人外出”），用这些场景去比对推荐结果。5条场景发现了3个致命bug。

“

AI能保证代码不报错，但不能保证产品不离谱。后者是产品经理的工作。

iv.

“人拍数值，AI写公式”是最佳分工

算法里每一个关键数值全部是我根据生活经验拍板的，AI负责把这些数值组装成可运行的计算逻辑。

前面我偷懒让AI自己拍数值，结果灾难性的不准。AI没有穿过衣服，没有在寒风中等过公交，没有体会过室内25度和室外5度的温差。

“

这些只有人有的体感经验，恰恰是穿衣推荐算法的核心。

到后来每次涉及数值调整，Claude会主动给我几个选项并说明理由，然后等我确认。这个协作模式是磨合出来的——一开始它也喜欢自己拍脑袋，被我否了几次之后就学会了先问再做。

上线才是真正的开始

开发7天，上线修复12小时——但上线后发现的问题密度远超开发阶段。

开发时你面对的是自己的测试环境，上线后你面对的是所有用户的真实环境。生产配置没带上、第三方API路径变了、苹果审核流程的各种细节——这些”代码之外的事”占了上线后工作量的80%。

而且这些问题AI帮不了太多。它不知道你的Expo后台有没有配环境变量，不知道和风天气最近改了路径规则，不知道苹果加急审核要去哪个页面申请。

“

AI能帮你把APP做出来，但运营一个APP需要的判断力、应变能力和对细节的执着，目前还替代不了。

“

AI 负责怎么做，

人负责做什么、对不对、好不好。

— THE BOTTOM LINE —

❋ ❋ ❋

08BY THE NUMBERS

📊 项目数据盘点

DAYS

项目天数

⌨️ CODE LINES

10,000+

代码行数（AI写的）

🤖 BATCHES

80+

Claude Code 指令批次

🔧 ROUNDS

15+

算法修复轮数（含核心重构）

👕 WARDROBE

162 → 69

单品库精简

🏗️ FLAWS FIXED

发现并修复的架构缺陷

🐛 PROD BUGS

上线后发现的生产 bug

⚡ APPLE REVIEW

< 12 hrs

苹果加急审核通过时间

❋ ❋ ❋

EPILOGUE

最后我想说这次实战最核心的感受：最最最重要的是——定义产品的能力，应该花80%的时间在产品定义、产品设计上，这才是真正重要的事。

THE FINAL TAKEAWAY

AI降低了”做APP”的技术门槛

但没有降低”做好APP”的产品门槛

以后谁再说”我有一个idea，就差一个程序员了”——不，你现在连程序员都不差了。你差的是把idea变成精确产品需求的能力。

❋ ❋ ❋

NOW LIVE ON

WearRight

已在 App Store 上架 · 搜索”WearRight”即可下载

觉得有启发，点个在看或分享给需要的朋友吧 👇

— END —