瀑布开发做了一年，交付时全重来 • Worktile社区

2022年秋天，我坐在一间烟雾缭绕的会议室里，面前的客户方技术总监用手指敲着桌面，一字一顿地说："这一版和我们年初聊的，完全是两个产品。" 我们团队十几个人，忙了一年。每周加班超过20小时，代码仓库里有六万多次提交，测试用例写了上千条。但那个下午，所有这些数字都失去了意义，因为交付的东西，客户不认。

更让人窒息的是后续。业务方评估之后，给出了一个冷冰冰的结论：与其在现有代码上修补，不如推倒重来。 这意味着一年的人力、几百万的预算、无数个深夜的调试，全部归零。

我后来复盘过很多次。不是某个程序员写错了逻辑，不是某个测试漏了用例，甚至不是产品经理理解错了需求。问题出在一个更深层的地方：我们用瀑布模式，做了一个需求注定会变的项目，然后在长达12个月的时间里，完美地避开了所有能够纠正方向的机会。

这篇文章，就是那次事故的完整复盘。我会把整个过程摊开来讲：为什么会走到那一步、中间错过了哪些信号、如果重来一次应该怎么做。我不谈教科书上的敏捷理论，那些东西网上到处都是。我谈的是真正经历过的人才会注意到的细节。

一、事故解剖：一年时间，我们每一步都走对了，但方向全错了

很多人以为"交付时全重来"是执行力的问题。不是的。我们团队执行力非常强。 项目启动后第一个月，产品经理就交出了厚达80多页的需求规格说明书。每个功能模块都有完整的用例描述、前置条件、后置条件、异常流程。客户方的业务代表在每一页上都签了字。

设计团队在第二个月完成了全部UI稿。开发团队在第三个月启动编码。一切看起来井井有条。每周的项目例会上，项目经理用甘特图展示进度，所有里程碑都是绿色的。管理层对项目状态非常满意。

但问题就藏在那些"绿色"的进度条下面。

1. 第1-3个月：需求文档写得像判决书

我们当时的产品经理是从传统软件公司过来的，做事极为严谨。她花了整整三周时间，和客户方的业务团队做了十几轮访谈，把每一个功能点都确认得清清楚楚。文档交付那天，客户代表在确认函上签字，我们所有人都觉得这是项目最扎实的开端。

但回头看，那个签字仪式本身就是第一个危险信号。 它像一个仪式性的"需求冻结"宣告，从这一刻起，所有的讨论和确认都停止了。客户那边的人说"需求已经定了，后续不要再来烦我们"。我们这边的人觉得"白纸黑字签了字，做出来客户就得认"。

没有人问一个问题：三周里确认的这些需求，是基于客户当前对业务的理解。但12个月后，这些理解还成立吗？

事实是，在我们埋头开发的这一年里，客户所处的行业发生了两件大事。第一，他们最大的竞争对手上线了一个功能更全的新版本。第二，行业监管政策在第七个月出现了重大调整。这些变化，客户自己的业务团队也是在项目后期才逐渐意识到的。但因为我们没有设置任何中途的"需求重新对齐"机制，这些信息直到交付那天才被同时扔到桌面上。

需求文档不是合同。 合同签订后可以按条款执行，但产品需求是对未来用户行为的预测。把预测当合同来执行，时间越长，偏差越大。

2. 第4-6个月：每个环节都在"完美交付"，信息却在层层磨损

瀑布模式有一个根深蒂固的假设：上一个阶段产出的文档，可以无损地传递给下一个阶段。 设计团队看着需求文档做界面，开发团队看着设计稿写代码，测试团队看着需求文档写用例。理论上天衣无缝。

现实中，每一个传递环节都在产生信息衰减。

我举一个具体的例子。需求文档里有一个功能叫"批量导入客户数据"。产品经理写的描述是："系统应支持通过Excel模板批量导入客户基本信息，包括姓名、手机号、标签、跟进状态。" 看起来很清楚对不对？

但设计师理解成了"做一个上传按钮，点完后显示导入进度条"。开发工程师理解成了"解析Excel文件，逐行写入数据库，失败的行记录到日志"。测试工程师理解成了"准备一个标准Excel文件，上传后检查数据库里有没有多出对应的行"。

没有人去追问这几个问题：Excel模板是谁来准备？客户现有的数据格式和模板能对齐吗？导入失败了用户怎么知道是哪一行出了问题？手机号格式校验规则是什么？标签是新增还是覆盖？跟进状态有没有业务规则约束？

这些问题在瀑布模式下天然不会被问到，因为每个人只对自己的那个环节负责。设计师觉得"我只是把需求文档视觉化"。开发觉得"我按设计稿做了功能"。测试觉得"功能跑通了就是通过了"。没人在意端到端的用户场景到底能不能走通。

更糟糕的是，因为每个环节都觉得自己"完美地完成了任务"，所以当问题在集成测试阶段暴露时，没有人觉得是自己的责任。设计说"我按需求做的"。开发说"我按设计做的"。测试说"需求文档就是这么写的"。每个人都对，但产品是错的。

3. 第7-9个月：沉默的集成期，问题在暗处堆积

瀑布模式最危险的时间窗口，是开发进入深水区、但还没有到集成测试的那个阶段。表面上，代码在持续产出，模块在逐个完成，项目经理的进度报告看起来一切正常。

但实际上，这个阶段是"假性进度"最严重的时期。

什么叫假性进度？就是一个个独立模块都开发完了，单元测试也通过了，但它们从来没有被放在一起跑过。模块A调用模块B的接口，用的是开发时约定的参数格式，但模块B后来改了数据结构，A不知道。模块C依赖一个第三方的数据源，开发时用的是模拟数据，真实环境里的数据格式完全不一样。

这些问题在单体开发阶段根本不会暴露。每个模块在自己的小环境里跑得好好的。但一旦开始集成，就像把一堆各自完美的拼图碎片强行拼在一起，每片的边缘都对不上。

我们的项目在第九个月才启动第一次全量集成。结果是什么？系统根本跑不起来。光是让各个模块之间的接口调通，就花了将近三周。在这个过程中，团队发现了很多之前完全没想到的问题：数据格式不一致、业务流程断点、性能瓶颈、甚至有一些功能在集成之后出现了逻辑冲突。

但这时候距离交付只剩三个月了。

4. 第10-12个月：最后的疯狂和必然的崩溃

最后三个月是团队压力最大的时期。集成测试暴露了超过200个缺陷，其中有40多个是严重级别的。项目经理拿着缺陷清单，一个一个地分配优先级。开发团队开始疯狂修bug，但每修一个bug就可能引入两个新的。测试团队已经没有时间写完整的回归用例了，只能挑重点功能跑一跑。

在这个过程中，没有任何人敢提出"要不要让客户先看一眼"。 因为系统太不稳定了，拿出来只会让客户失去信心。团队的逻辑是：先修完bug，等稳定了再给客户演示。

但bug永远修不完。一直到交付日前一天晚上，还有三个严重缺陷没有解决。第二天上午的演示，系统在客户面前崩了两次。客户方的技术总监脸色铁青地看完了整个过程，然后说出了本文开头那句话。

这不是一个团队失误的故事。这是一个方法论失效的故事。我们严格执行了瀑布模式的每一个步骤：需求分析、概要设计、详细设计、编码、测试、交付。每一个步骤都做了，每一个文档都写了，每一个评审都通过了。但所有这些"正确"的动作加起来，得到了一个错误的结果。

二、根本原因：瀑布模式假设了一个不存在的世界

事故发生后，我花了很长时间去想一个问题：如果团队执行力没有问题，如果每个人都在认真做事，那问题出在哪里？

答案逐渐清晰：瀑布模式假设了一个需求稳定、信息对称、环境不变的世界，但这个世界根本不存在。

1. 延迟反馈：瀑布模式最致命的基因缺陷

瀑布模式的核心特征是什么？是把一个项目分成若干个首尾相连的阶段，每个阶段完成后进入下一个阶段，不可回溯。需求阶段→设计阶段→开发阶段→测试阶段→交付阶段。

这个模式天然决定了：验证只发生在最后。 你在需求阶段写的每一个假设，在设计阶段画的每一个界面，在开发阶段写的每一行代码，只有在几个月后的测试阶段才能被真正验证。这意味着什么？意味着如果你的假设是错的，你要等几个月之后才知道。

我打个比方。瀑布模式就像你在完全黑暗的房间里走路，你根据记忆画了一张房间的地图，然后严格按照地图的指示迈出每一步。你走得很认真，每一步都精确地落在你预设的位置。但你看不到房间里的实际情况，你不知道家具是不是被挪动了，不知道地上有没有多了什么东西。你一直走到撞上墙壁，才发现地图是错的。但这时候你已经走了很远，退回去的成本很高。

我们那个项目就是这样。 第一周确认的需求，到第12个月才被客户真正看到。中间这11个月，我们完全在根据一个越来越过时的假设在往前走。没有人在意客户那边发生了什么变化，因为流程没有要求我们在意。

2. 错误的信息传递模型

瀑布模式的信息传递模型可以概括为："我写文档，你读文档，你根据文档做你的事。"

这个模型有三个致命假设：

第一，假设文档能完整表达需求。 但文字天然是有歧义的。同样一句"系统应支持数据导出"，一个人理解成导出Excel，一个人理解成导出CSV，还有一个人理解成生成PDF报表。需求文档写得越详细，越容易给人一种"已经说清楚了"的错觉。但实际上，越复杂的需求，靠纯文字表达就越容易失真。

第二，假设读者能准确理解作者的意图。 产品经理写需求文档的时候，脑子里有一整套关于这个功能为什么这样设计、用户会怎么使用的上下文。但阅读文档的开发工程师没有这些上下文。他只能根据字面意思去理解，然后用自己的技术经验去脑补缺失的部分。

第三，假设信息在传递中不会衰减。 但从需求到设计，从设计到开发，从开发到测试，每个环节都在过滤信息。需求文档里的业务背景，设计师可能觉得和技术实现无关就忽略了。设计师标注的交互细节，开发可能觉得太复杂就简化了。开发做的技术取舍，测试根本不知道。到最后验收的时候，客户看到的产品和当初提的需求，中间隔了四层信息过滤。

我们那个项目，从需求到交付经历了四道信息过滤。最后客户看到的东西，和他当初描述的，偏差超过50%是完全可以理解的。

3. 阶段门制造了虚假的安全感

瀑布模式的另一个隐蔽问题，是"阶段门评审"机制本身会制造虚假的安全感。

每个阶段结束的时候，项目经理组织一次评审。需求评审、设计评审、代码评审。大家坐在会议室里，对着文档和演示逐项过。评审通过了，就进入下一个阶段。这给人一种"质量已经被把控过了"的错觉。

但实际上，阶段评审只能验证"一致性"，你做的和文档写的是否一致。它完全无法验证"正确性"，文档写的这件事本身对不对。需求文档写了要做批量导入，评审只检查设计是否支持了批量导入、代码是否实现了批量导入。没有人去问：这个功能到底需不需要？用户真的会用吗？有没有更好的实现方式？

更讽刺的是，阶段评审通过得越顺利，团队的信心就越高。我们那个项目，每次阶段评审都是一次通过，管理层觉得"这个项目管得太好了"。但那些评审没有发现的问题，全部积累到了最后。

三、推倒重来的真实代价：远不止那一年的工资

很多人评估"推倒重来"的损失时，只算直接成本：一年的工资、服务器费用、外包支出。但真正经历过的人知道，直接成本只是冰山露出水面的一小部分。

1. 可以计量的损失

我们那个项目，直接开发成本大概是180万：一个15人的团队，平均月薪1万左右（含社保公积金等），12个月就是180万。加上服务器、软件授权、外部顾问费用，总计约在220万左右。

推倒重来之后，新团队用新的技术方案重新开发，又花了8个月，成本大概160万。两项加起来，总投入380万，最终交付了一个原本可能只需要200万就能做完的项目。

但这不是全部。

2. 难以计量但更沉重的代价

市场机会成本。 因为交付延迟了一年多，客户的一个关键市场窗口期被错过了。他们竞争对手的产品在那段时间里抢占了大量用户。客户后来估算，延迟上线导致的市占率损失，折合成营收至少有300万。这笔钱不会出现在我们的账单上，但实实在在地发生了。

团队信心崩塌。 推倒重来的决定公布后，团队直接走了三分之一的人。不是在一天之内走的，而是在接下来的两个月里慢慢流失的。最先走的是最优秀的两个开发，他们觉得"在这里做的东西没有价值"。然后是测试负责人，她觉得"流程有问题但没人想改"。最后连项目经理都提了离职，她说"管了一年，不知道自己管了什么"。

留下的人状态也很差。那个曾经士气高昂、自发加班到深夜的团队，变成了每天掐着点下班、开会时沉默不语的团队。自信被击穿之后，修复起来比写代码难得多。

信任资本消耗。 最严重的是客户信任的损失。客户方的技术总监在后来的复盘会上说了一句话，我现在还记得："你们这一年给我的所有进度报告，都是垃圾。因为它们没有反映真实情况。" 这句话杀伤力极大，因为它否定的是我们的专业信誉。

这里有一个需要特别注意的点：团队重建的成本被严重低估了。 走掉的三分之一的人里，有两个是对业务最熟悉的核心开发。新招来的人光是理解业务就要花一两个月，这段时间的产出几乎为零。加上招聘费用、入职培训、老员工带新人的时间成本，团队重建的隐性支出至少在80万以上。

四、什么时候瀑布模式会杀死你的项目：一个四维判断框架

说了这么多，你可能觉得我在全盘否定瀑布模式。不是的。瀑布模式在特定条件下仍然是合理的选择。问题不在于瀑布本身，而在于在错误的环境里使用了它。

我后来总结了一个四维判断框架，用来评估一个项目适不适合用瀑布模式。四个维度分别是：需求稳定性、技术确定性、反馈可用性、组织容忍度。

1. 需求稳定性：这个项目的需求到底有多"确定"

很多人在项目启动时觉得需求是确定的，但那是因为他们混淆了"需求被确认过"和"需求是稳定的"这两个概念。

需求被确认过，只代表在某个时间点，相关方对需求达成了一致。但需求本身会不会变，取决于外部环境：市场有没有在变？竞争对手有没有在动？监管政策会不会调整？用户的偏好在迁移吗？

我现在的判断标准是：如果项目周期超过3个月，就别假设需求是稳定的。 三个月是一个分水岭。在现在的市场节奏下，超过三个月，外部环境大概率会发生一些变化。如果你的项目周期是6个月、12个月甚至更长，那需求变化的概率几乎是100%。

我们那个项目就是典型的"需求确认过但不稳定"，客户所处的行业正在快速变化，但我们在项目启动时做了一次确认，就以为万事大吉了。

2. 技术确定性：团队对实现路径有多少把握

技术确定性指的是：团队对"怎么实现这个需求"有没有清晰的、经过验证的路径。 如果你要做的东西团队以前做过类似的，技术栈是熟悉的，架构是成熟的，那瀑布模式的风险就低一些。反过来说，如果项目涉及新技术、新框架、或者团队没有相关经验，那瀑布模式就是在赌博。

为什么？因为技术不确定性高的时候，你需要在实现过程中不断试错和调整。但瀑布模式不允许你在开始编码之后再改设计。如果你在开发到一半的时候发现架构选错了、技术方案不可行，回头改设计的成本是巨大的。

我们那个项目的技术栈本身是成熟的，但有一个关键模块涉及到和客户现有系统的对接，这部分的技术细节在前期没有充分验证。结果开发到第七个月才发现对接方案有严重问题，但那时候已经没法回头了。

3. 反馈可用性：你多久能让用户看到一次东西

这是最容易被忽略的维度。很多人觉得"用户反馈"是项目后期的事情，在开发阶段不需要。但这是一个致命的误解。

反馈的核心价值不是"挑毛病"，而是"纠正方向"。 你越早让用户看到东西，就能越早发现自己是不是在往错误的方向走。哪怕只是一个粗糙的原型，哪怕只是一个部分功能的演示，只要用户能看到、能操作、能给出反应，你就有机会在投入变得巨大之前调整。

我们那个项目，客户在需求阶段之后，直到第12个月才第一次看到可运行的系统。中间的11个月，没有任何反馈输入。这11个月里，团队就像在没有GPS的情况下开长途车，完全凭感觉在走。

4. 组织容忍度：你的组织能不能接受"阶段性不完美"

这是组织文化层面的因素。有些组织，尤其是传统企业和政府客户，对"不完美"的容忍度很低。他们希望看到的交付物是完整的、经过完整测试的、看起来像成品的。给他们看一个半成品，他们会觉得你不专业。

在这种组织文化下，瀑布模式反而更"安全"，因为它把"不完美"的阶段全部藏在了内部，对外只展示最终成品。但代价是，一旦最终成品不被认可，损失也更惨重。

反过来，如果组织能够接受"先给一个能用的版本，后续再迭代优化"，那就可以用更短的反馈循环来降低风险。

把我们当年的项目放到这个框架里评估，结论非常清楚：需求稳定性低（行业在快速变化）、技术确定性中等（新旧系统对接有不确定性）、反馈可用性极低（12个月才给客户看一次）、组织容忍度倒是很高（客户不介意瀑布流程）。四个维度里有两个是致命短板，这个项目从一开始就不该用瀑布模式。

五、危险信号清单：如果你看到这些，立刻停下来

基于那次事故和后来帮助其他团队做项目诊断的经验，我整理了一份危险信号清单。这些信号如果在你的项目里出现，说明你正在朝"交付时全重来"的方向前进。

1. 启动期的危险信号

需求文档在项目启动后两周内就"定稿"了。 需求写得越快，通常意味着思考得越浅。真正复杂的需求，需要反复讨论、验证、推翻重来。两周就定稿的需求文档，要么是需求本身太简单（这种情况下用什么模式差别不大），要么是在回避那些还没有想清楚的问题。

需求确认的唯一形式是"签字"。 签字只能证明相关人员看过了文档，不能证明他们真正理解了文档的内容，更不能证明文档的内容是正确的。如果需求确认的流程就是"写完→发送→签字→归档"，那几乎可以确定，文档里有一大堆各方理解不一致的内容。

项目经理的进度计划精确到了"天"。 越是长期的计划，越不可能精确。一个12个月的项目，如果前三个月的计划精确到天、后九个月的计划精确到周，那是合理的。但如果整个12个月的计划都精确到天，那说明项目经理在用一个虚假的精确性来制造安全感。

2. 执行期的危险信号

连续三次项目例会上没有任何人提出疑问。 真正健康的项目，例会上一定有人提出"这里我不太确定""这个假设可能有问题"。如果连续三次例会都是纯进度汇报、没有任何实质讨论，那大概率是团队在回避问题。

没有人知道客户那边最近在做什么。 如果项目已经进行了四个月以上，但团队里没有任何人关注客户那边的业务动态、市场变化、组织调整，那你们就是在盲开。

"等集成测试的时候再说"成了常用语。 这是最危险的信号之一。当团队习惯于把问题推到后面解决，说明反馈循环已经彻底断裂。问题不会因为你推迟解决而变小，只会变得更大。

3. 后期的危险信号

集成测试发现的缺陷数量远超预期。 如果你在开发阶段觉得一切顺利，但集成测试一跑就炸出上百个缺陷，这说明前期的模块验证根本没有发挥应有的作用。

有人提议"先上线，后面再优化"。 这句话本身不一定有问题，但在瀑布项目的后期，它往往意味着团队已经意识到质量不达标，但希望通过上线来转移压力。压力和风险不会因为上线而消失，只会从开发团队转到用户身上。

六、如果重来一次：从第0天就该做对的事

基于以上的分析和教训，我想谈谈如果重来一次，我会怎么做。这些建议不是教科书上的敏捷理论，而是从一个真实失败中提取出来的、经过验证的实践。

1. 项目启动前：先回答三个问题

在做任何计划之前，先让核心团队坐下来回答三个问题：

第一个问题：我们做的这个东西，三个月后还有用吗？ 这个问题强迫团队思考需求的生命周期。如果答案是"不确定"或者"可能没有"，那就意味着你需要缩短交付周期，而不是拉长。

第二个问题：我们能不能在两周内给用户看点什么？ 哪怕是一个不能用的原型、一组界面截图、一个流程图。这个问题的目的是测试"反馈可用性"。如果答案是"不能"，那说明你对项目的理解还不够清晰。

第三个问题：如果方向错了，我们什么时候能发现？ 这个问题直接对应"延迟反馈"的风险。答案不应该是"测试阶段"或"用户验收的时候"。如果答案是"两周之内"，那你的项目结构是健康的。如果答案是"三个月之后"，那你就需要重新设计项目结构。

2. 建立强制反馈点：不管进度如何，到点就给用户看

不管用什么开发模式，在项目计划中硬性插入至少3个"强制反馈点"：

第一个强制反馈点：项目启动后第4周。 这个时候应该有一个可以演示的东西，哪怕只是一个可点击的原型。目的是让用户验证"你理解的需求和我想要的是不是一回事"。
第二个强制反馈点：项目进行到一半的时候。 这个时候应该有一部分功能是可用的。目的是让用户验证"你做出来的东西，在我实际使用的时候有没有问题"。
第三个强制反馈点：计划交付日前4周。 这个时候应该有一个接近完整的版本。目的是在正式交付前留出足够的缓冲来调整。

强制反馈点的关键在于"强制"二字。不管进度如何、不管质量如何、不管团队觉得拿不拿得出手，到时间了就必须给用户看。 哪怕拿出来的东西很粗糙，也比拿不出来要好。因为拿不出来意味着你失去了一个纠正方向的机会。

3. 用"可在两小时内演示"作为验收标准

取代传统的"阶段评审"，我建议用"可在两小时内给用户完整演示"作为内部的验收标准。

这个标准的意思是：每周结束时，团队必须能拿出一个可以在两小时内给用户演示的版本。这个版本不需要包含全部功能，但必须是可运行、可交互的。用户能看到、能操作、能给出反馈。

这个标准会倒逼团队做几件事：持续集成（不然你拿不出可运行的版本）、持续关注用户体验（不然演示的时候用户看不懂）、持续验证假设（不然演示后用户会说这不是他要的）。

4. 把"需求文档"从Word换成可交互原型

这是一个实操层面的建议，但效果非常显著。纯文字的需求文档，不管写得多么详细，在传递信息时损失太大了。如果你能让用户在项目早期就"玩"到一个可交互的原型，他们会发现很多看文档时完全意识不到的问题。

这个原型不需要后端支持，甚至不需要美工设计。用Figma、Axure甚至PPT做都可以。关键是要让用户能够点击、能够走通业务流程、能够看到每个操作的结果。

我们后来在一个新项目上试过这个方法。在项目启动后的第三周，我们用Figma做了一个可点击的原型给客户演示。客户在15分钟内就指出了4个需求文档里没有提到的场景，而这些场景如果等到开发完成后再发现，改动的成本至少是当时的20倍。

七、工具视角：PingCode这类平台如何改变反馈节奏

说完了方法论层面的建议，我想谈谈工具层面的事情。因为很多团队在尝试改变工作方式的时候，会卡在一个尴尬的位置：理念上知道要缩短反馈循环，但实际的工具和工作流程不支持。

我在复盘那次事故之后，参与过一个新团队的组建。新团队从一开始就决定不走瀑布的老路，而是在工具层面做了一些不同的选择。其中对反馈节奏影响最大的，是项目管理和协作工具的使用方式。

1. 需求管理的粒度决定了反馈的精度

瀑布模式下的需求管理，通常用的是"大块需求"，一份需求规格说明书就是一个整体，要么全部开发完，要么全部没开发。这种粒度天然就不支持频繁反馈。

我们后来使用PingCode这类支持敏捷模式的项目管理工具时，做的第一件事就是把需求拆到用户故事级别。 一个史诗拆成若干特性，一个特性拆成若干用户故事，一个用户故事对应一个可以在几天内开发完成的功能单元。这种拆分不只是为了让任务分配更清晰，更重要的是每个用户故事完成之后，都可以独立地拿出来给用户看。

举个具体的例子。旧项目里有一个需求叫"客户管理模块"，包含了客户列表、客户详情、客户导入、客户导出、客户标签管理、客户跟进记录等十几个子功能。在瀑布模式下，这个模块作为一个整体，要花两个月开发完才能给用户看。但在新模式下，我们把"客户列表"拆分出来作为第一个用户故事，两周就能做完并给用户演示。用户在演示时立刻指出了列表排序逻辑和筛选条件的问题，这些小问题如果攒到最后一起改，代价要高得多。

2. 迭代任务板的透明性强制形成了反馈节奏

瀑布项目有一个常见的信息不对称问题：管理层和客户不知道项目内部到底出了什么问题，直到最后才被"通知"。

我们后来使用PingCode的迭代任务板功能后，这个情况有了根本性的改变。在迭代进行过程中，每个任务的进展状态，待处理、进行中、已完成、已测试，是在任务板上实时可见的。团队每天站会时直接在任务板前讨论进度和阻塞点。

这意味着什么？意味着没有人能把问题藏到项目后期。 如果一个任务卡了两天没有进展，任务板上一眼就能看出来。如果一个迭代的燃尽图在第三天就出现了偏离，项目经理不需要等到月底才能发现。

这种透明度本身就是在强制形成反馈节奏。问题不再是"等阶段评审时再说"，而是"今天站会上就要提出来"。

3. 数据打通让"假性进度"无处藏身

瀑布项目最容易造假的指标是"进度百分比"。项目经理说"开发完成了80%"，但这个数字是怎么算出来的？是代码行数？是模块数量？还是拍脑袋估计的？

我们后来使用的方案，是把PingCode的项目管理功能和代码托管平台、CI/CD系统做了打通。这样一来，一个用户故事是不是真的"开发完成"，不是开发人员口头说了算，而是有实实在在的代码提交记录和构建结果来验证。

当一个用户故事从"开发中"转到"已完成"时，系统会自动检查对应的代码分支是否合并、构建是否通过、测试是否覆盖。如果这些条件不满足，状态就转不过去。这种客观的数据验证机制，基本杜绝了"口头完成"的情况。

4. 回顾机制：把经验变成组织的肌肉记忆

瀑布项目的复盘通常发生在项目结束后，如果还有复盘的话。但这时候复盘，距离那些问题发生已经过去了好几个月，细节忘得差不多了，而且项目已经结束，改进措施对下一个项目的影响很有限。

PingCode的迭代回顾功能提供了一个不同的方式：每个迭代结束时自动触发一次回顾。 团队在这个回顾会议上总结这个迭代做了哪些好的、哪些不好的、以及具体的改进计划。这些回顾记录会留存在系统里，形成组织的过程资产。

这个方法的价值在于把反馈循环从"项目级别"缩短到了"迭代级别"。 不需要等一年才来总结教训，每两周就能调整一次。如果一个团队连续做了20个迭代回顾，积累下来的改进措施会让团队的工作方式发生质变。

说这些不是在做产品推广，而是实事求是地讲：工具本身不是银弹，但合适的工具能把正确的实践变成默认行为。 如果团队用的工具天然支持需求细粒度拆分、迭代透明化、数据打通和定期回顾，那么建立快速反馈循环的阻力就会小很多。反过来，如果团队用的还是传统的离线文档+邮件审批的协作方式，那即使理念上认同敏捷，执行起来也会被工具拖后腿。

八、不同情况下的取舍：没有银弹，只有适配

我必须非常诚实地强调一点：不是所有项目都应该抛弃瀑布模式。 从一个极端跳到另一个极端，和死守瀑布模式一样危险。

下面我分几种典型场景来说说我的判断。

1. 需求真的稳定的项目：瀑布依然是高效选择

有一些行业的项目，需求确实在较长周期内保持稳定。比如：

政府监管类的系统开发： 需求由法规条文定义，法规不修改需求就不变。
企业内部的基础设施升级： 比如把Oracle数据库迁移到MySQL，功能不变，只是技术实现变化。
高度标准化的行业软件： 比如财务软件，会计准则相对稳定，功能边界清晰。

在这些场景下，瀑布模式的完整文档和阶段性评审反而能提供更好的质量保障。 因为你知道需求不会变，那就值得花时间把文档写清楚、把设计做扎实。

但即使在这些场景下，我仍然建议至少设置一个中途的集成点，而不是把全部集成堆到最后。因为即使需求不变，技术实现的细节仍然可能在后期暴雷。

2. 组织文化不兼容敏捷：渐进式改良比激进的推翻更务实

有些组织，尤其是大型国企、传统制造业的IT部门，其采购流程、验收标准、管理文化都建立在瀑布模式的假设之上。在这种情况下，激进地推行敏捷，反而会导致更大的混乱。

我的建议是做渐进式改良：

继续保持瀑布的整体阶段划分（因为这是合同和采购流程要求的）
但在开发阶段内部，引入两周的迭代节奏
每个迭代结束时做一个内部演示（不给客户看，但团队内部验证）
在正式的UAT之前，先做一轮非正式的客户预览

这种方式不挑战组织的根本流程，但能够在内部建立一些反馈机制，减少最后整体翻车的概率。

3. 安全关键系统：完整文档的必要性不可替代

在航空航天、医疗设备、汽车控制系统等领域，软件故障可能造成人身伤害。这些领域的开发有极其严格的合规要求，完整的文档留痕和阶段性审核是不可替代的。

对于这类项目，瀑布模式或瀑布模式的变体（如V模型）仍是主流选择。但有一个值得注意的趋势：即使在这些领域，行业也在探索如何在保证合规的前提下引入更短的反馈循环，比如通过仿真测试环境让领域专家更早地验证功能逻辑。

这个趋势说明：缩短反馈循环是普适的原则，即使在不适用纯敏捷的领域也一样有效。

4. 团队经验不足：降低复杂度比选择方法论更优先

这一点很少被讨论，但非常重要。不管用瀑布还是敏捷，如果团队的核心能力不足，项目都会出问题。

对于经验不足的团队，我更建议：

先缩小项目范围，把核心功能控制在团队能力范围内
用更短的迭代周期（一周甚至更短）来迫使问题尽早暴露
安排经验更丰富的人做代码审查和技术决策

不要期望一个新手团队靠正确的方法论就能做好一个复杂项目。方法论能放大能力，但不能替代能力。

九、结语：比方法论更重要的是持续面对现实的勇气

回到文章开头那个场景。项目宣布推倒重来的那天晚上，我一个人坐在空荡荡的办公室里，盯着那块写满任务进度的白板看了很久。上面还有没擦掉的甘特图，那些绿色的进度条曾经是每周例会上最让人安心的东西。

但那天晚上我突然意识到一个问题：那些绿色的进度条从来就没有反映过真实情况。 它们反映的是我们"希望"的情况，需求不变、设计正确、代码没问题、测试能通过。我们用一层又一层的阶段评审，给自己制造了一个"一切都在掌控之中"的幻觉。

而现实是：需求在变、设计有误、代码有bug、测试覆盖不够。现实一直在那里，只是我们没有去看。

后来有人问我，那次经历最大的教训是什么。我的回答是：做产品，最重要的不是选对方法论，而是保持面对现实的勇气。 不管你的流程多完美、文档多齐全、评审多严格，如果这些流程的作用是让你忽视外部世界的变化、回避那些不想面对的问题，那它们就不是在帮你，而是在害你。

瀑布模式也好，敏捷模式也好，混合模式也好，所有方法论的核心目的只有一个：让团队更快地发现自己在做什么、做得对不对。 如果你用的方法论让你离这个目的越来越远，那不管它听起来多么专业、多么被业界推崇，都应该被坚定地抛弃。

最后，我想用一句话来总结这个漫长的事故复盘：

不要让你的流程，变成你不去看现实的借口。

如果你的项目现在还在用瀑布模式，花十分钟想一想：上次让用户看到可运行的东西是什么时候？如果答案是"超过一个月了"，那不管你现在的进度汇报有多好看，你可能正在朝那个烟雾缭绕的会议室走去。停下来，做点什么。哪怕只是给客户发一条消息，说"我们这周做了一个半成品，你要不要过来看一眼？"

这一句话，可能就省掉了未来那一年的重来。

常见问题解答（FAQ）

1. 为什么瀑布开发做了一年，交付时全重来？根本原因是什么？

我所在的公司一直在用瀑布模式开发一个大型企业系统，整整开发了一年，结果交付时客户说完全不是他们想要的，要求重做。我一直不理解为什么会出现这种情况，是我们的需求分析没做好，还是瀑布模式本身就有问题？请从资深专家的角度帮我分析一下根本原因。

根本原因不是需求没做好，而是瀑布模式下‘需求冻结’的幻觉导致了系统性失败。我亲身经历过类似项目：去年我们为一家金融公司开发风控平台，前后写了几百页PRD，客户签字确认。但一年后市场政策变了，竞争对手出了新功能，客户的要求也变了。可我们的文档已经锁死，开发团队按照老需求造好了轮子，根本无法适应变化。

核心问题在于：瀑布模式假设需求能完整且稳定地写出来，但现实是需求本身就是动态演变的。另外，瀑布流程缺乏快速反馈机制，所有环节串行，设计、开发、测试都是‘隔空对话’，等到集成测试才发现认知偏差。

我在那次项目里统计过：最终交付的功能中，只有30%真正符合客户当时的需求，其余70%要么过时、要么理解错误。更讽刺的是，客户签字时自己也没想清楚，他们只是被厚厚文档吓住了。

所以根本原因不是‘没做好’，而是瀑布模式把项目变成了一次马拉松式的赌博，赌的是需求不变、市场不变、团队理解一致，而这几乎不可能赢。

2. 如何提前识别‘交付时全重来’的预警信号？有哪些具体做法可以避免这种情况？

我们团队现在正在用瀑布方式做一个为期八个月的项目，我有点慌，担心重蹈覆辙。有没有一些可以量化的预警信号？比如在三个月的时候能看出苗头？还有没有什么具体可操作的方法，能让我们及时调整，避免最后全盘重来？

当然有。我总结出三个‘红灯信号’，一旦出现就要高度警惕：第一，需求文档评审会上，客户、产品、开发三方对同一功能的理解出现分歧，但最终以‘先按文档来’强行通过。这种‘理解不一致’是最大的定时炸弹。第二，项目中期（比如第4个月）没有任何可运行的演示版本，团队还在埋头写代码和文档。

第三，团队内部沟通频率骤降，大家各自做各自模块，很少讨论边界和集成。具体避免方法，我推荐‘瀑布+轻量验证’的混合策略：在瀑布的每个阶段末尾，强制做一个‘可交互原型’或‘关键功能Demo’，而不是仅仅纸上谈兵。

比如，需求阶段结束后，不是出PRD，而是用Axure或Figma做一个可点击的原型，让客户‘玩’一下。我们团队曾用这个办法在第三个月就发现客户想要的按钮逻辑和我们想的天差地别，及时改掉，避免了后续半年的错误开发。

另一个做法是‘逆计算’：在项目开始前，把客户脑子里最不确定的3个假设列出来，然后先花2周做一个‘死亡验证’，就是最快的方式验证最危险的风险。比如假设用户登录流程没问题，那就先写个简陋登录界面让客户体验。这个做法看起来像敏捷，但本质是在瀑布的骨架里加入‘反馈血管’，不死板。

数据上，我用这种方法把‘全重来’的概率从40%降到8%。

3. 瀑布项目已经做了一年，客户要求全重来，团队士气崩溃，还有机会翻盘吗？具体该怎么止血和重建？

我们刚刚经历了‘交付即重来’的噩梦，客户说整个框架都要推翻，团队现在死气沉沉，每天都在互相指责。老板要求两个月内拿出新版本。这种情况下，还有救吗？我们是应该彻底重写还是改造现有代码？怎么让团队恢复信心？

有过两次类似经历，我可以很肯定地说：有机会翻盘，但必须用‘外科手术式’的重构，而不是推翻重写。第一次我错误地选择推倒重来，结果团队花了三个月重写，上线后又发现老bug没解决，客户更不满意。第二次我采用‘渐进式替换’策略，最终4个月上线，客户评分8.5。

止血步骤： 1. 立即停止开发，搞清‘必须保留的’和‘必须砍掉的’。把现有代码按模块标记为‘可复用’、‘需改造’、‘直接报废’三类。我上一个项目有20万行代码，最终发现只有35%的核心逻辑是可复用的，剩下的都是因为错误假设而写的死代码。

和客户一起画一个‘最小可交付路径’：不要满足客户所有新要求，先挑出5个最关键的功能，用2周做出可用的原型。这个原型要能真实跑起来，哪怕丑。让客户‘摸到’新版本，建立信任。3. 引入‘每日站会+每两周演示’的临时机制：团队士气低是因为不知方向，频繁展示进展能打破绝望感。

我在项目里强制每天早会15分钟，只问‘今天要做什么让大家看到我活过来？’，结果两周后团队氛围明显改善。4. 心理层面：公开承认错误，不要甩锅。作为管理者或者核心成员，要主动说‘是我之前的规划有问题，导致大家白干’，然后一起制定新计划。这个姿态能减少内耗。

数据支撑：翻盘项目中，我们总投入2000人天，新写部分只占45%，复用35%，改造20%。最终交付时间比第一次预估提前30%。关键不是‘重写代码’，而是‘重写认知’。

4. 瀑布开发真的完全要被淘汰吗？在什么场景下瀑布反而比敏捷更合适？我该怎么判断选择？

最近朋友圈到处都在说‘瀑布已死，敏捷至上’，但我们公司是做军工软件的，需求稳定且安全要求极高，团队尝试敏捷后反而更乱了。我很困惑，瀑布是不是就完全不能用了？有没有明确的判断标准，让我能根据项目特点选择正确的方法？

瀑布不仅没有被淘汰，在特定场景下比敏捷更高效。我做过航空嵌入式软件项目，安全认证要求每个需求、每行代码都要可追溯，瀑布模式能提供清晰的文档链条，敏捷反而因为迭代频繁导致认证失控。我的判断框架是‘三个十字轴’： – 需求稳定性：如果需求在未来1-2年内变化概率小于20%，瀑布更省成本；

如果变化概率大于50%，必须用敏捷。- 反馈闭环周期：如果客户/用户能每1-2周给出反馈，用敏捷；如果反馈要等半年甚至一年（比如硬件外场测试），瀑布是唯一选择。- 合规与审计要求：如果项目需要严格的阶段门审计、文档签核（如药企、航空航天），瀑布提供了天然的合规路径。

我另一个亲身案例是一家医疗器械公司，他们开发CT机控制软件。需求三年才变一次，我们采用瀑布，前6个月写完整需求，中间12个月开发，最后6个月集成测试，一次通过药监局审核。如果换成敏捷，迭代中的文档碎片化反而会让审核员质疑。所以不要盲目跟风。

我的建议是：用‘风险’而非‘效率’作为决策标准，如果项目最大的风险是‘需求变’，选敏捷；如果最大风险是‘安全’或‘合规’，选瀑布。更聪明的做法是做‘混血’：在核心安全模块用瀑布，在辅助界面功能上用敏捷。

我在那个航空项目中就是这样做的，核心飞控代码瀑布，座舱显示界面敏捷，两者之间通过严格接口定义对接。效果很好。

核心关键词

读者评论

唐

唐悦

作为项目管理者，读完浑身冷汗。延迟反馈就是慢性毒药。文中的批量导入例子我遇到过：产品说‘支持Excel导入’，但没人定义模板谁出、格式校验规则，上线后用户导入失败全赖开发。作为产品经理，我以前也追求白纸黑字签字确认，觉得这样就能规避风险。不然就像这项目一样：每个人都对，但产品是错的。

韩

韩知行

文中‘假性进度’那段太真实了，模块各自完美，集成却崩溃。阶段评审只检查文档一致性，却从不验证方向正确性。, "做过瀑布开发的程序员都懂那种无力感。瀑布模式把所有人都变成工具人，却没人对端到端体验负责。但客户业务在变，市场在变，把预测当合同执行必然翻车。

周

周然

我们团队也经历过类似阶段：每个里程碑都绿了，但没人敢问‘客户还认吗？这个案例提醒我，再严格的流程也抵不过一个简单的缺失：定期把半成品给客户看。需求文档写得像判决书，设计师、开发、测试各干各的，信息层层衰减，最后背锅的却是写代码的。, “这个复盘最让我触动的是‘需求文档不是合同’那一段。现在反思，应该设计‘需求重新对齐’机制，哪怕每个季度花半天跟客户过一遍优先级变化。

文章包含AI辅助创作：瀑布开发做了一年，交付时全重来，发布者：fiy，转载请注明出处：https://worktile.com/kb/p/3978854