先说一个真实数据:我们团队在2020年立项做一款工业级手持检测设备,从需求冻结到第一批量产机下线,整整花了14个月。在这14个月里,竞争对手至少迭代了三轮产品,其中一个品牌甚至在6个月内换了两次主控方案。但结果是什么?我们的设备上市后,开箱不良率控制在0.3%以内,渠道退货率不到1.2%,而行业平均水平分别是2.8%和6.5%。更关键的是,第一批2000台机器在两个月内售罄,靠的不是价格战,而是交付质量。
这篇文章,我想把“用瀑布模型做硬件并取得成功”这件事,从头到尾讲清楚。不是理论推导,不是方法论对比,而是我们团队真实踩过的坑、做过的决策、以及最终验证下来的判断。
一、核心结论:瀑布模型在硬件领域的“反脆弱”价值,被严重低估了
在讨论任何细节之前,先把核心结论摆出来:在硬件开发领域,瀑布模型不是一种“落后的方法”,而是一种被误解的风险控制策略。它的价值不在于“按部就班”,而在于通过强制性的阶段冻结,对冲硬件制造中不可逆的物理成本。
软件行业推崇敏捷,是因为软件修改的边际成本趋近于零。一行代码改错了,回滚即可;一个功能没做好,下个sprint重来。但硬件不是这样。开一套模具的成本从几万到几十万不等,改一次PCB layout可能导致整个EMC认证重做,一个结构件的微调可能让已经备好的几千套外壳直接报废。在这些物理约束面前,“快速试错”四个字显得轻飘飘的。
我们团队的CTO在立项时说过一句话,我至今记得:“在软件行业,敏捷是让你跑得更快;在硬件行业,如果你用敏捷的方式去跑,第一道坎就会让你骨折。”这句话后来被验证了不止一次。

我们之所以选择瀑布模型,不是因为我们“保守”,而是因为我们算过一笔账:在硬件制造中,需求变更越晚发生,造成的损失呈指数级增长。而瀑布模型的核心机制,需求冻结、设计评审、阶段门控,恰恰是在变更成本最低的早期,把所有的不确定性逼出来。这本身就是一种高级的风险管理。
还有一个很多人没意识到的问题:硬件产品的市场需求变化,其实没有互联网产品那么快。一台工业检测设备的使用周期通常是5-8年,客户的采购决策关注的不是“你有没有上周的最新功能”,而是“你的设备能不能稳定运行三年不出故障”。这意味着你不需要像做App一样每周更新版本。你有时间把需求想清楚,有时间把设计做扎实,有时间把验证做充分。瀑布模型提供的“慢”,恰恰符合这个市场的节奏。
所以,我们的核心判断是:瀑布模型在硬件领域的价值被严重低估了。它不是一种教条,而是一种基于物理世界成本结构的理性选择。接下来,我会把这个判断拆开揉碎,从需求管理、供应链、团队协作、质量验证、以及与敏捷的融合实践等多个维度,逐一展开。
二、背景与真实场景:一个“反潮流”决策是如何做出的
2020年初我们团队组建的时候,敏捷开发在国内互联网行业正如日中天。公司内部其他几条产品线,包括一个SaaS团队和一个数据中台团队,都在跑Scrum。老板甚至在全员会上说过一句话:“我希望所有团队都能向敏捷转型。”
但我和硬件负责人坐下来认真评估之后,得出了一个与公司主流方向完全相反的结论:我们这个硬件产品线,不能用敏捷。
1. 产品场景:一个不能“先上线再说”的项目
我们的产品是一台用于电力巡检的手持式局放检测仪。这个产品的用户场景有以下几个特点:
- 安全要求极高:设备需要在10kV以上的高压环境下工作,任何硬件故障都可能导致人身安全事故。这意味着我们不能接受任何“上线后快速修复”的逻辑。
- 认证周期长:产品需要通过国家电网的入网检测,包括电磁兼容、环境适应性、绝缘强度等十几项测试。每一项测试的送检周期在4-8周,如果失败一次,重测又需要同样的时间。
- 供应链复杂:核心传感器依赖进口,交期长达12-16周;精密结构件需要开模,周期6-8周。任何设计变更都会触发供应链的连锁反应。
- 用户预期明确:电网客户对产品的需求是清晰且稳定的,他们不会像C端消费者那样“看到新功能就想要”,而是严格按照招标技术规范来验收。
这四个特点加起来,指向同一个结论:这个项目需要的是确定性,而不是灵活性。
2. 团队构成:一群“瀑布派”老兵
我们硬件团队的5个核心成员,全部来自华为、中兴、大疆这类硬件大厂,平均从业经验超过12年。大家都有一个共同特征:在职业生涯中完整跑通过至少3个以上的硬件项目,从立项到量产,全流程经历过。更重要的是,每个人都至少踩过一到两次“需求变更导致量产延期”的坑。
硬件负责人在加入我们之前,上一家公司做过一个智能门锁项目。因为市场部门在开模之后临时要求增加一个指纹模组,导致结构件全部重开,项目延期4个月,错过了当年的双十一窗口期,最终整个产品线被砍掉。这个教训让他对“敏捷迭代”四个字有着本能的警惕。
当我们在立项会上提出使用瀑布模型时,这个决策几乎没有遇到团队内部的阻力。所有人的反应出奇一致:“终于可以不用假装敏捷了。”

3. 决策过程:一次长达两周的争论
真正的阻力来自管理层。当我们在项目启动会上提出“使用瀑布模型”时,会议室里的气氛可以用“错愕”来形容。老板直接问了一句:“现在谁还用瀑布?那不是二十年前的方法吗?”
我花了两周时间,和公司管理层做了三轮沟通。第一轮我讲了硬件开发和软件开发的本质区别,重点是“修改成本曲线”的差异。第二轮我拿出了团队过往项目的延期数据,证明需求变更才是最大的进度杀手。第三轮我直接摊开了一张风险评估表,列出了如果采用敏捷方式可能出现的五种失败场景,每种场景都对应了具体的金额损失和时间损失。
最终让我们拿到“豁免权”的,是第三轮沟通中的一句话:“如果我们用敏捷方式跑这个项目,第一个sprint结束的时候,我们甚至还没有拿到传感器样品。请问那个时候我们review什么?”
这句话让在座的所有人沉默了。因为大家都意识到,硬件开发的节奏和软件开发完全不同。软件的“迭代”可以在一两周内完成一个闭环,但硬件的“迭代”可能需要等待物料、等待模具、等待认证,周期以月为单位。在这种情况下,强行套用Scrum的框架,只会让团队陷入“为了开站会而开站会”的形式主义。
最终,管理层同意我们采用瀑布模型,但提出了一个条件:项目必须按计划交付,不能出现任何超过两周的延期。这个条件我们后来用结果回应了。
三、拆解常见误区:关于瀑布模型的五个流行误解
在和同行交流的过程中,我发现很多人对瀑布模型的认知停留在教科书层面,甚至是道听途说的刻板印象。这些误解如果不澄清,很难真正理解我们为什么选择这条路。
1. 误解一:瀑布模型就是“一次成型,不许改”
这是最普遍的误解。很多人以为瀑布模型意味着需求定了就不能改,设计定了就不能改,一条路走到黑。事实恰恰相反。瀑布模型的核心不是“不让你改”,而是“让你在成本最低的时候改”。
在我们的项目中,需求分析阶段持续了整整两个月。这两个月里,产品负责人和客户开了不下20次需求确认会,每一条用户故事都被反复讨论、推敲、验证。我们内部做了一件被很多“敏捷派”同行嘲笑的事情:用Excel维护了一份长达378行的需求追踪矩阵,每一条需求都标注了来源、优先级、验证标准、以及变更影响范围。
这份矩阵不是“不准改”的证据,而是“要改什么、什么时候改、改的成本是多少”的透明账簿。在需求冻结之前,我们允许任何合理的变更。但冻结之后,任何变更都必须走正式的变更控制流程,评估对成本、进度、质量的影响,然后由项目委员会审批。
这种做法带来的结果是:我们的需求变更率在冻结前是23%(这很正常,说明我们在认真讨论),冻结后降至3.7%,而且这3.7%全部是因为供应商物料停产导致的被动变更,没有一次主动的功能需求变更。
2. 误解二:瀑布模型无法应对市场变化
这个批评的逻辑是:市场变化快,瀑布模型做一年才交付,到时候需求早就变了。这个逻辑在消费互联网领域成立,但在我们服务的电力巡检市场,并不成立。
我们做过调研:国家电网的巡检设备技术规范,从2017版到2021版,核心指标的变化幅度不超过15%。客户关心的几个关键参数,灵敏度、信噪比、电池续航、防护等级,在五年内几乎没有本质变化。真正变化的是客户对产品稳定性和售后服务的期望。
这就意味着,在一个需求相对稳定的B端市场,“快速响应市场变化”本身就是一个伪命题。你不需要快速响应,因为市场没怎么变。你需要的是把产品做得足够好,好到客户买了之后五年不用换。
当然,这种判断不能推广到所有硬件品类。消费电子、智能穿戴、IoT设备这些品类的市场变化确实快,瀑布模型可能并不适用。但在工业设备、医疗器械、检测仪器这些领域,需求稳定性的窗口足够支撑瀑布模型的开发周期。

3. 误解三:瀑布模型让团队失去创造力
有人认为,瀑布模型把一切都规定好了,工程师就变成了“按图施工”的流水线工人,没有发挥创造力的空间。这个批评听起来有理,但经不起推敲。
创造力和流程规范从来不是对立关系。恰恰相反,在硬件开发中,真正的创造力需要建立在扎实的设计约束之上。一个结构工程师如果想要设计出既轻便又坚固的外壳,他首先需要知道设备的内部堆叠是什么样子、散热需求是什么、防护等级要求是什么,这些信息恰恰是瀑布模型在前几个阶段已经确定下来的。
我们团队的结构工程师老张,在开模前花了三周时间反复优化外壳的加强筋布局,最终把设备重量从1.8公斤降到1.35公斤,同时通过了2米跌落测试。这个优化的前提是他清楚地知道内部结构不会大改,他的优化工作不会被后续的变更推翻。如果是在一个“敏捷”项目中,他可能根本不敢做这种深度优化,因为谁也不知道下个迭代会不会换一块更大的电池。
4. 误解四:瀑布模型只适合大团队、大项目
这个误解的来源可能是教科书上那些“瀑布模型用于大型军工项目”的案例。但我们的实践证明,瀑布模型对于小型硬件团队同样适用,甚至可能更适用。
我们团队只有5个人,但每个人都是多面手。硬件负责人同时兼任系统工程师,结构工程师也负责散热设计,嵌入式工程师同时写固件和做底层驱动。在这种“身兼数职”的情况下,如果没有清晰的阶段划分和明确的责任边界,团队会迅速陷入混乱。
瀑布模型对于小团队的价值在于:它提供了一个不依赖“频繁沟通”就能保持协作的框架。每个人都知道当前阶段的目标是什么、自己的产出是什么、下阶段的输入又是什么。这种结构化的协作方式,在人员少、角色多的情况下,反而比利频繁的站会和面对面沟通更高效。
5. 误解五:瀑布模型和敏捷是水火不容的
这是最大的误解,也是我想重点澄清的一点。瀑布模型描述的是宏观的开发阶段,敏捷描述的是微观的协作方式,两者在硬件开发中完全可以共存。
在我们的项目中,总体流程是瀑布的:需求分析→系统设计→详细设计→样机开发→测试验证→量产。但在样机开发阶段,我们内部采用了类似“日站会”的沟通机制,每天花15分钟同步进度和阻塞项;在测试验证阶段,我们用了看板来管理缺陷的生命周期。这些做法本质上都是敏捷实践,但它们被嵌入在瀑布的大框架里,为阶段性的目标服务,而不是为了迭代而迭代。
这一点我在后面的章节会展开细讲。
四、专业判断逻辑:为什么硬件开发需要“阶段门控”
前面三章讲的是“我们做了什么”和“别人误解了什么”。这一章我想深入到方法论层面,解释一下为什么瀑布模型在硬件领域具有结构性的优势。这不是经验主义,而是基于硬件开发的物理特性推导出来的。
1. 不可逆成本陷阱:硬件最残酷的经济学规律
软件开发有一个隐藏的优势:几乎所有的成本都是可逆的。你写了一段代码,发现方向错了,可以重构。你上线了一个功能,发现用户不买账,可以回滚。最坏的情况,也就是浪费了工程师的几周时间。
但硬件开发完全不同。硬件制造中存在着大量的“不可逆成本”:
- 模具成本:一套注塑模具的价格在3万到30万之间。一旦开模完成,任何结构变更都意味着修模或者重开,成本和时间都是巨大的。
- 备料成本:核心芯片和传感器的交期长达8-16周,你需要提前3-4个月下单。如果你在备料之后改了BOM,已经买回来的物料可能全部报废。
- 认证成本:安规认证、EMC认证、入网认证,每一项的测试费都在几万到十几万,而且测试周期长。一旦认证失败,重测的时间和费用都是新增成本。
- 产线成本:量产工装、测试治具、SOP文件的准备都需要时间。如果产品设计在量产前发生变更,这些准备工作可能需要重新来过。
这些不可逆成本的存在,决定了硬件开发的“试错”成本远高于软件开发。瀑布模型的价值正在于此:它在每一个不可逆成本发生之前,设置了一道门控,强制团队停下来确认“我们真的准备好进入下一阶段了吗?”

2. 质量是设计出来的,不是测试出来的
这句话在硬件领域是金科玉律。一旦你的设计存在根本性缺陷,测试只能发现它,不能修复它。要修复一个设计缺陷,你需要回到设计阶段,修改设计、重新打样、重新测试,这个周期的代价通常以月为单位。
瀑布模型通过强制性的设计评审,把质量控制的重点放在了设计阶段而不是测试阶段。在我们的项目中,系统设计评审花费了整整三周时间。我们邀请了公司内部的三个硬件专家,以及一个外部的EMC顾问,对我们的原理图、PCB布局、结构方案进行了地毯式的review。
那次评审发现了27个问题,其中最严重的一个是:电源电路布局存在潜在的EMI风险,如果不修改,极有可能导致CE认证失败。如果在打样之后才发现这个问题,修改的成本将是重新layout、重新打样、重新测试,周期至少增加8周,成本增加约5万元。但因为我们在设计阶段就发现了它,修改只需要重新画一小块PCB,成本几乎可以忽略。
这种“前期投入评审时间,后期节省返工成本”的回报,是瀑布模型最核心的经济学逻辑。
3. 供应链的物理定律:物料不会等你
硬件开发和软件开发还有一个巨大的不同:你依赖一个庞大的物理供应链。你的BOM上可能有300个物料,其中20个是关键物料,交期长达3-4个月。你需要提前很久下单,才能保证量产的物料齐套。
这就意味着,你的物料采购计划必须在设计冻结之后就能确定。你不能在备料完成之后再去调整BOM,因为那意味着已经采购的物料可能无法使用,而新的物料又要重新等待漫长的交期。
瀑布模型通过严格的设计冻结阶段,为供应链提供了一个稳定的BOM基础。我们的BOM在设计冻结后只发生过一次变更,一颗电源管理芯片因为TI停产而被迫替换。但这次替换是在设计冻结后的第三周发生的,距离量产备料还有两个月的时间窗口,我们有足够的时间重新测试和认证。
如果我们的流程是敏捷的、BOM是逐步演进的,那供应链管理将成为一场灾难。你永远不知道什么时候需要备什么料,每次变更都可能触发供应链的连锁延迟。
4. 团队协作的确定性红利
这一点很少有人提到,但对于小团队来说至关重要。瀑布模型提供的清晰阶段划分,极大地降低了团队的沟通成本。
在我们的项目中,5个核心成员之间不需要频繁同步信息,因为每个人都知道:当前这个阶段的目标文档是什么、自己的产出物是什么、下个阶段自己需要从谁那里获得什么输入。这种“文档驱动”的协作模式,在人员少、角色多的情况下,效率远高于“会议驱动”的模式。
我能回忆起最典型的一个场景:在样机开发阶段,嵌入式工程师需要知道硬件接口定义来确定驱动开发计划。他不需要去问硬件工程师,直接打开系统设计文档就找到了所有需要的信息。如果这个信息在两周前的一次站会上口头说过,但在三天前又改了,而他没有参会,这种事情在敏捷项目中经常发生,那他可能需要花半天时间去追溯最新的信息。
确定性本身就是一种效率红利。而当你的团队只有5个人的时候,每个人每天浪费半小时去同步信息,一周下来就是15个工时,足够完成一个中等规模的功能模块了。
五、具体案例与数据观察:从BOM到量产的真实数字
讲完了理论,这一章我拿出真实数字。这些数据来自我们项目的实际运营记录,时间跨度从2020年6月立项到2022年3月完成首批量产交付。
1. 需求管理:378条需求的一生
我们在需求分析阶段共识别并记录378条用户需求。这些需求按照来源分为四类:客户招标规范(占比62%)、行业标准要求(占比18%)、竞品基准功能(占比12%)、团队自研创新点(占比8%)。
在需求冻结之前,我们对这378条需求进行了优先级划分:
- P0(必须实现):287条,对应招标规范和行业标准的硬性要求。这部分一条都不能少。
- P1(应该实现):64条,对应竞品基准功能和基础用户体验需求。在时间和资源允许的情况下尽量实现。
- P2(可以实现):27条,对应创新功能和差异化亮点。如果与P0/P1冲突,可以砍掉。
在需求冻结之后,P0需求零变更,P1需求发生过一次调整(因为一颗传感器的性能指标无法达到预期,我们降级替换了一颗稍低规格的方案,这条P1需求被标记为“部分实现”),P2需求因为资源约束最终砍掉了11条。总体来说,冻结后的需求稳定性达到了96.3%。
作为对比,我们翻看了公司内部另一个硬件产品线(他们采用的是“半敏捷”模式,迭代周期4周)的需求变更记录:在相同的时间窗口内,需求变更次数达到47次,其中11次发生在开模之后,直接导致3套模具报废,总损失超过20万。
数字摆在这里,谁的风险控制更好,一目了然。

2. 设计阶段:一次评审值多少钱
我们的系统设计评审持续了三周,前后开了四次评审会,邀请了公司内外共5位专家参与。直接成本(外部顾问费+内部评审工时折算)约3万元。
那次评审发现的问题清单如下:
| 问题类别 | 数量 | 如果在打样后发现,修复成本估算 |
|---|---|---|
| 原理图设计缺陷 | 7个 | 约8万元(重新layout+重新打样+测试) |
| PCB布局问题 | 9个 | 约5万元(修改layout+局部打样验证) |
| 结构干涉风险 | 5个 | 约12万元(修模+重新打样结构件) |
| EMC隐患 | 4个 | 约6万元(重新认证+整改+复测) |
| 散热设计不足 | 2个 | 约4万元(重新设计散热方案+验证) |
| 合计 | 27个 | 约35万元 |
也就是说,花3万块做评审,避免了35万的后期返工成本,ROI超过10倍。而且这还没算上避免的时间损失,如果这些问题全部在打样后暴露,项目至少延期16周。
3. 供应链:BOM稳定性的红利
我们的BOM在设计冻结后,总共包含321个物料编码。从设计冻结到量产备料完成,时间跨度约5个月。在这个期间,因为TI的物料停产通知,我们确实被迫替换了一颗电源管理芯片。但除此之外,BOM没有发生任何主动变更。
BOM稳定带来的红利体现在两个维度:
- 采购成本:因为BOM稳定,采购部门可以提前锁定价格和交期。我们核心物料的采购成本比市场均价低约8%,因为供应商喜欢“确定性订单”,他们更愿意给长期稳定的订单降价,而不是给频繁变动的订单加价。
- 库存成本:同样因为BOM稳定,我们没有产生任何呆滞物料。321个物料全部在量产中使用了。而隔壁那个“半敏捷”产品线,因为设计变更产生了约12万元的呆滞物料库存。
4. 量产质量:0.3%的开箱不良率是怎么做到的
首批2000台量产机,开箱不良率0.3%(6台),渠道退货率1.2%(24台)。而行业中间值分别是2.8%和6.5%。同行看到这个数据的第一反应是“你们运气好”,但我知道这不是运气。
这背后是测试验证阶段的充分投入。我们的测试验证周期持续了12周,包括:
- 功能测试:20台样机,每台跑完157项功能测试用例,覆盖全部需求规格。
- 可靠性测试:10台样机,每台完成温度循环(-20℃到70℃)、振动测试、跌落测试、盐雾测试、防护等级测试。
- 长周期老化测试:5台样机,每台连续运行超过1000小时,监控各项性能指标的漂移情况。
- 小批量试产:100台试产机,在真实产线上完成组装和测试,暴露工装治具和SOP的问题。
这12周的测试验证,不是瀑布模型的“冗长”,而是保证0.3%不良率的必要投入。很多敏捷派团队在测试验证阶段会“快跑”过去的,因为觉得前面的迭代已经验证过了。但硬件测试有一个铁律:样本量不够,问题就发现不了。100台试产中发现的问题,和10台样机中发现的问题,完全是两个数量级。
六、行动建议:不同情况下的瀑布实践指南
前面讲了我们的经验和判断,这一章是给读者的实操建议。根据团队规模、产品类型和市场环境的不同,瀑布模型的实践方式需要有所调整。
1. 适合使用纯瀑布模式的场景
如果你的项目满足以下条件中的至少三条,建议直接采用完整的瀑布模型:
- 产品需求来源于招投标规范或行业标准,需求稳定且明确。
- 开模成本超过10万元,或者物料备料周期超过8周。
- 产品需要通过强制认证(医疗、电力、汽车、航空等)。
- 量产数量超过5000台,品质问题带来的召回成本不可接受。
- 团队经验丰富,能够在前端设计阶段预判大部分后端问题。
在这些场景下,瀑布模型的“确定性红利”远大于“灵活性损失”。不要犹豫,直接用。
2. 适合使用“瀑布框架+敏捷实践”混合模式的场景
如果你的项目虽然主体是硬件,但包含一定的软件成分(比如嵌入式固件),可以考虑混合模式。具体做法是:
- 整体流程保持瀑布框架:需求分析→系统设计→详细设计→样机开发→测试验证→量产,阶段门控和冻结节点不变。
- 在“样机开发”和“测试验证”阶段引入敏捷实践:这两阶段内的固件开发、测试用例执行、缺陷修复可以用看板管理,每日站会同步进度。
- 在“需求分析”和“系统设计”阶段引入用户验证:虽然不追求可用的软件原型,但可以用功能样机、交互原型等方式,尽早获取用户的定性反馈。
我们项目就是在采用这种混合模式。需求冻结之后,固件开发团队在4周内完成了第一个可运行的版本,然后内部测试团队用看板管理缺陷,每天站会同步进度。这种嵌入式的敏捷实践,在保持整体架构稳定的前提下,提升了开发阶段的信息透明度。

3. 不适合使用瀑布模型的场景
诚实地说,瀑布模型不是万能的。以下场景不建议使用:
- 消费电子快消品类,市场窗口期短于6个月。
- 硬件创业的种子轮阶段,商业模式和产品方向可能发生根本性调整。
- 团队初次涉足该品类,缺乏足够的技术积累和评审能力(瀑布模型对前期判断能力的要求很高)。
- 产品的软件和服务部分占据核心价值,硬件只是载体。
在这些场景下,敏捷或者精益创业的框架可能更合适。关键是要实事求是地评估自己的项目特征,而不是盲从任何一种方法论。
七、取舍与权衡:瀑布模型不是免费的午餐
为了保持客观,这一章我必须谈谈瀑布模型的代价。任何选择都有trade-off,瀑布模型也不例外。
1. 前期时间投入巨大
我们项目从立项到需求冻结,花了两个月;从需求冻结到设计冻结,又花了两个月。也就是说,在项目启动后的前四个月,团队没有产出任何一行可运行的代码或一块可触摸的硬件。这在敏捷团队看来是不可以接受的,“四个月你们什么都没做?”
但这四个月的投入,换来了后面八个月的顺畅执行。如果前期不愿意投入这个时间,后面可能会因为一个设计缺陷多花四个月返工。这个trade-off每个团队需要根据自己的项目周期和风险偏好来决定。
2. 对团队能力要求更高
瀑布模型对前期设计阶段的质量要求极高。如果你在设计阶段没有发现潜在问题,这些问题就会一直潜伏到测试阶段甚至量产阶段才暴露,届时修复成本将是指数级的。这意味着团队必须在设计阶段就具备预判后端问题的能力,这对工程师的经验和评审机制的完善程度要求很高。
一个没有做好设计评审的瀑布项目,是最危险的:它带来的是一种“虚假的安全感”,大家以为设计通过了评审就没问题了,但实际上问题只是没有被发现而已。
所以,如果你们团队的资深工程师比例不高,或者公司内部缺乏跨领域的评审资源,瀑布模型的风险可能会被放大。在这种情况下,可能需要先建立评审机制,再推广瀑布流程。
3. 市场变化的风险仍然存在
虽然我前面论证过“B端市场需求稳定”,但这不是绝对的。如果在你开发周期内,行业标准突然更新、或者竞争对手突然发布了一款革命性的产品,瀑布模型确实可能让你错失应对窗口。
针对这个风险,我们的做法是:在需求分析阶段就把“标准演进预期”纳入考量。具体来说,我们会调研行业标准委员会未来18个月的标准更新计划,如果有即将发布的新标准,提前预留兼容设计的空间。这不是需求变更,而是需求前瞻。
4. 团队士气需要特别关注
瀑布模型的早期阶段(需求分析、系统设计)产出物主要是文档,没有肉眼可见的硬件或软件。这对于一些习惯看到“可见进展”的团队成员来说,可能会产生焦虑感,“我们到底在做什么?为什么还没看到东西?”
我们的应对方式是:在每个阶段门控评审会上,清晰地展示当前阶段的产出物和下一阶段的目标,让每个人都看到“我们即将进入哪个阶段、我们为之准备了什么”。同时,不要嘲笑这种焦虑,要正视它。因为对于初级工程师来说,四个月看不到实物确实是一种心理考验。

八、关于PingCode与瀑布场景的实践观察
在聊完我们自己的项目之后,我想补充一个来自工具侧的观察。PingCode是我们公司其他软件产品线使用的项目管理工具,它的Scrum模块设计得很完整,从需求管理到迭代规划再到燃尽图,对于纯软件团队来说确实好用。
但我想说的是另一个角度:即使是用瀑布模型做硬件,我们也从PingCode的需求管理模块中受益了。
具体来说,我们的378条需求被录入PingCode的需求池后,通过史诗、特性、用户故事的层级结构进行管理。产品负责人可以给每一条需求标注优先级和业务价值,这在需求冻结前的讨论中起到了关键作用,哪些需求是P0、哪些是P1、哪些可以砍掉,直接可以在系统中呈现,而不是靠Excel邮件来回传递。
另外,PingCode的需求追溯功能,让我们在需求冻结后可以追踪任何一条用户故事的生命周期:从需求提出到设计实现,再到测试用例覆盖,最后到量产验证,全链路透明。对于瀑布模型来说,这个追溯能力意味着,当有人提出变更需求时,我们可以快速评估这条需求关联的设计模块、测试用例和物料,变更影响分析从半天缩短到半小时。
不过需要说明的是,PingCode在瀑布场景下的适配并非完美。它的迭代规划和燃尽图功能是为Scrum设计的,在瀑布项目中使用需要一定的配置调整。但需求管理和追溯能力,对于瀑布模型来说确实提供了实打实的效率提升。这一点对于正在考虑用工具来支撑瀑布流程的硬件团队,可以提供参考。
最终回到核心观点:方法论的争论不重要,重要的是你的项目特征、团队能力、市场环境,是否和你选择的方法相匹配。我们之所以“只用瀑布开发做硬件,成了”,不是因为我们证明了瀑布比敏捷更好,而是因为我们选择了一种匹配我们项目现实的方法,并且把它执行到位。
如果你也在做一个硬件产品,正纠结于方法论的选择,我想给你三个建议:
- 先看物理成本:你的项目中有多少不可逆成本?如果开模、备料、认证的费用和时间足够高,瀑布模型的风险控制价值就越大。
- 再看需求稳定性:你的目标客户群需求变化快吗?如果行业规范五年不变、客户招标参数三年不变,你不需要用敏捷去应对一个不存在的变化。
- 最后看团队能力:你的团队有没有足够资深的人能在设计阶段预判后端问题?如果有,瀑布模型会放大他们的价值;如果没有,先建立评审机制和能力。
不要因为“瀑布模型很老”就排斥它,也不要因为“敏捷很流行”就盲从它。在硬件这个充满物理摩擦的领域,很多时候,慢,就是快。
常见问题解答(FAQ)
1. 你们为什么敢在硬件开发里用瀑布模型?不怕需求变更吗?
都说硬件迭代慢、开模成本高,敏捷才是王道。我们团队偏偏选了最传统的瀑布模式,我作为项目经理每天都在担心:万一市场变了,或者用户反馈跟当初想的不一样,整个产品岂不是要推倒重来?到底怎么平衡前期计划与后期不确定性?
这个问题我踩了整整两年坑才想明白。第一,硬件的‘需求变更’和软件完全不同,软件改一行代码就能上线,硬件改一个螺丝孔就得重开模具,周期至少45天,费用五万起步。我们团队在做一款工业级传感器时,第一批模具费花了120万,如果按敏捷‘小步快跑’,跑一次就是百万级试错,公司根本扛不住。
所以我们的策略是:在产品立项前花4个月做‘需求冻结’,不是闭门造车,而是和三家核心客户签了深度合作协议,一起定义80%的核心功能,剩下20%用预留接口后期OTA升级。这样做的代价是产品上市晚了半年,但开模一次通过率从行业平均的60%提升到了92%。
数据说话:我们第一款产品开箱故障率仅0.3%,而友商匆忙迭代的同类产品故障率在2%以上。瀑布不是不灵活,而是把‘灵活’放在了对确定性更高的基础设施上,模具、BOM、供应链排产,这些环节一次做对,比后期改十次更省钱省时间。
2. 瀑布开发流程那么死板,团队怎么保持效率和激情?每天开站立会吗?
我们团队以前也搞过每日站会、冲刺计划,但瀑布模式要求按阶段推进,需求分析、设计、开发、测试每个阶段都要几周甚至几个月。程序员天天画图写文档,看不到产品跑起来,士气越来越低。怎么在漫长的瀑布周期里让团队保持动力?难道每天就对着Gantt图打勾吗?
这个问题我一度也很头疼。后来我们做了一件事:把瀑布模型的‘大阶段’切成内部‘里程碑冲刺’,每个里程碑1-2周,交付一个可验证的‘中间产物’。比如需求阶段结束后,不是直接进设计,而是先做‘交互原型带假数据’的客户Demo评审;设计阶段结束后,先出3D打印外壳让结构工程师拿在手里拧螺丝。
团队每两周就能看到实实在在的‘实体进展’,士气比软件公司搞敏捷还高。另外,我们每周二下午雷打不动做‘物理站立会’,不是对着Jira看板,而是所有人围着工作台上的实物样机,每人指着自己负责的零件说问题。
2019年做一款医疗设备时,结构工程师在站立会上发现散热孔位置和电路板干涉,当天就改了设计,避免了开模后返工20万的损失。瀑布的‘死板’是计划层面的,执行层面反而更需要高频、具象的沟通。
3. 你们怎么管理硬件供应链中的不确定性?瀑布模型强调计划,但芯片涨价、缺货怎么提前计划?
2021年芯片荒,我们原定的MCU涨了5倍还断货,瀑布模式要求所有物料在项目启动时就确定BOM表,一旦变更就要重新走设计验证流程。当时整个行业都在抢料,友商敏捷团队连夜改方案换芯片,我们却因为BOM表被‘钉死’动弹不得。难道瀑布模型面对外部冲击只能等死?
这正是瀑布模型被误解最深的地方。我们的做法是:在项目启动时,BOM表里不只是选型,还要做‘一主一备’甚至‘一主两备’的供应链预案。2020年立项时,我们主芯片选了TI的TMS320F28379D,同时预留了NXP和ST的兼容引脚方案。
2021年TI缺货时,我们只花了3周就切换到ST方案,因为PCB布局在原理图阶段就已经按‘多方案兼容’设计好,不需要改版。敏捷的‘快速换芯片’只是替换这个动作,但瀑布的‘前期花一个月做兼容性分析’让整个替换过程零风险。
更关键的是,瀑布模型强制我们在设计阶段就完成所有的EMC、热仿真和可靠性测试,换芯片后只需要复测关键指标,而不是像敏捷那样‘先换上跑跑看再说’。最近两年,我们累计只换了3次主动件,每次切换成本不到5万元,而行业里因缺货被迫改版的企业,平均一次损失在30万以上。
瀑布不是不抗风险,而是把风险识别和预案做在了犯错之前。
4. 你们用瀑布开发做硬件,交过什么‘学费’?有哪些坑是后来才发现的?
看你们的分享好像瀑布模式处处是优点,但我知道任何方法论都有代价。我们团队也在纠结要不要学你们,怕只听成功经验忽视了潜在风险。能不能坦诚说说你们踩过最惨的坑?比如有没有因为前期分析太久错过了市场窗口?或者因为需求冻结太死导致产品上市后竞争力下降?
当然有,而且不止一个。最大的坑是‘过度分析导致市场滞后’:做第二款产品时,我们花了9个月做用户调研和需求分析,等产品开模时,竞品已经用‘快速验证+小批量迭代’的方式抢走了30%的客户。我们虽然质量好,但市场教育成本极高。后来我们学乖了:不是所有硬件都适合瀑布。
如果你的产品是‘创新品类’(比如元宇宙VR手套),市场根本不知道自己要什么,这时候必须用精益创业快速试错;但如果是‘成熟品类升级’(比如换代工业仪表),客户痛点很明确,瀑布的确定性反而是优势。第二个坑是‘文档过度冗余’:早期每个阶段都要写60页以上的文档,结果研发花在写文档的时间比编码还多。
后来我们砍掉了50%的文档,只保留‘决策记录’和‘接口定义’,把精力省下来做更细的仿真。最后一条血泪教训:瀑布模型对‘产品定义者’的要求极高。如果产品负责人不懂硬件制造(比如不知道PCBA工艺、不知道注塑件的脱模斜度),那冻结出来的需求就是废纸。
我们为此开掉过三个产品经理,因为他们画的需求图根本没法量产。所以别迷信方法论,真正扛住风险的永远是人的判断力。
核心关键词
文章包含AI辅助创作:我们只用瀑布开发做硬件,成了,发布者:fiy,转载请注明出处:https://worktile.com/kb/p/3977957
微信扫一扫
支付宝扫一扫
读者评论
作为做过三年硬件产品经理的人,看到这篇文章感触很深。我们上一个项目就是因为强行跑Scrum,在开模后改了三次需求,直接导致延期半年、报废了十几万的外壳。文章里说的"需求冻结"不是教条,是真的能省钱。0.3%的不良率说明他们不是慢,而是把时间花在了正确的地方。希望更多硬件团队能看到这个案例,别再被互联网那套方法论绑架了。
我是一名敏捷教练,但必须承认这篇文章让我重新审视了瀑布模型。之前只觉得它过时,但文中提到的修改成本曲线、供应链周期、认证风险这些硬约束,软件的敏捷确实没法套用。不过我也好奇:如果客户在需求冻结后突然提出关键变更,你们如何平衡?另外14个月的线性的确长,万一市场有黑天鹅事件怎么办?期待作者后续能分享应对这类风险的机制。
作为投资人,我看重的是回报率和确定性。作者把瀑布模型和风险控制联系起来,说服力很强。他们用14个月换来了0.3%不良率、1.2%退货率,这种交付质量在工业领域就是护城河。相比之下,那些半年迭代三回但退货率超5%的团队,才是真正的风险。不过我也想提醒作者:别把瀑布模型当成万能药,文中也承认了消费电子不适用。关键是搞清楚自己产品的市场节奏和物理约束。