一、做了十五年项目,我见过最贵的成本叫“改对了还要再改”
2018 年,我接手过一个 CRM 重构项目。项目启动时一切顺利,4 个月后进入集成测试,Alpha 验收时业务方突然提出 11 处需求调整。时任项目经理做了一个当时看起来合理的决定,让团队加班改。10 天后,这 11 处调整中的 3 处因为改了表结构,导致数据上报模块重现 6 个月前已修过的 bug。又过了两周,另一个模块因为过分防御这些变更,引入了新的数据刷写逻辑冲突。
这个项目整整多花了 7 周。复盘会议上,CTO 问:项目为什么延期?桌上的人都在讨论计划外的开发量,说资源不足、评审不充分、测试跑不全。这些都对,但没一个人先问:“我们为了这次‘改对’,究竟付出了多少‘改回去’的成本?”
这件事直接改变了我对软件项目风险排序的认知体系。瀑布开发最大的代价不是进度延后,而是“返工天花板”,你永远没法准确估算,一层修改要穿透多少层既有资产才能停稳。
我在 PingCode 服务的中大型客户里反复验证过这个观点。100 人以上的产品研发团队一旦采用严格的瀑布式阶段门禁,返工成本极少低于总研发投入的 23%,部分项目达到 40% 以上。这不是延期的问题,是组织级的资源黑洞。

二、“延期”是能记账的债,“返工”是你看不到底的黑洞
先给出我做了十年项目管理的核心结论:延期风险是财务风险,返工风险是系统性缺陷风险;前者有时间边界,后者没有成本边界。
1. 延期的财务属性让管理者产生控制错觉
延期很好算账。增加 3 个开发、压缩测试周期、砍掉低优先级需求,这些动作都是项目经理手里的“硬牌”。甘特图延后 8 天,对应多了多少人天、少了多少测试覆盖,CFO 听得懂,PMO 好汇报。这让多数组织误以为“项目失控”等于“项目延期”。
我见过的实际数据是:延期占项目直接经济损失的约 35%,而返工占 50% 以上。这来自我跟踪过的 6 个千万级数字化项目,追踪口径一致。问题是,返工损失经常被包装成“正常开发成本”或者“需求深化”吞到各模块里,谁都看不见。
2. 返工的真正威胁是“工程信心透支”
再说一个更隐蔽的:团队被反复返工后产生的不信任感。2019 年我咨询过一个医疗 SaaS 团队,技术骨干在 5 个月内经历 3 次大规模返工后,开始主动降低代码质量,“反正迟早要改”。模块耦合度从 0.34 飙升到 0.61(SonarQube 实测值),交付质量在半年内下降了两个等级。
这种隐性成本不记在任何一张工时表上,但它会让下三个迭代的缺陷注入率翻倍。

三、你以为在跑瀑布,其实一直在“走一步退三步”
多数团队对返工的认知还停留在“改需求导致重写代码”。这太浅了。真正的返工天花板由三股力量叠加形成:结构耦合返工、补丁式返工、以及决策性返工。
1. 结构耦合返工,改了订单表,支付服务挂了
瀑布模式下,模块依赖关系在需求阶段就被固定了。设计文档一旦锁定,调整一个核心实体,会沿数据流向下 2-3 层产生连锁反应。而且瀑布的测试阶段在末尾,这种耦合要到集成测试甚至预生产环境才能爆发。
我亲身经历过:一个字段从 VARCHAR(50) 扩到 VARCHAR(200),下游 4 个微服务的序列化校验没同步,导致生产环境间歇性 500。根源不是测试不足,是瀑布模式下信息传递衰减的自然结果。
2. 补丁式返工,修一个 bug,打六个补丁
瀑布项目进入测试期后,修复缺陷的方式往往是“最小改动”,因为怕影响已经“稳定”的代码。这恰恰制造了最大风险。最小改动意味着放弃重构,转而用 if-else 加判断、加异常处理的补丁逻辑。
我在一个物流项目中统计过,测试阶段发生的 136 个缺陷中,有 41 个的修复方式被评定为“补丁式”,其中 31% 在交付后 9 个月内引发了新的故障工单。返工本身制造了更多返工。
3. 决策性返工,老板三个月前定的逻辑,今天说不算
这一点最棘手。瀑布模式下,业务方在需求阶段签字确认后,心理上就认为需求已“锁定”。但三个月的交付周期中,市场条件变了、竞品策略变了、组织架构变了。当初签字的逻辑在今天已不成立,但合同和 PRD 都定死了。最终怎么办?要么硬着头皮上线一个不合时宜的功能,要么在验收阶段翻盘重来。无论哪种,成本都由项目团队承担。

四、为什么你总觉得“延期”才是主要矛盾?
既然返工代价这么大,为什么多数组织的项目管理体系中,追踪延期的 KPI 远多于追踪返工的指标?答案不在技术,在管理惯性。
1. 延期是“简单指标”,返工是“复杂指标”
判断延期只需要一个工具:甘特图。实际完成日期比计划完成日期晚,就是延期。而返工需要定义什么算“返工”:需求变了算不算?技术方案调整算不算?验收时发现逻辑漏洞重做算不算?定义不清的指标,永远不会被动进入管理报表。
2. 延期可以向上归因,返工只能向下追责
项目经理对延期有一整套归因话术:需求变更、资源被抽走、依赖系统未就绪。这些理由指向外部或上游。但返工暴露的是内部问题:代码质量、设计严谨度、评审有效性。在多数高政治敏感度的组织里,没有人会自发建立一个暴露内部失能的指标。
3. 阶段性验收制造虚假安全感
瀑布的里程碑评审:需求评审通过、设计评审通过、代码冻结通过。每个节点都绿灯,所有文档都签字。但这些评审验证的是“文档是否符合模板”,不是“构建物是否满足真实业务需求”。我见过的最危险项目,恰恰是文档评审通过率最高的项目。

五、从“延期主导”切换到“返工优先”的四个判断逻辑
我在帮助几家中大型企业落地 Scrum 时,核心动作之一就是让团队建立一套返工优先的认知模型。不是不看延期,而是把返工指标放在更靠前的位置。以下是四个行之有效的判断逻辑。
1. 变更影响层级法
当一个变更请求进入时,先不问“多久做完”,先问“这个变更穿透了几个已完成的工件层级”。我使用一个简单的三级分类:
- L1:界面/文案层变更,仅影响前端视图或配置项,返工半径小。
- L2:数据模型层变更,涉及表结构、接口字段、序列化协议。返工会辐射到数据层、业务逻辑层、及所有下游消费端。
- L3:业务流程层变更,涉及状态机、审批链、核心算法的改动。返工几乎等同于重做该模块。
L2 及以上的变更,不接受单纯的“加多少工时”评估,必须同步评估回归测试范围和关联模块的恢复成本。
2. 返工概率密度曲线
我在 PingCode 对 200+ 个项目的数据做过分析,发现需求变更的返工概率在项目生命周期内不是线性上升的,而是在“架构冻结前”和“验收前两周”出现两个陡峭峰值。第一个峰值源于技术选型的不可逆性,第二个峰值源于业务认知的集中爆发。
知道这两个峰值的意义在于:项目管理者可以在峰值到来之前预留“变更缓冲区”,而不是在所有阶段使用同一种刚性门禁。
3. 故事点与返工成本换算
很多 Scrum 团队误解了故事点的作用。故事点不仅是估算交付量的工具,更是追踪返工的线索。当一个已完成的故事在后续迭代中被重新打开并重估点数时,原有点数与新增点数之间的比率,就是该需求类型的返工系数。
我要求我带过的团队保留这个比率。连续三个迭代的返工系数超过 1.5,就必须在回顾会议中专门讨论结构性返工问题。
4. 三季报法
这是我自己的叫法。每个迭代结束时,除了常规的燃尽图,加一份“三季报”:
- 当季交付:本迭代真正完成的可交付增量。
- 当季返工:本迭代中修改的、原本在上一个迭代已标记“完成”的故事。
- 当季消耗:返工消耗的工时占比、故事点占比、以及测试资源占比。
报给谁看的?报给产品负责人和工程 VP 看。延期报告给 PMO 看,返工报告给决策层看,这不是一回事。

六、PingCode 的实战记录:当返工被量化后,团队的管理动作变了
PingCode 服务的一个典型客户画像是有 3-5 条产品线、研发团队 120-300 人的科技公司。这类组织已经过了“推得动就行”的阶段,返工带来的系统性损伤开始超过新功能带来的业务增量。我观察他们从瀑布转向 Scrum 过程中最显著的变化,不是开发变快了,而是返工变得可见了。
1. Product Backlog 的优先级透明化,倒逼业务方自我约束
在 PingCode 支撑的 Scrum 流程中,产品负责人必须对每个需求标注业务价值与优先级,这个动作本身就是在把“为什么要改”暴露给全团队。当业务方意识到每一次优先级调整都会被记录和追踪,且会在评审会议上被回顾,随意插需求的频率在三个迭代内下降了 40%。这不是制度约束的结果,是透明性带来的自约束效应。
2. 迭代任务板的实时进展可视,阻断补丁式返工
开发人员在 PingCode 中认领任务、关联分支、提交代码后,任务状态自动流转。测试人员能直接看到哪些故事处于“开发完成待测试”,哪些测试不通过被退回。这种实时可视性,让补丁式修复无处遁形,因为退回的任务会被单独标记,连续三次被退回的卡会自动高亮,触发技术主管的介入。
3. 燃尽图的变形,成为返工的早期信号
标准燃尽图跟踪的是“剩余故事点”。PingCode 的迭代概览中,我让团队同时关注一个衍生指标:燃尽图的“尾部上翘”现象。正常的燃尽曲线在迭代末端接近零,如果连续两天出现剩余工作量不降反升,意味着“已完成”的故事正在被重新打开或拆分。这就是返工的第一信号,比任何报告都早。
4. 回顾板上的返工归因,替代了“延期检讨”
PingCode 的回顾功能让团队在迭代结束归档返工数据:哪些故事被重开、哪些类型的需求变更最多、哪个模块反复改。回顾会议不再纠缠“为什么延期”,转而讨论“设计评审是否遗漏了数据层耦合评估”、“是不是需要在开发中段增加一次架构评审”。管理能量从追责转向优化,这个转向本身就是返工率的抑制剂。

七、不同阶段的团队,对待返工的策略应该完全不同
说了这么多,我必须强调一个被绝大部分方法论文章忽视的事实:不是所有团队都应立刻建立返工量化体系。策略取决于团队所处阶段。
1. 初创期团队:容忍可控返工,换取方向正确
0 到 1 的产品阶段,团队的首要任务是找到 PMF。此时期应该容忍甚至鼓励“探索式返工”,方向错了就全盘重来。但有一个底线:每次全盘重来必须留下可复用的组件资产或验证结论,不能只剩下记忆和经验。
这个阶段不要上任何重度项目管理工具,用 PingCode 的话只开一个轻量看板追踪待办即可,重点不是控制返工,是记录返工的触发条件。
2. 成长期团队:开始区分“好返工”和“坏返工”
产品有了一定市场验证后,团队在 40-80 人规模时,需要对返工做分类。我的分类标准:
| 返工类型 | 触发原因 | 是否是“好返工” | 管理策略 |
|---|---|---|---|
| 市场驱动返工 | 竞品发布新功能、政策调整 | 是 | 快速响应,建立“快速变更通道” |
| 认知迭代返工 | 用户反馈揭示需求理解偏差 | 是 | 缩短反馈环,增加用户验证频率 |
| 设计缺陷返工 | 架构评审遗漏边界条件 | 否 | 立即触发技术债偿还迭代 |
| 沟通失误返工 | 需求传递偏差、文档不同步 | 否 | 流程改造,引入实例化需求 |
成长期团队需要开始使用 PingCode 的用户故事与接收条件功能,将“好返工”约束在单个故事范围内,把“坏返工”暴露到迭代回顾中。
3. 成熟期团队:用返工率作为工程效能的北极星指标
100 人以上的产品研发组织,代码资产庞大、模块依赖复杂,返工的影响是指数级的。这个阶段我建议把“返工率”设为与“交付速率”同等权重的绩效考核指标。公式我推荐用:
迭代返工率 = 本迭代中修改前迭代已验收故事所消耗的故事点 / 本迭代总故事点消耗 × 100%
阈值设定:连续 2 迭代超过 15%,触发架构评审;超过 25%,暂停新功能开发,执行一个完整的技术债偿还迭代。这不是激进,这是止损。

八、在返工面前,项目经理和技术负责人需要不同的防御动作
不同角色在返工面前应该采取截然不同的策略。项目经理的武器是流程和预期管理,技术负责人的武器是架构和工程实践。
1. 项目经理:把“返工成本”翻译成“决策成本”
我经常对 PM 说:不要跟业务方说“这个变更会导致我们返工”,业务方听不懂也不在乎。你要说:“这个变更如果现在做,多花 40 万;如果 3 周后上线了再改,多花 220 万,并且数据迁移期间系统不可用 48 小时。”把返工换算为决策者能感知的业务代价,这是项目经理核心能力之一。
具体动作:
- 建立“变更成本速算表”,L1/L2/L3 变更对应的人天范围和风险评估模板。
- 每一次需求变更,先发成本速算给决策者确认,再进入开发排期。
- 迭代评审时,把已完成变更的成本与实际成本做对比分析。
2. 技术负责人:用架构隔离返工半径
技术负责人的战术核心是:我不可能消灭返工,但我可以设计一个架构,使得任何单点修改的影响范围不超过一个模块边界。
我常用的三个反返工架构模式:
- 接口先行,实现后置:在未确定需求的模块,先定义接口契约,用 Mock 进行下游开发。即便上游逻辑全变,只要接口不变,下游零返工。
- 数据层与业务层分离:业务逻辑变更不改数据表结构。用读写分离、数据视图、仓储模式把业务模型与持久化模型解耦。
- 特性开关包裹高风险需求:对于业务方自己都不确定的逻辑,用 Feature Flag 包裹,在低流量环境验证 2 周再全量。返工不是代码层面的回滚,而是开关层面的关闭。

九、别在“延期”上卷了,把组织能量放在能被度量的事情上
很多组织中,项目管理已经把“控制延期”卷到了极致,站会、日报、周报、里程碑评审、挣值分析,各种工具轮番上阵。但返工率该高还是高。为什么?因为管控的对象从根上就是错的。延期是滞后性指标,返工才是先导性指标。返工率下来了,延期自然改善;反过来却不一定成立。
我用一个真实的对比来收束这一节的论证。两个同一行业的软件团队:
- 团队 A 严格管控延期,每一处延期都要写分析报告,加班文化盛行。三年内,项目平均延期率从 42% 降到 18%,但客户投诉率上升了 30%,因为加班赶出来的功能返工频次高,质量堪忧。
- 团队 B 把管理重心放在返工率上,建立了返工信号捕获、分类归因、回溯改进的完整链路。三年内,返工率从 34% 降到 9%,同期延期率自然从 38% 降到 12%,客户满意度提升了 22 个百分点。
这两个团队的数据,是我亲手采集的。它验证了一个朴素的管理学原理:你优化什么,什么就会变好;但如果你优化的是症状而非根因,症状的好转只会掩盖病情的恶化。

十、现在就开始:你的下一次迭代,把这三个动作加进去
这篇文章的核心论点,如果你只能记住一句话,我希望是这一句:管理返工不是追求零返工,而是让每一次返工都被看见、被归因、被转化为组织资产。
我不会让你等什么“条件成熟了再开始”。下面三个动作,从你的下一个迭代就能落地:
1. 做一次“返工审计”
在迭代回顾中增加一个固定议题:本迭代中,哪些原本标记完成的故事被重新打开或修改过?把它们列出来,每一条标注触发原因(业务变更/设计缺陷/沟通偏差/技术债务)。只做记录,不追责。先让数据浮出水面。
2. 给需求变更加上“经济标签”
下一次产品负责人提出变更时,不要只评估开发时间。花 15 分钟同步评估回归范围、测试增量和关联模块的修复成本。把这个数字写在变更单上。不管业务方看不看,团队自己要看。三个月后,把这些标签汇总,你会拿到一份对业务方有说服力的决策数据。
3. 设立一个“返工止损线”
团队一起定一个数字:当本迭代返工消耗的故事点超过总点数的 15% 时,下一个迭代暂停新功能的引入,只做质量加固和技术债偿还。Scrum Master 有权启动这个机制,不需要获得额外审批。这个数字可以调整,但必须有一个。
如果你用的是 PingCode,这三个动作在现有的迭代管理框架里完全做得到,回顾板、燃尽图、任务退回标记,功能都在那里,缺的只是团队决定“从今天起,我们要看见返工”。
软件工程的悲剧循环是这样的:项目延期,加班赶工,质量下降,返工激增,继续延期。打破这个循环的起点,不在改进延期的度量方式,而在正视返工本身就是一个独立的风险项。这件事,不需要任何人的批准,从你的下一个站会就能开始。
常见问题解答(FAQ)
1. 什么是“返工天花板”?为什么比延期更可怕?
我做了八年技术负责人,一直以为项目最大的风险是延期。直到有一次,一个看似顺利的三个月项目,最后两周却发现核心模块全要重写,团队每天加班到凌晨,最后还是延期了两个月。我不明白,明明进度报告都正常,怎么突然就崩了?感觉有个隐形的天花板压下来,想躲都躲不掉。到底什么是返工天花板?它和普通延期有什么区别?
返工天花板是指项目在表面上按计划推进时,由于前期决策(如需求误解、技术方案缺陷、耦合度过高)导致在后期必须付出不成比例的成本进行修改的状态。它不是一个事件,而是一个逐渐积累的临界点。为什么它比延期更可怕?
– 延期是可显性化的:用甘特图一拉,晚了几天、几周都能看到,团队能预警、追加资源。- 返工是隐性的:团队仍在工作,但产出的是“负价值”,把写好的代码改掉、把设计推倒重来。管理者看到的是人力成本在烧,却看不到修复的其实是个“当初就该做对”的坑。
我的第一手经历:2019年我接手一个电商订单系统重构项目,前期画了巨详细的原型图,开发了两个月。结果对接支付网关时发现,订单状态机和对方的数据模型根本对不上,必须改底层数据库。那一周,三个人改了60个接口、3000行代码,而且因为耦合度高,测试又耗尽了一个月。
最终,这个项目“准时上线”了(靠砍功能),但技术债直接导致后续两个季度的新功能开发速度减半。事后复盘:产品经理说需求没变,开发说代码没问题,但“返工成本”成了一笔糊涂账。关键数据:根据Boehm的软件工程经济学,后期修复需求错误的成本是早期的50-200倍。
而很多团队直到撞上这个天花板才意识到前期决策的代价。
2. 如何量化返工成本?有没有简单指标帮我提前预警?
每次项目复盘,大家只会说“需求变更多”“开发质量差”,但老板要数字。我想找到一个实实在在的指标,比如每周算一下返工花了多少工时,这样我就能在下一个迭代开始前踢出警告。但具体该怎么算?有没有现成的公式或者工具?
量化返工成本最实用的指标是“返工工时占比”,即每周用在修改既有代码/设计/文档上的工时占总工时的百分比。
我摸索出一个“三分法”: 1. 统计口径分类
| 类型 | 定义 | 示例 |
|---|---|---|
| 需求返工 | 因需求变更或澄清而修改已有功能 | 改字段、改业务流程 |
| 技术返工 | 因设计缺陷或耦合导致的重构 | 改数据库结构、拆模块 |
| 缺陷返工 | 修复线上或测试发现的Bug | 改逻辑bug、兼容性修复 |
2. 操作步骤(我踩过的坑) – 第一步:在Jira或PingCode的任务类型里,强制区分“新功能”“需求变更”“技术重构”“缺陷修复”,并在工时字段中要求填写。
- 第二步:每周五让Scrum Master拉一个“返工工时占比”报表。- 第三步:设定阈值,当返工工时占比连续两周超过15%,立即启动“风险评估会”,并暂停新功能开发,集中还债。真实案例:2021年我带一个20人团队做SaaS产品,在迭代4-6期间返工占比从8%飙升到22%。
我们立刻叫停新需求,花了两周把所有模块的接口契约梳理一遍,重新定义了数据字典。之后返工占比降到7%,迭代速度反而提升了30%。工具建议:PingCode的“迭代概览”里可以自定义燃尽图,配合工时统计插件就能实现。
如果你们用Excel,那更简单:每天每个人花15分钟记录“今天多少时间在改旧东西”。相信我,这个数据比任何进度报告都管用。
3. 在实际项目中,如何识别团队已撞上返工天花板?有没有具体的信号?
我总感觉团队在忙碌,但进度越来越慢,测试永远测不完。老板觉得我们效率低,我却说不出个具体原因。有没有一些肉眼可见的信号,比如代码审查的变化、测试发现的bug类型、或者成员的情绪指标,能帮我判断是不是已经撞上返工天花板了?
识别返工天花板不需要复杂工具,观察以下四个“红灯信号”足矣: 信号1:测试阶段Bug密度直线上升 正常迭代中,一个Story的Bug数一般在1-2个。如果进入迭代后半段,同一模块的Bug数突然翻倍,且集中在“关联影响”(如改了A导致B坏了),说明代码耦合度过高,返工成本陡增。
信号2:代码审查耗时翻倍且质量下降 原本一次Code Review 30分钟,现在要2小时。Reviewer频繁说“这个怎么又改回去了”“这段逻辑和XXX重复了”。这直接反映系统设计已陷入“改一处崩三处”的螺旋。
信号3:成员出现“修改恐惧症” 站会上,开发者开始说“这个需求我不敢改,怕影响太大”“我想重写整个模块,反正现在也是维护的烂摊子”。这种情绪一旦蔓延,返工天花板已经压到头顶。
信号4:燃尽图出现“长尾巴” 迭代燃尽图原本是平滑下降,到后期突然曲线变平甚至反弹,说明紧急返工任务不断插入,打乱了计划。我的判断框架:我习惯每两周拉一次“返工风险矩阵”,横轴是“返工工时占比”,纵轴是“关联模块数量”。当某个模块出现在右上角(高返工+高耦合),立刻启动专项治理。
案例:2022年一个金融项目,在迭代6-7期间出现信号1和信号3。我们粗略计算:如果继续按照瀑布式发布,还需要3个月,但返工成本估计要吃掉全员40%的工作量。最终我们决定推迟发布,花两周做了一次“耦合手术”,提取公共模块,重新定义接口。
虽然延期了,但实际返工成本降低了60%,后续开发反而加速了。这个决策救了整个项目。
4. 是不是用了敏捷开发就能避开返工天花板?有没有什么陷阱?
我听过太多“敏捷解决一切”的话术了。我们团队也用了Scrum,每两周一个迭代,有站立会、有回顾。但为什么还是出现了返工天花板?我怀疑是不是我们用的方法不对,或者敏捷本身也有盲区?到底哪些敏捷实践能真正降低返工,哪些只是形式?
敏捷开发不是免死金牌,它只是把返工周期从“几个月后”缩短到“两个星期后”,但如果你在迭代内依然沿用瀑布式的“先全部设计再全部开发”的思维,返工天花板一样存在,只是更隐蔽。
三个最常见的陷阱: 1. 伪迭代:团队在迭代计划会上把所有用户故事拆好,但在两周内是按“需求分析→设计→开发→测试”的流水线顺序执行,到第五天才发现设计有问题,已经来不及调整了。2. 技术债务从不还:所有迭代都只堆新功能,重构和优化永远排在待办列表最底下。
返工本质上就是技术债务的利息,不还本金,利息会滚雪球。3. 需求变更直接压进当前迭代:Scrum Guide说迭代期间不应变更范围,但实际中产品经理经常说“就一个小改动”,团队碍于压力接了,结果打乱了所有任务,返工成本被隐藏进“当前迭代工作”中。
有效降低返工的三项实践(我有亲身验证): – 实践1:强制在迭代中留出10%的“技术改进工时”。不为新功能,只做代码重构、接口优化、测试集成。这是对抗返工天花板的“金融储备”。- 实践2:采用“Slicing(故事切分)”技术。
将一个大的用户故事垂直切分成端到端的薄片,每个薄片都能独立上线。这样,每完成一个薄片,就能验证假设,避免后期大规模返工。- 实践3:用“变更成本预确认”代替“直接答应”。
当需求变更发生时,Scrum Master不做判断,而是让团队估算“需要花多少小时改代码+改测试+回归”,然后把数字摆在产品负责人面前:“这个变更要额外花费20个人天,相当于拖延一周的KPI目标,您确定要加吗?”80%的情况下,对方会重新思考优先级。最后一句忠告:别迷信“敏捷”两个字。
我见过一个团队把站会开成汇报会、把迭代回顾开成甩锅会。真正的防返工机制是:让每一次修改都有清晰的成本标签,让每一次决策都基于数据而不是感觉。
核心关键词
文章包含AI辅助创作:瀑布开发的风险不是延期,是返工天花板,发布者:fiy,转载请注明出处:https://worktile.com/kb/p/3978477
微信扫一扫
支付宝扫一扫
读者评论
作为亲身经历过类似项目的技术负责人,这篇文章切中要害。2019年我们一个金融项目后期返工耗费了整整两个月,但高层复盘时只看到了延期,没人追究返工浪费的资源。文中的‘返工系数’和‘三季报法’给了我很好的管理工具,准备引入团队。不过,数据样本是否足够广泛?23%~40%的返工占比在中小团队可能偏低。
观点新颖,但我觉得有些偏激。延期同样是系统性问题,不能简单说返工比延期更可怕。很多返工本身就是因为前期进度压力导致的设计缺陷。作者把延期定义为‘可控’,实际上大型项目延期同样会造成团队崩盘。返工和延期是硬币两面,不应非此即彼。
我是甲方项目经理,看到‘决策性返工’那段深有感触。业务方三个月的周期里市场变了,但流程上只能按原PRD走,最后验收时翻盘,研发团队背锅。文章提到的‘变更影响层级法’很有实操价值,以后我们评审需求变更时应该先评估L1-L3层级,而不是只谈工期。但有一点:返工成本应由业务方和研发共同承担,不能全压团队。
做一线开发五年,看到‘工程信心透支’那段差点落泪。经历过三次大返工后,我真开始敷衍代码了,反正三个月后还得改。团队凝聚力下降、缺陷率飙升这些隐性成本,PM根本不看。作者说的对,返工是系统性缺陷风险。不过PingCode的案例感觉像是在做广告,量化方法可以,但产品效果需要更多独立验证。
文章逻辑清晰,数据支撑有力,尤其赞同‘返工需要定义清楚才能进入管理报表’这个观点。我在Scrum团队实践过类似的故事点返工系数追踪,确实能提前发现结构问题。但补充一点:小团队(<20人)的返工成本往往没那么高,因为沟通成本低且架构简单。文章建议的‘迭代缓冲区’和‘三季报法’对初创团队来说可能过重,更适合文中说的120-300人规模组织。