开发者生产力平台正日益被视为一种有效手段,可以帮助工程团队降低认知负荷,并缩短新功能的上线周期。然而,企业若想成功实施内部平台战略,需要先具备一些基础能力。平台团队必须将平台视为一款软件产品来经营,重视与用户的沟通,确保平台可靠运行,并营造健康、可持续的团队氛围。
对于希望推进平台工程和内部平台建设的组织而言,真正的挑战并不只是“是否要建设平台”,而是“是否具备让平台持续创造价值的执行能力”。如果缺少商业价值判断、产品思维、卓越运营、软件工程能力和健康团队机制,平台战略很可能无法兑现预期收益。
软件开发组织的领导者正面临巨大压力:他们必须确保工程人员把时间投入到真正创造价值的活动中。实现这一目标的方法之一,是通过 SaaS 将非核心业务能力外包出去。另一种方法,则是将多个团队和多项服务都需要的基础设施能力整合到一个数字平台中。这个平台本身也可能依赖 SaaS 和云服务商。通常来说,内部平台是内部研发能力与外部采购能力的精心组合。

一位平台工程专家曾对数字平台的关键要素做过一段精彩概括:
数字平台是一套由自助式 API、工具、服务、知识和支持组成的基础能力,这些能力被整合成一个具有吸引力的内部产品。
开发者生产力平台的目标,是让负责构建终端用户产品的团队专注于自己的核心任务。平台服务的例子包括交付服务,例如流水线基础设施;应用服务,例如容器编排集群;运维服务,例如监控能力;以及安全服务,例如漏洞扫描工具。内部平台团队通常会采用云服务商和其他供应商提供的工具与服务,并对其进行托管、适配或扩展,使公司内部的软件开发人员能够更方便地使用这些能力。
平台的目标并不是重新发明商业市场上已经存在的能力。世界并不需要另一个自研的容器编排平台。平台真正要解决的,是商业产品与组织实际需求之间的差距。例如,团队可能并不需要一个完整、复杂、通用的容器平台体验,而是更希望获得一种经过简化的使用方式:它能利用组织现有基础设施中的默认假设,并让日常管理变得更容易。
这些服务通常高度依赖基础设施,但我们认为这只是实现细节。我们对平台的定义非常宽泛:凡是能够提升开发者效率的内部工具,都可以被视为平台的一部分。文档和支持同样是平台的重要组成部分。
比起从“平台如何实现”的角度理解平台,更值得从“平台用来做什么”的角度理解平台。向内部团队提供平台服务,本质上是一种制度化的降摩擦方式。平台工程师有责任保持开放心态,不断思考如何更好地减少这种摩擦。有时,这意味着配置基础设施;有时,则意味着简化构建脚本的使用方式,或者组织研讨会,帮助团队定义服务级别目标(SLO)。
如果执行得当,平台战略有望降低成本,并使产品开发团队能够更专注于创新。但如果执行不当,平台问题会直接影响整个软件开发组织。在与客户合作的过程中,我们发现,行业对构建内部平台抱有极大热情,甚至可以说存在一定程度的炒作;与此同时,我们也看到,许多组织仍需要跨越潜在的执行差距。

请注意炒作列车与实际平台之间的差距。
构建一个高效平台,以及与之配套的组织架构,是一个值得追求但也颇具雄心的目标。它需要的成熟度,远高于简单地为服务提供基础设施。与微服务架构等其他雄心勃勃的技术举措一样,要想获得可持续成功,组织必须具备一些基础能力。
这些能力并不一定要在平台建设开始之前就全部成熟。但组织必须有热情和决心,在平台建设过程中持续提升这些能力。否则,数字平台很可能无法为大量资金、人才和机会成本的投入带来应有回报。
商业价值:内部平台战略的经济基础
是否构建内部开发者生产力平台,本质上是一个经济决策。构建平台是否合理,取决于它在效率、质量和上线周期方面带来的收益,能否超过建设和演进过程中产生的财务成本、人才成本和机会成本。
如果无法清晰说明平台的商业价值,就无法负责任地推进平台战略。在评估过程中,还必须充分考虑市场上已有服务的能力。除非平台能够提供商业产品无法提供的能力、针对特定环境的定制化服务,或显著提升使用便利性,否则更好的选择可能是将相关能力交给市场解决,从而避免自建平台带来的维护负担。毕竟,平台战略的初衷是减少重复工作,而不是制造更多工作。
构建数字平台,只是证明其商业价值的开始。平台战略在宏观层面上或许很有说服力,但具体到要提供哪些功能、如何提供这些功能,则涉及许多细致而复杂的决策。更复杂的是,随着技术不断进步、组织需求持续演变,以及云服务商和其他供应商不断推出与自研方案竞争的新产品和新能力,平台所提供功能的商业价值也会随之变化。
为了兑现平台对组织承诺的价值,平台团队应该提高对持续改进的投入比例,而不是只关注面向最终用户的产品创新。为了让平台保持可管理性并控制成本,与可运维性相关的事项必须在待办事项中占据重要位置。对用户而言,一致性、稳定性和可靠性往往比源源不断的新功能更重要。
此外,平台提供的每一项产品能力,最终都必须经历淘汰。淘汰可能是为了推出新产品,也可能是为了替换成内部开发的新方案,甚至可能是为了将相关能力的维护责任重新交还给产品开发团队。淘汰是平台产品生命周期中不可或缺的一部分。忽视这一点,可能会削弱最初推出该平台能力时所期望获得的商业收益。
产品思维:把内部平台当作软件产品经营
平台团队永远不能忘记:自己打造的是一款产品,而这款产品的目标是服务并打动客户,也就是产品开发团队。任何阻碍开发者顺畅使用平台的问题,无论是 API 可用性缺陷,还是文档缺失,都会威胁平台商业价值的实现。
平台团队必须优先考虑开发者体验。无论底层技术多么出色,如果没有人愿意使用,这个产品都不能算成功。为了实现内部平台的投资回报,产品开发团队不仅需要使用平台,还要能够有效使用平台。为此,他们需要知道平台的存在,理解平台的能力,并熟悉平台的使用方式。
正如基础设施产品化领域的一些观点所强调的那样,平台产品与其他类型的产品一样,都需要客户同理心、明确的产品所有权,以及智能化的衡量指标。
内部产品的一大优势在于,用户通常会对产品的演进和成功投入更多关注。和任何客户群体一样,内部用户中也会有怀疑者、中立者和热情支持者。平台团队应该充分利用这些热情支持者,帮助他们成为平台的早期采用者和倡导者。这将极大提升平台在组织内部的形象。
持续沟通产品路线图、接受反馈并收集用户经验,有助于保持平台的长期价值。幸运的是,平台团队和用户团队都在同一家公司,因此天然拥有丰富的沟通渠道。内部平台也需要营销。虽然它不同于面向公众的产品营销,但本质上仍然是营销:让目标用户理解产品价值,并愿意持续使用它。对于平台团队而言,借助 PingCode 这类智能化研发管理工具,将团队目标、用户反馈、需求清理、评审排期、开发测试、发布上线和知识沉淀串联起来,也有助于让内部平台的产品化运营更加数据化和体系化。
维护良好的客户关系,是推动平台采用的关键。因此,如果出现不可避免的服务中断,平台团队应及时沟通,并调整计划,以减少对用户的影响。如果故障导致服务中断——这种情况很可能发生——真诚的道歉和透明的沟通能够安抚用户情绪,并维护信任。
不要把管理强制当作推广策略。平台团队或许拥有用户,但强迫他们使用产品,即使看似是为了他们好,也无法建立真正有效的合作关系。
卓越运营:开发者生产力平台可靠运行的前提
采用内部平台,意味着产品开发团队必须给予平台团队极高的信任。此时,平台已经成为组织履行职能所依赖系统中的关键组成部分。平台团队的运营能力必须足以配得上这份信任。
这意味着,平台团队需要扎实掌握软件基础设施的基本知识,例如网络、扩展性和灾难恢复。如果平台工程团队在底层技术上存在明显短板,就很难为产品开发团队构建稳健可靠的产品。
此外,现代卓越运营并不只限于基础设施能力,还包括一系列确保可靠性的实践。站点可靠性工程相关方法很好地概括了这一领域的成熟实践。如果平台组织缺乏 SRE 相关能力,例如可观测性、监控和服务级别目标(SLO),不仅可能失去产品团队的信任,甚至可能在不知不觉中造成这种信任流失。
平台组织还必须具备足够成熟的能力,高效管理事件并从事件中学习。非工作时间支持、告警机制和不追责的事件复盘,都应该成为重点。为了实现这些目标,组织可能需要建立相关流程、调整雇佣合同条款,并为合理补偿预留预算。同时,还要确保值班体验足够健康、可持续,以鼓励更多人参与。
这些要求也会影响平台团队的规划方式。当平台团队需要执行重大变更,例如迁移时,必须投入足够资源,确保变更平稳推进,从而最大限度减少用户停机时间。
软件工程卓越性:让内部平台具备持续演进能力
平台型组织并不只是一个运维部门,因此它需要的不仅仅是运维能力。即使平台团队不打算编写大量自定义应用程序,脚本、模板和配置文件也会迅速变得复杂。要想快速且安全地修改平台,就必须以正确的工程方式构建平台。
关于基础设施领域的软件工程卓越性,“基础设施即代码”方法提供了一个很好的总结。其核心实践可以概括为三点:
- 一切都用代码定义;
- 持续测试并交付所有进行中的工作;
- 构建小型、简单、可独立替换的组件。
如果组织能够持续应用这些实践,就更有可能实现平台愿景。否则,平台团队或许能在某个时间点把基础设施搭建到良好状态,但却无法跟上开发团队不断变化的需求。
使用内部产品,也会对产品开发团队提出更高要求。优秀的产品开发团队会了解其依赖项所提供的服务级别,并将这些因素纳入自身系统设计中,同时运用工程实践降低可能影响服务级别目标的风险。当这些依赖项由内部提供时,这一点尤为重要。因为无论内部平台质量多高,它通常都很难达到商业 SaaS 提供商那样的成熟度和完善程度。
健康的团队:降低平台团队的认知负荷
个人技能固然重要,但要长期保持卓越,团队层面的纪律性更加关键。当企业其他部门都依赖平台系统时,维护这些系统的专业知识绝不能只掌握在少数忙碌的个人手中。
组织需要拥有明确使命的自主团队,避免个人化的代码所有权或系统所有权过度分散。团队必须重视知识共享、文档编写和新员工入职培训。某个人的偶然缺席,不应该威胁平台的持续运行。
为了让平台工程团队保持高效运转,其工作规划体系也必须足够成熟。团队需要建立按价值分类的待办事项列表,并制定优先级排序流程。否则,紧急事项很容易淹没重要事项。对于需要同时处理任务、项目、文档、IM、目标、日历、甘特图、工时和审批的团队来说,Worktile 这类通用项目协作系统可以作为协作底座,帮助平台团队减少信息分散和重复沟通带来的额外认知负荷。
突发事件和计划外工作不可避免,但如果团队过多时间被琐碎工作消耗,就无暇顾及产品改进。平台团队也不应该试图同时管理过多平台产品。产品组合越庞杂,认知负荷就越高,团队越难以保持稳定输出。
相关团队组织设计方法论中提出的“认知负荷”概念,对保持团队任务可控非常实用。如果一个团队频繁在完全不同的任务之间切换,其认知负荷就会过高。这不仅会降低团队完成日常工作的能力,也会使新成员难以建立信心,无法熟练掌握运行所有系统所需的知识。
如何开始内部平台建设
如果组织目前还不具备这些能力,是否就意味着无法采用平台战略?人们可能会问:如果这些能力只能从经验中获得,那么在缺乏经验的情况下,又该如何开始构建它们?
关键不在于降低执行质量,而在于一开始要保持谦逊,避免好高骛远。任何平台项目,无论规模大小,都应该创造商业价值,以产品思维为指导,以卓越运营和软件工程能力为基础,并由能够支撑新平台服务的团队架构提供保障。
否则,原本希望带来的效率提升,很可能变成组织负担,并损害这个新兴平台在内部开发者中的声誉。
从技术资产中易于理解的部分入手,构建小型、聚焦的平台服务,通常难度较低。它们并不能让团队免于从整体角度思考平台,但可以帮助团队快速起步,并逐步积累能力。
例如,提供一个日志集群,可以减轻产品团队的运维负担,并提高跨服务的可见性。其商业价值相对明确,无需复杂的财务模型也能证明。它仍然需要产品思维,以确保真正服务客户。例如,它的可用性、时效性和搜索界面是否满足开发人员的需求?但这种产品思维的成熟度,并不需要达到提供统一开发者门户所需的水平。它仍然需要软件工程能力、运维能力和高效团队才能做好,但复杂度远低于为组织所有微服务构建可观测性边车。
首先要问的问题是:我们能够构建的最小组件是什么?它能否为产品团队提供帮助?其次要考虑的是:未来如果需要升级,或者迁移到其他平台,我们该如何操作?
现有技术日新月异,而供应商锁定带来的痛苦并不会因为供应商是内部团队就消失。如果弃用某项平台服务需要经历长达数年的痛苦过渡,那么平台团队或许应该重新审视产品设计,进一步简化产品功能。
团队不需要一开始就制定非常详细的计划,也不需要准备大量替代技术。但只要考虑一个合理的生命周期,例如三到五年,并在架构中预留替换解决方案的衔接点,就能迫使设计更加简洁、解耦。
我们建议平台采用自愿原则。这能从两个方面支持平台战略。
首先,当产品团队可以选择不使用某项平台服务时,会促使平台团队保持服务的松耦合性。这有利于未来推出新一代服务,或者用商业产品替代现有服务。
其次,当平台组织依赖产品团队对平台价值的认可时,就会促使平台团队始终将客户满意度放在首位。强制迁移到平台可能是一条捷径,但从长远来看,它可能会削弱团队的产品思维。
平台团队可能会发现,一个简单的分类体系有助于设定用户对新平台功能成熟度的预期。例如,可以用分类标识某项新功能仍处于试验阶段。平台团队也可以将服务级别目标(SLO)和支持级别与成熟度分类关联起来。实验性功能不需要提供与核心平台能力相同的高可用性,例如它可能不需要全天候支持。
一旦某项功能升级为全面支持状态,平台用户就可以期待足够强健的 SLO,并在此基础上构建关键任务组件。但在此之前,较低的预期要求能让平台团队拥有试验空间,在作出长期承诺前验证产品假设。
如果能够牢记这些原则,组织将获得额外收益:平台团队会管理一个规模较小但高效的平台产品组合,团队认知负荷较低,从而能够专注于持续缩短开发团队的产品上线周期,而不是仅仅维持系统正常运行。
结论:成功的平台战略需要长期经营
数字平台是技术产品的组合。与所有产品一样,平台通过被用户使用来创造价值。凭借合理的商业论证、精心的产品管理和高效的技术执行,数字平台能够减轻产品开发团队的认知负荷,并加速组织创新。
平台需要投入大量资金、人才和机会成本。作为回报,它们应当提升产品开发团队快速、高效地构建高质量客户产品的能力。
开发数字平台是一项战略决策,绝不能掉以轻心。除了直接的财务考量之外,数字平台还会影响组织内部的人际关系和协作方式。产品开发人员已经体验过成熟商业云服务的产品能力。为了满足这些不断提高的期望,平台工程团队必须在产品管理和技术实施方面都具备成熟能力。产品开发团队也必须学会与平台组织建立良好的合作关系,并承担起自身服务运营的责任。
数字平台具有倍增效应。因此,组织必须认真权衡:它究竟会打造竞争优势,还是造成严重的生产力下滑。平台产品生命周期中的每一个决策,都会影响最终走向。
好消息是,平台建设与其他类型的软件开发一样:只要从小规模做起,设身处地为客户着想,从成功和失败中持续学习,并始终牢记总体愿景,组织就有很大机会取得成功。
如果用一句话总结:成功的开发者生产力平台并不只取决于技术能力,更取决于组织是否具备清晰的商业价值判断、成熟的产品思维、可靠的运营能力、扎实的软件工程实践,以及健康可持续的平台团队。
文章包含AI辅助创作:开发者生产力平台如何成功落地:警惕内部平台战略的执行差距,发布者:su,转载请注明出处:https://worktile.com/kb/p/3973092
微信扫一扫
支付宝扫一扫