数据类项目
-
用瀑布开发做数据类项目,数据清洗决定成败
2023年,我接手了一个金融风控数据集市项目。需求文档写了187页,字段定义精确到小数点后两位,评审会开了7轮,所有相关方都签了字。按照标准的瀑布流程,这个项目在需求阶段堪称教科书级别。然而,当ETL开发完成、模型团队接入实际运行时,核心的“客户资产负债率”指标算出来全是乱码。问题出在哪里?上游23…
2023年,我接手了一个金融风控数据集市项目。需求文档写了187页,字段定义精确到小数点后两位,评审会开了7轮,所有相关方都签了字。按照标准的瀑布流程,这个项目在需求阶段堪称教科书级别。然而,当ETL开发完成、模型团队接入实际运行时,核心的“客户资产负债率”指标算出来全是乱码。问题出在哪里?上游23…