管理进化

如何建立数据模型

2022-02-22 · Worktile 项目协作工具

建立数据模型的步骤包括：1.制订目标2.数据理解与准备3.建立模型4.模型评估5.结果呈现6.模型部署

一、制订目标

制订目标的前提是理解业务，明确要解决的商业现实问题是什么？

如：在社交平台KOL中，存在假粉丝的情况，如何识别假粉就是一个要解决的现实问题。

二、数据理解与准备

基于要解决的现实问题，理解和准备数据，一般需要解决以下问题：

需要哪些数据指标（即特征提取）（如：哪些指标能区别真粉和假粉？）

数据指标的含义是什么？

数据的质量如何？（如：是否存在缺失值？）

数据能否满足需求？

数据还需要如何加工？（如：转换数据指标，将类别型变量转化为0-1哑变量，或将连续型数据转化为有序变量）

探索数据中的规律和模式，进而形成假设。

需要注意的是，数据准备工作可能需要尝试多次。因为在复杂的大型数据中，较难发现数据中存在的模式，初步形成的假设可能会被很快推翻，这时一定要静心钻研，不断试错。

数据建模后需要评估模型的效果，因此一般需要将数据分为训练集和测试集。

三、建立模型

在准备好的数据基础上，建立数据模型，这种模型可能是机器学习模型，也可能不需要机器学习等高深的算法。选择什么样的模型，是根据要解决的问题（目标）确定的。

当然可以选择两个或以上的模型对比，并适当调整参数，使模型效果不断优化。

四、模型评估

模型效果的评估有两个方面：一是模型是否解决了需要解决的问题（是否还有没有注意和考虑到的潜在问题需要解决）；二是模型的精确性（误差率或者残差是否符合正态分布等）。

如：在识别KOL假粉的问题中，需要评估的是：

模型能否识别出假粉？

识别的误差率是多少？粉丝识别误差率=（假粉误认为真粉的数量+真粉误认为假粉的数量）/总粉丝数

五、结果呈现

结果呈现主要关注以下三个方面：

模型解决了哪些问题？

解决效果如何？

如何解决问题？具体操作步骤是什么？

六、模型部署

通过大量数据解决了一个或多个重要的现实问题，需要将方案落实下去，一般情况下需要通过线上技术环境部署落实，从而为后面不断优化模型、更好地解决问题打下基础。

最后，推荐我们的管理工具给大家

项目

目标

网盘

消息

日历

客户端下载

企业微信

项目管理

目标管理

敏捷开发

公司管理

市场营销

产品管理

IT研发与运维

人事行政

互联网

专业服务

电商

制造

建筑设计

全部

帮助中心

敏捷和 OKR 咨询

开发者

博客

合作伙伴

客户案例

更新日志

模板市场

关于我们

投资者关系

联系我们

如何建立数据模型

一、制订目标

二、数据理解与准备

三、建立模型

四、模型评估

五、结果呈现

六、模型部署

相关阅读

敏捷开发的框架是什么

OKR落地的关键是什么

企业都在用哪些较好用看板管理工具软件