什么是大数据

小编 476

大数据是互联网的行业术语,是指规模巨大、海量的数据集合,通常是以多元形式,从不同来源搜集而来,其信息量非常巨大,且涉及面极其广大。简单理解的话,大数据是那些数据量特别大、数据类型复杂的数据集。

1.大数据的定义

大数据(big data)又称“巨量资料”,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据一般是以多元形式,从许多不同来源搜集而来,往往具有实时性。在企业对企业销售的情况下,这些数据可能来自社交网络、电子商务网站、顾客来访纪录,还有许多其他来源。

2.大数据的作用

大数据的核心作用是数据价值化,简单的说就是大数据让数据产生各种“价值”,这个数据价值化的过程就是大数据要做的主要事情。

对企业而言,大数据可提高工作效率,降低企业成本,精准营销带来更多客户;对政府而言,可以利用大数进行统筹分析、提高管理效率、管理抓获犯罪分子等;对个人而言,可以利用大数据更了解自己等。

3.大数据的应用

大数据的应用对象可以简单的分为给人类提供辅助服务,以及为智能体提供决策服务。大数据不仅包括企业内部应用系统的数据分析,还包括与行业、产业的深度融合。具体场景包括:互联网行业、政府行业、金融行业、传统企业中的地产、医疗、能源、制造、电信行业等等。通俗地讲“大数据就像互联网+,可以应用在各行各业”,如电信、金融、教育、医疗、军事、电子商务甚至政府决策等。

延伸阅读

大数据分为哪几种类型

大数据主要可以分为三种类型,即结构化数据、非结构化数据和半结构化数据,以下为详细介绍:

1.结构化数据

可以以固定格式存储,访问和处理的数据称为“结构化数据”。由于此数据采用类似的格式,因此企业可以通过执行分析来获得最大的收益。还发明了各种先进技术来从结构化数据中提取数据驱动的决策。但是,由于结构化数据的创建已经达到Zettabytes标记,因此世界正朝着这样一个程度发展。

2.非结构化数据

任何以未知形式或结构出现的数据都属于非结构化数据。处理非结构化数据并对其进行分析以获取数据驱动的答案是一项艰巨的任务,因为它们来自不同类别,将它们放在一起只会使情况变得更糟。包含简单文本文件,图像,视频等的组合的异构数据源是非结构化数据的示例。

3.半结构化数据

半结构化数据中同时具有结构化和非结构化数据。我们可以看到半结构化数据是形式化的结构,但实际上它不是在关系DBMS中用表定义来定义的。Web应用程序数据是半结构化数据的示例。它具有非结构化数据,例如日志文件,事务历史记录文件等。OLTP系统旨在与结构化数据一起工作,其中数据存储在关系中。

回复

我来回复
  • 暂无回复内容

注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部