数据仓库和数据库区别是什么

数据库是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据仓库是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

数据仓库和数据库区别是什么-Worktile社区

一、用途

数据库:主要用于事务处理,即OLTP(Transaction),也就是我们常用的面向业务的增删改查操作。常用的数据库有Mysql,Oracle,PostgreSQL。

数据仓库:主要用于数据分析,即OLAP(Analytics),供上层决策,常见于一些查询性的统计数据。常见的数仓有Greenplum,Hive。基于MYISAM存储引擎的MySQL也是可以用来做数据仓库的。

二、区别

特性不同

由于他们的用途不同,这也决定了他们具体不同的特点:

(1)优化
数据库:因为是事务性操作,所以一般是读写优化的

数据仓库:因为是数据分析,需要对大量数据进行查询,所以一般仅仅是读优化的

(2)数据量
数据库:读写相对简单,一次只是对少量数据进行操作

数据仓库:查询相对复杂,一次要对大量数据进行操作

来源:本文为CSDN博主「问就是啥也不是」的原创文章
原文链接:https://blog.csdn.net/bcfdsagbfcisbg/article/details/119144706

延伸阅读

数据仓库中数据的来源

数据仓库中的数据来源归纳起来大体有3种:

  • 结构化数据:一般来自于数据库,比如MySQL等关系型数据库的表中保存的记录(rows)。即承担OLTP功能的数据载体。这类数据较好处理,因为数据表达方式作为规范,约束性较好。
  • 半结构化数据:该部分数据来源较多,包括用户行为日志(如app的页面访问记录)、平台或管理服务日志(tomcat、mysql等服务日志)等等,也包括存储于MongoDB等NoSQL数据库中的记录(Docs等)。这些数据一般以Json或XML等形式存在,在ETL时难度较大。
  • 非结构化数据:包括图片、音频、视频和网页等,这些数据非常复杂,信息量也很大,一般不会直接抽取出来直接保存到数仓中,而是记录他们的元数据信息(metadata),举图片为例,可能保存该图片的产生时间、格式、大小等等,至于图片本身,一般通过url链接保存在对象或文件存储系统中。

文章标题:数据仓库和数据库区别是什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/37974

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小编的头像小编
上一篇 2023年2月13日 下午1:34
下一篇 2023年2月13日 下午2:09

相关推荐

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部