数据库是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据仓库是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。
一、用途
数据库:主要用于事务处理,即OLTP(Transaction),也就是我们常用的面向业务的增删改查操作。常用的数据库有Mysql,Oracle,PostgreSQL。
数据仓库:主要用于数据分析,即OLAP(Analytics),供上层决策,常见于一些查询性的统计数据。常见的数仓有Greenplum,Hive。基于MYISAM存储引擎的MySQL也是可以用来做数据仓库的。
二、区别
特性不同
由于他们的用途不同,这也决定了他们具体不同的特点:
(1)优化
数据库:因为是事务性操作,所以一般是读写优化的
数据仓库:因为是数据分析,需要对大量数据进行查询,所以一般仅仅是读优化的
(2)数据量
数据库:读写相对简单,一次只是对少量数据进行操作
数据仓库:查询相对复杂,一次要对大量数据进行操作
来源:本文为CSDN博主「问就是啥也不是」的原创文章
原文链接:https://blog.csdn.net/bcfdsagbfcisbg/article/details/119144706
延伸阅读
数据仓库中数据的来源
数据仓库中的数据来源归纳起来大体有3种:
- 结构化数据:一般来自于数据库,比如MySQL等关系型数据库的表中保存的记录(rows)。即承担OLTP功能的数据载体。这类数据较好处理,因为数据表达方式作为规范,约束性较好。
- 半结构化数据:该部分数据来源较多,包括用户行为日志(如app的页面访问记录)、平台或管理服务日志(tomcat、mysql等服务日志)等等,也包括存储于MongoDB等NoSQL数据库中的记录(Docs等)。这些数据一般以Json或XML等形式存在,在ETL时难度较大。
- 非结构化数据:包括图片、音频、视频和网页等,这些数据非常复杂,信息量也很大,一般不会直接抽取出来直接保存到数仓中,而是记录他们的元数据信息(metadata),举图片为例,可能保存该图片的产生时间、格式、大小等等,至于图片本身,一般通过url链接保存在对象或文件存储系统中。
文章标题:数据仓库和数据库区别是什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/37974