数据仓库和数据库区别是什么

数据库是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据仓库是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

数据仓库和数据库区别是什么-Worktile社区

一、用途

数据库:主要用于事务处理,即OLTP(Transaction),也就是我们常用的面向业务的增删改查操作。常用的数据库有Mysql,Oracle,PostgreSQL。

数据仓库:主要用于数据分析,即OLAP(Analytics),供上层决策,常见于一些查询性的统计数据。常见的数仓有Greenplum,Hive。基于MYISAM存储引擎的MySQL也是可以用来做数据仓库的。

二、区别

特性不同

由于他们的用途不同,这也决定了他们具体不同的特点:

(1)优化
数据库:因为是事务性操作,所以一般是读写优化的

数据仓库:因为是数据分析,需要对大量数据进行查询,所以一般仅仅是读优化的

(2)数据量
数据库:读写相对简单,一次只是对少量数据进行操作

数据仓库:查询相对复杂,一次要对大量数据进行操作

来源:本文为CSDN博主「问就是啥也不是」的原创文章
原文链接:https://blog.csdn.net/bcfdsagbfcisbg/article/details/119144706

延伸阅读

数据仓库中数据的来源

数据仓库中的数据来源归纳起来大体有3种:

  • 结构化数据:一般来自于数据库,比如MySQL等关系型数据库的表中保存的记录(rows)。即承担OLTP功能的数据载体。这类数据最好处理,因为数据表达方式作为规范,约束性最好。
  • 半结构化数据:该部分数据来源较多,包括用户行为日志(如app的页面访问记录)、平台或管理服务日志(tomcat、mysql等服务日志)等等,也包括存储于MongoDB等NoSQL数据库中的记录(Docs等)。这些数据一般以Json或XML等形式存在,在ETL时难度较大。
  • 非结构化数据:包括图片、音频、视频和网页等,这些数据非常复杂,信息量也很大,一般不会直接抽取出来直接保存到数仓中,而是记录他们的元数据信息(metadata),举图片为例,可能保存该图片的产生时间、格式、大小等等,至于图片本身,一般通过url链接保存在对象或文件存储系统中。

文章标题:数据仓库和数据库区别是什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/37974

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年2月13日 下午1:34
下一篇 2023年2月13日 下午2:09

相关推荐

  • linux解压tar文件命令

    linux解压tar文件的命令:1、tar –xvf file.tar;2、tar -xzvf file.tar.gz;3、tar -xjvf file.tar.bz2;4、tar –xZvf file.tar.Z。tar –xvf file.tar命令的作用是解压tar包,tar -xzvf fi…

    2023年3月17日
    41200
  • 工作任务繁杂细碎怎么管理

    任务管理工具有以下几个:一、PingCode;二、 Worktile;三、 Trello;四、nTask;五、Asana;六、Clickup。PingCode 是专门为软件研发团队打造的任务管理软件,你可以在 PingCode 管理软件研发过程中所有类型的任务,比如需求、开发、测试、缺陷、版本、文档…

    2023年3月31日
    1000
  • bug管理工具是什么

    bug管理工具是用于bug管理的工具,Bug管理是指对开发,测试,设计等过程中一系列活动过程中出现的bug问题给予记录、审查、跟踪、分配、修改、验证、关闭、整理、分析、汇总以及删除等一系列活动状态的管理。 Bug管理是指对开发,测试,设计等过程中一系列活动过程中出现的bug问题给予纪录、审查、跟踪、…

    2022年11月16日
    17500
  • 编程前端和后端是什么

    编程前端,也被称为客户端,即网站前台部分,是运行在PC端、移动端等浏览器上展现给用户浏览的网页内容;而后端,也被称为服务器端,指的是数据库进行交互以处理相应的业务逻辑,需要考虑的是如何实现功能、数据的存取、平台的稳定性与性能等。 一、前端是什么 简介:前端即网站前台部分,运行在PC端,移动端等浏览器…

    2023年3月21日
    8600
  • C++为什么要让 struct 可以定义成员函数

    因为C++的class真的只是个struct,只不过C++编译器会在编译期对它做一些“魔改”动作而已。最开始设计的时候,class就是struct,只是个语法糖,用来触发预处理器或者编译器的特定处理而已。或者说,C++的所有class相关功能,实际上就是在struct上实现的。 因为C++的clas…

    2023年2月21日
    3000
  • 软件开发项目概况怎么写

    写软件开发项目概况要包含以下内容:一、项目概述;二、项目目标;三、项目范围;四、项目进度;五、项目风险。软件开发项目概述主要描述项目的目的、背景、范围和约束等信息。在任何软件开发项目中,项目概述都是非常重要的。 一、项目概述 软件开发项目概述主要描述项目的目的、背景、范围和约束等信息。在任何软件开发…

    2023年4月16日
    12900
  • T语言的特点是什么

    T语言的特点是:1、易上手的编程语言;2、完整的功能库支持;3、支持多线程;4、简单实用的界面设计。简单易用的语法,多语言语法编写,T语言的代码看起来就是像一篇文章一样,简单易懂,可以让人细细品尝。 一、什么是T语言 T语言(Ttyu software language)是一种通过定义的方式自动生成…

    2023年5月12日
    700
  • VR需要掌握什么编程语言

    VR需要掌握:1、C#;2、C++语言;3、Java;4、 其他计算机图形学与GPU编程。其中,C#是指,C#基础语法与算法、面向对象编程、C#是数据结构与高级语法;是做U3D的基础语言。而Unity 把 C# 当作脚本语言使用。 一、C# C#基础语法与算法、面向对象编程、C#是数据结构与高级语法…

    2023年3月18日
    7500
  • 开发任务用什么管理软件

    开发任务用以下管理软件:一、PingCode;二、Worktile ;三、Trello;四、nTask;五、Asana。PingCode 是专门为软件研发团队打造的任务管理软件,你可以在 PingCode 管理软件研发过程中所有类型的任务,比如需求、开发、测试、缺陷、版本、文档等等,同时还能很轻松的…

    2023年3月19日
    1000
  • 什么是戴明循环

    戴明循环是一个质量持续改进模型, 它包括持续改进与不断学习的四个循环反复的步骤, 即计划(Plan)、执行(Do)、检查(Check/Study)、处理(Act)。 戴明循环有时也被为称戴明轮或持续改进螺旋。 戴明循环与生产管理中的“改善”、“即时生产”紧密相关。 戴明循环是一个质量持续改进模型, …

    2023年1月17日
    9700

发表回复

登录后才能评论
联系我们
站长微信
站长微信
分享本页
返回顶部