数据仓库和数据库区别是什么

数据库是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据仓库是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

数据仓库和数据库区别是什么-Worktile社区

一、用途

数据库:主要用于事务处理,即OLTP(Transaction),也就是我们常用的面向业务的增删改查操作。常用的数据库有Mysql,Oracle,PostgreSQL。

数据仓库:主要用于数据分析,即OLAP(Analytics),供上层决策,常见于一些查询性的统计数据。常见的数仓有Greenplum,Hive。基于MYISAM存储引擎的MySQL也是可以用来做数据仓库的。

二、区别

特性不同

由于他们的用途不同,这也决定了他们具体不同的特点:

(1)优化
数据库:因为是事务性操作,所以一般是读写优化的

数据仓库:因为是数据分析,需要对大量数据进行查询,所以一般仅仅是读优化的

(2)数据量
数据库:读写相对简单,一次只是对少量数据进行操作

数据仓库:查询相对复杂,一次要对大量数据进行操作

来源:本文为CSDN博主「问就是啥也不是」的原创文章
原文链接:https://blog.csdn.net/bcfdsagbfcisbg/article/details/119144706

延伸阅读

数据仓库中数据的来源

数据仓库中的数据来源归纳起来大体有3种:

  • 结构化数据:一般来自于数据库,比如MySQL等关系型数据库的表中保存的记录(rows)。即承担OLTP功能的数据载体。这类数据较好处理,因为数据表达方式作为规范,约束性较好。
  • 半结构化数据:该部分数据来源较多,包括用户行为日志(如app的页面访问记录)、平台或管理服务日志(tomcat、mysql等服务日志)等等,也包括存储于MongoDB等NoSQL数据库中的记录(Docs等)。这些数据一般以Json或XML等形式存在,在ETL时难度较大。
  • 非结构化数据:包括图片、音频、视频和网页等,这些数据非常复杂,信息量也很大,一般不会直接抽取出来直接保存到数仓中,而是记录他们的元数据信息(metadata),举图片为例,可能保存该图片的产生时间、格式、大小等等,至于图片本身,一般通过url链接保存在对象或文件存储系统中。

文章标题:数据仓库和数据库区别是什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/37974

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小编小编认证作者
上一篇 2023年2月13日 下午1:34
下一篇 2023年2月13日 下午2:09

相关推荐

  • 如何规划项目流程管理

    为了有效规划项目流程管理,关键在于明确项目目标、建立详尽的项目计划、组织有效的团队、实施严格的进度监控和优化沟通机制。这些步骤确保项目能够按时按质完成、同时提高团队的工作效率和项目的成功率。在这些关键点中,建立详尽的项目计划尤为重要。项目计划不仅需要细化到每个小任务,还需要考虑资源分配、时间管理和潜…

    2024年4月10日
    4600
  • MQTT和其他即时通讯协议在安全性方面的比较

    在互联网通信协议领域内,MQTT(消息队列遥测传输)同其他即时通讯协议相比,在安全性层面具备一定的优缺点。1、轻量级与效率:MQTT设计上侧重于简洁性与低网络带宽消耗,在物联网(IoT)场景中尤为突出。2、质量服务等级:它支持多种消息传递保证等级,为不同安全需求提供选择。3、TLS/SSL支持:MQ…

    2023年12月25日
    28400
  • oa办公系统用什么web框架

    可以用以下web框架:一、Bootstrap;二、Vue.js;三、React;四、Element;五、Ant Design。Bootstrap是Twitter开发的一个简洁、直观、强悍的前端框架,它提供了大量的CSS、JavaScript组件,适用于开发响应式布局、移动设备优先的Web项目。 一、…

    2023年5月28日
    34000
  • 如何设定和管理跨部门的OKR

    跨部门的目标与关键结果(OKR)设定及管理要求明确目标、促进协作、保持灵活性和确保跟踪。设定时1、明确层级目标2、确保目标对齐;在管理上3、跨部门沟通4、定期更新与复盘。本文将深入探讨跨部门OKR的有效设定和管理方法,并提供相关的实用策略,以帮助组织达到跨部门协作与整体战略目标的顺畅对接。 一、明确…

    2023年12月8日
    33000
  • 文心一言能否助力法律文件的精准表述

    文心一言作为自然语言处理技术的前沿应用,显示出在 法律文件 精准表述方面的巨大潜力。其主要体现于:1、文本分析与理解优化;2、语义识别与提取精度提升;3、逻辑结构重构与优化;4、语言风格与准确性提高。这些核心指标共同作用于法律文本编撰过程,有助于提升法律文件的可读性、确保用词严谨性并增强法律条文的逻…

    2023年11月29日
    34400
  • 什么是产品迭代计划

    产品迭代计划是一种有序的产品开发计划,旨在持续改进和发展现有产品,以提高产品的质量和用户体验。产品迭代计划通常是一个长期的计划,可以分为多个阶段进行,每个阶段都有一个特定的目标和一组任务。 什么是产品迭代计划? 产品迭代计划是一种有序的产品开发计划,旨在持续改进和发展现有产品,以提高产品的质量和用户…

    2023年2月28日
    85300
  • 如何制作甘特图 excel

    使用excel制作甘特图的流程:1、将项目数据添加到 Excel;2、插入堆积条形图;3、设置图表格式,使其看起来像甘特图;4、修复任务订单;5、修复任务持续时间范围。将项目数据添加到 Excel是指,为任务创建新的电子表格和列,并添加数据。 1、将项目数据添加到 Excel 让我们首先以文本格式添…

    2023年2月23日
    58200
  • 为什么Jira中的自定义字段不工作

    为了理解为何JIRA中的自定义字段不发挥作用,需要综合考虑多种因素,包括但不限于1、字段配置错误;2、权限设置不当;3、工作流关联问题;4、字段方案应用不当;5、用户界面问题;6、数据问题,在实际操作中,字段配置错误尤为常见。 详细展开:字段配置错误可能发生在自定义字段创建过程中,涉及字段类型选择不…

    2024年1月3日
    26900
  • 什么是 LAMP 架构

    LAMP 架构由四种软件技术组成,这些技术在幕后协同工作,以创建可运行的 Web 应用程序。它描述了每种 Web 开发技术如何在计算机服务器中相互交互。LAMP 架构由以下各层组成:Linux、Apache、MySQL、PHP。

    2022年11月10日
    87600
  • 数字化研发管理平台

    数字化研发管理平台主要通过对研发数据的集成、分析与利用、开展高效研发活动、提升研发生产力。平台能力即推进产品生命周期管理、增强研发数据透明度、加快产品上市速度。 生产周期管理系统(PLM)在此中起着至关重要的作用,提供了一套流程以优化产品从概念到市场的过程。通过数字化转型,企业能够鼓励跨部门协作、改…

    2024年1月10日
    24700

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部