数据库技术的发展趋势是:1、多模数据库实现一库多用;2、统一框架支撑分析与事务混合处理;3、运用AI实现管理自治;4、充分利用新兴硬件。后关系型数据库阶段,数据结构越来越灵活多样,如表格类型的关系数据、半结构化的用户画像数据以及非结构化的图片和视频数据等。
一、多模数据库实现一库多用
后关系型数据库阶段,数据结构越来越灵活多样,如表格类型的关系数据、半结构化的用户画像数据以及非结构化的图片和视频数据等。多模态数据建模将由目前以关系为中心逐步转为以对象为中心,更多关注非结构化数据的语义建模,强调数据与操作的可封装性、多重分类和动态分类,尤其是多模态数据之间复杂的语义关联,未来不是模式限定数据变化,而是数据驱动模式演化。
面对多模态数据,应用程序对不同数据提出了不同存储要求,数据的多样性成为数据库平台面临的一大挑战,数据库因此需要适应多类型数据管理的需求。
多模数据库是指能够支持处理多种数据模式混合的数据库。多模数据库支持灵活的数据存储类型,将各种类型的数据进行集中存储、查询和处理,可以同时满足应用程序对于结构化、半结构化和非结构化数据的统一管理需求。
目前行业以微软Azure Cosmos DB、ArangoDB、巨杉SequoiaDB和阿里云Lindorm等多模数据库为典型代表。当前多模数据库往往存在两个缺陷:一是缺乏统一的访问接口,不能够利用统一查询语言进行查询,比如基于Azure云的CosmosDB,包含了关系型的SQL Server,文档型的MongoDB,列簇式的Cassandra等各种模型存储,但它们都只能用各自对应的API进行访问;二是支持统一查询接口的往往查询性能不理想,比如基于文档型的ArangoDB,虽然能够利用统一查询语言AQL同时查询文档和遍历图数据,但性能往往不理想,因为利用文档的形式实现图模型需要通过多文档进行连接,当图遍历的深度加大,查询将非常耗时。
未来多模数据库应该是一种原生支持各种数据模型,有着统一访问接口,能自动化管理各模型的数据转化,模式进化且避免数据冗余的新型数据库系统。
二、统一框架支撑分析与事务混合处理
业务系统的数据处理分为联机事务处理(OLTP)与联机分析处理(OLAP)两类。企业通常维护不同数据库以便支持两类不同的任务,管理和维护成本高。因此,能够统一支持OLTP和OLAP的数据库成为众多企业的需求。产业界当前正基于创新的计算存储框架研发HTAP数据库,HTAP (Hybrid Transactional/Analytical Processing)是指能够同时支持在线事务处理和复杂数据分析的关系型数据库。
广义的HTAP数据库是指能够在关系数据模型上进行OLTP时具有强一致性保证,并且融合了分布式能力从而同时具有高扩展性。
三、运用AI实现管理自治
人工智能与数据库的技术融合可以体现在两个方面,一方面可以通过AI技术实现数据库的自优化、自监控、自调优、自诊断;另一方面可以实现库内AI训练,降低AI使用门槛。从赋能对象来看,人工智能与数据库的结合既可以体现在数据库系统自身的智能化,包括但不限于数据分布技术智能化、库内进行训练和推理操作、数据库自动诊断、容量预判等;也可以体现在数据库周边工具的智能化,能够在提升管理效率、降低错误引入率、减少安全隐患的同时也大大降低了运营成本。
目前学术界和工业界共识的研究重点是将机器学习与数据管理在功能上融合统一,来实现更高的查询和存储效率,自动化处理各种任务,例如自动管理计算与存储资源、自动防范恶意访问与攻击、主动实现数据库智能调优。机器学习算法可以分析大量数据记录,标记异常值和异常模式,帮助企业提高安全性,防范入侵者破坏,还可以在系统运行时自动、连续、无人工干预地执行修补、调优、备份和升级操作,尽可能减少人为错误或恶意行为,确保数据库高效运行、安全无失。
四、充分利用新兴硬件
最近十几年,新兴硬件在经历学术研究、工程化和产品化阶段发展,对数据库系统设计提供了广阔思路。期间最主要的硬件技术进步是多处理器(SMP)、多核(MultiCore)、大内存(Big Memory)和固态硬盘(SSD),多处理器和多核为并行处理提供可能,SSD大幅提升了数据库系统的IOPS和降低延迟,大内存促进了内存数据库引擎的发展。
新兴硬件可以从计算、存储和传输三个层面赋能数据库。计算层面,借助GPU、FPGA、AI芯片等,可以实现包括但不限于多核并行优化、事务并发控制、查询加速、存储层计算卸载、数据压缩加速、工作负载迁移等能力;存储层面,随着NVM的出现和发展,内存和外存的界限变得模糊,针对传统块存储设计的索引在NVM中面临新的性能挑战;传输层面,RDMA带来网络传输高性能表现和CPU卸载能力,为充分榨取其性能,可能对数据库系统的架构设计带来颠覆性变化。
延伸阅读
流是什么
流是一个很抽象的概念,只有多用才能理解。但是流绝对不是一个容器,这是一个典型的误解。容器可以被视为一个流,或者可以用流的方式来读写,但流不是容器。
譬如说,网络流(NetworkStream)就不是一个容器,也正因为流不是一个容器,所以流不存在拷贝。我们可以拷贝文件,拷贝内存,但是不能拷贝一个流。
文章标题:数据库技术的发展趋势是什么,发布者:E.Z,转载请注明出处:https://worktile.com/kb/p/54059