hive与mysql的区别

六六 TOP1 429

hive与mysql的区别是:1、Hive-sql不支持等值连接,而sql支持;2、Hive-sql不支持“Insert into 表 Values()”、UPDATA、DELETE操作,而sql支持;3、Hive-sql不支持事务,而sql支持。总体来说hiveSQL与SQL基本上一致,最初的设计目的就是为了让会SQL但是不会编程MapReduce的人也能使用Hadoop进行数据处理。

1、Hive不支持等值连接

不支持等值连接,一般使用left join、right join 或者inner join替代。

例如:

SQL中内关联可以这样写: select * from a , b where a.key = b.key

Hive中应该这样写: select * from a join b on a.key = b.key

hive中不能使用省去join的写法。

2、分号字符

分号是sql语句的结束符号,在hive中也是,但是hive对分号的识别没有那么智能,有时需要进行转义 “;” –> “\073”

3、NULL

sql中null代表空值,但是在Hive中,String类型的字段若是空(empty)字符串,即长度为0,那么对它 is null 判断结果为False

4、Hive不支持将数据插入现有的表或分区中

Hive仅支持覆盖重写整个表。

insert overwrite 表 (重写覆盖)

5、Hive不支持 Insert into 表 Values(), UPDATA , DELETE 操作

insert into 就是往表或者分区中追加数据。

6、Hive支持嵌入mapreduce程序,来处理复杂的逻辑

7、Hive支持将转换后的数据直接写入不同的表,还能写入分区,hdfs和本地目录

避免多次扫描输入表的开销。

8、HQL不支持行级别的增、改、删,所有数据在加载时就已经确定,不可更改。

两者的比较:

Hive采用了类SQL的查询语言HQL(hive query language)。除了HQL之外,其余无任何相似的地方。Hive是为了数据仓库设计的。

存储位置:Hive在Hadoop上;Mysql将数据存储在设备或本地系统中;

数据更新:Hive不支持数据的改写和添加,是在加载的时候就已经确定好了;数据库可以CRUD;

索引:Hive无索引,每次扫描所有数据,底层是MR,并行计算,适用于大数据量;MySQL有索引,适合在线查询数据;

执行:Hive底层是MarReduce;MySQL底层是执行引擎;

可扩展性:Hive:大数据量,慢慢扩去吧;MySQL:相对就很少了


最后,推荐我们的管理工具给大家。

回复

我来回复
  • 暂无回复内容

联系我们
关注微信
关注微信
分享本页
返回顶部