linux下的hive命令大全 • Worktile社区

worktile

Worktile官方账号

Hive是一种基于Hadoop的数据仓库架构，用于数据存储和分析。它提供了类似于SQL的查询语言，允许用户通过HiveQL在Hadoop上执行数据分析任务。在Linux环境下，使用Hive命令可以方便地管理和操作Hive数据库。下面是一份Linux下Hive命令的大全:

1. 创建数据库：CREATE DATABASE ;

2. 切换数据库：USE ;

3. 创建表：CREATE TABLE (
,
,
…
);

4. 删除表：DROP TABLE ;

5. 查看所有数据库：SHOW DATABASES;

6. 查看当前数据库中的所有表：SHOW TABLES;

7. 查看表结构：DESCRIBE ;

8. 导入数据到表中：LOAD DATA [LOCAL] INPATH ‘‘ [OVERWRITE] INTO TABLE ;

9. 查询表数据：SELECT * FROM ;

10. 插入数据到表中：INSERT INTO TABLE VALUES (, , …);

11. 更新表数据：UPDATE SET = , = WHERE ;

12. 删除表数据：DELETE FROM WHERE ;

13. 创建视图：CREATE VIEW AS SELECT , , … FROM WHERE ;

14. 删除视图：DROP VIEW ;

15. 导出表数据为文件：INSERT OVERWRITE LOCAL DIRECTORY ‘‘ SELECT * FROM ;

16. 导出查询结果为文件：INSERT OVERWRITE LOCAL DIRECTORY ‘‘ SELECT , , … FROM WHERE ;

17. 添加分区：ALTER TABLE ADD PARTITION ( = );

18. 删除分区：ALTER TABLE DROP PARTITION ( = );

19. 优化表：ANALYZE TABLE COMPUTE STATISTICS;

20. 显示表的统计信息：SHOW TABLE EXTENDED LIKE ‘‘;

这些命令是Hive中比较常用的，可以帮助用户进行数据库的创建、表的管理、数据的操作以及查询分析等相关任务。通过熟练掌握这些命令，用户可以更加高效地使用Hive进行数据处理和分析工作。

2年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

Hive是一种基于Hadoop的数据仓库架构，它提供了使用类似于SQL的查询语言对大规模数据集进行分析的能力。在Linux下使用Hive命令管理和操作Hive数据仓库是非常常见的，下面是一些常用的Hive命令。

1. 启动Hive：在Linux终端中输入hive即可启动Hive交互式Shell。

2. 创建数据库：使用CREATE DATABASE语句创建一个新的数据库。例如，CREATE DATABASE mydb;

3. 显示数据库：使用SHOW DATABASES;命令显示所有数据库的列表。

4. 使用数据库：使用USE语句选择要使用的数据库。例如，USE mydb;

5. 创建表：使用CREATE TABLE语句创建一个新的表。例如，CREATE TABLE mytable (id INT, name STRING);

6. 显示表：使用SHOW TABLES;命令显示当前数据库中的所有表。

7. 插入数据：使用INSERT INTO语句插入数据到表中。例如，INSERT INTO mytable VALUES (1, ‘John’);

8. 查询数据：使用SELECT语句查询表中的数据。例如，SELECT * FROM mytable;

9. 更新数据：使用UPDATE语句更新表中的数据。例如，UPDATE mytable SET name = ‘Tom’ WHERE id = 1;

10. 删除数据：使用DELETE语句删除表中的数据。例如，DELETE FROM mytable WHERE id = 1;

11. 删除表：使用DROP TABLE语句删除表。例如，DROP TABLE mytable;

12. 导入数据：使用LOAD DATA INPATH语句从本地文件系统或HDFS中导入数据到表中。例如，LOAD DATA INPATH ‘/path/to/data’ INTO TABLE mytable;

13. 导出数据：使用INSERT OVERWRITE LOCAL DIRECTORY语句将表中的数据导出到本地文件系统。例如，INSERT OVERWRITE LOCAL DIRECTORY ‘/path/to/output’ SELECT * FROM mytable;

14. 导出数据到HDFS：使用INSERT OVERWRITE DIRECTORY语句将表中的数据导出到HDFS中。例如，INSERT OVERWRITE DIRECTORY ‘/path/to/output’ SELECT * FROM mytable;

15. 创建分区表：使用CREATE TABLE语句创建一个带有分区的表。例如，CREATE TABLE mytable (id INT, name STRING) PARTITIONED BY (day STRING, month STRING);

以上是一些常用的Hive命令，在Linux下使用这些命令可以方便地管理和操作Hive数据仓库。根据实际需求，还可以使用更复杂的Hive命令进行数据计算、数据处理和数据分析等操作。

2年前 0条评论

fiy

Worktile&PingCode市场小伙伴

Hive是基于Hadoop的一种数据仓库基础设施，用于处理大规模分布式数据集。Hive支持类似于SQL的查询语法，使用户能够通过HiveQL编写查询，将其转换为MapReduce任务在Hadoop集群上执行。本文将介绍一些常用的Hive命令，以供参考。

##### 1. 创建数据库
创建一个新数据库，语法如下：
“`
CREATE DATABASE database_name;
“`

##### 2. 显示所有的数据库
显示系统中的所有数据库，语法如下：
“`
SHOW DATABASES;
“`

##### 3. 选择数据库
选择要使用的数据库，语法如下：
“`
USE database_name;
“`

##### 4. 创建表
创建一个新表，语法如下：
“`
CREATE TABLE table_name (
column1 datatype1,
column2 datatype2,
…
);
“`
其中，column表示列名，datatype表示数据类型。

##### 5. 显示所有的表
显示当前数据库中的所有表，语法如下：
“`
SHOW TABLES;
“`

##### 6. 显示表的结构
显示表的所有列和其数据类型，语法如下：
“`
DESCRIBE table_name;
“`

##### 7. 添加分区
对于分区表，通过增加分区可以更好地管理数据。添加分区的语法如下：
“`
ALTER TABLE table_name ADD PARTITION (partition_column = ‘value’);
“`
其中，partition_column表示分区列，value表示分区值。

##### 8. 删除分区
删除表中指定的分区，语法如下：
“`
ALTER TABLE table_name DROP PARTITION (partition_column = ‘value’);
“`

##### 9. 加载数据
将数据从本地文件系统或HDFS加载到表中，语法如下：
“`
LOAD DATA LOCAL INPATH ‘input_file’ INTO TABLE table_name;
“`

##### 10. 插入数据
向表中插入数据，语法如下：
“`
INSERT INTO TABLE table_name VALUES (value1, value2, …);
“`
注意：该命令适用于非分区表，如果是分区表，需要使用`INSERT OVERWRITE`命令。

##### 11. 查询数据
查询表中的数据，语法如下：
“`
SELECT column1, column2, … FROM table_name [WHERE condition];
“`
其中，column表示要查询的列名，WHERE条件是可选的。

##### 12. 更新数据
更新表中的数据，语法如下：
“`
UPDATE table_name SET column1 = value1, column2 = value2 [WHERE condition];
“`
其中，column表示要更新的列名，value表示新的值。

##### 13. 删除数据
删除表中的数据，语法如下：
“`
DELETE FROM table_name [WHERE condition];
“`
WHERE条件是可选的，如果没有指定条件，则会删除表中的所有数据。

##### 14. 删除表
删除指定的表，语法如下：
“`
DROP TABLE table_name;
“`

##### 15. 导入数据
将数据从其他数据源导入到Hive表中，比如从RDBMS导入数据，语法如下：
“`
IMPORT TABLE [table_name] FROM ‘import_path’ [OPTIONS (options…)];
“`
其中，table_name是可选的，import_path是导入的数据路径，OPTIONS是可选的导入选项。

以上是一些常用的Hive命令，通过这些命令可以完成对Hive数据库的操作和管理。根据需要，还可以使用更多的Hive命令来实现更复杂的操作。

2年前 0条评论