linux中hadoop命令大全 • Worktile社区

不及物动词

这个人很懒，什么都没有留下～

以下是Linux中Hadoop命令的完整列表：

1. hadoop: Hadoop的主命令，用于启动Hadoop任务和管理Hadoop集群。

2. hdfs: Hadoop分布式文件系统命令，用于管理HDFS的文件和目录。

– hdfs dfs -ls [路径]: 列出指定路径下的文件和目录。
– hdfs dfs -put [本地路径] [HDFS路径]: 将本地文件复制到HDFS路径。
– hdfs dfs -get [HDFS路径] [本地路径]: 将HDFS文件复制到本地路径。
– hdfs dfs -mkdir [路径]: 在HDFS中创建目录。
– hdfs dfs -rm [路径]: 删除HDFS中的文件或目录。

3. yarn: Hadoop资源管理器命令，用于管理集群上的应用程序资源分配和调度。

– yarn application -list: 列出所有正在运行的应用程序。
– yarn application -kill [应用程序ID]: 终止指定的应用程序。

4. mapred: Hadoop MapReduce框架命令，用于提交和管理MapReduce作业。

– mapred job -list: 列出所有正在运行的作业。
– mapred job -kill [作业ID]: 终止指定的作业。

5. hbase: Hadoop的分布式列式数据库命令，用于管理HBase表和数据。

– hbase shell: 进入HBase Shell，通过命令行与HBase进行交互。
– hbase create [表名] [列族]: 创建一个新的HBase表。
– hbase scan [表名]: 扫描并显示指定HBase表中的所有行。

6. hive: Hadoop的数据仓库工具命令，用于查询和分析大规模数据。

– hive -e [HiveQL命令]: 执行HiveQL命令。
– hive -f [Hive脚本文件]: 执行Hive脚本文件。

7. pig: Hadoop的数据分析平台命令，用于执行Pig Latin脚本和分析数据。

– pig -x local: 在本地模式下执行Pig Latin脚本。
– pig -x mapreduce: 在MapReduce模式下执行Pig Latin脚本。

8. sqoop: Hadoop的数据导入和导出工具命令，用于与关系型数据库交互。

– sqoop import –connect [数据库连接URL] –table [表名] –target-dir [HDFS路径]: 从关系型数据库导入数据到HDFS。
– sqoop export –connect [数据库连接URL] –table [表名] –export-dir [HDFS路径]: 将HDFS中的数据导出到关系型数据库。

这些是Hadoop在Linux中常用的命令，可以帮助用户管理和操作Hadoop集群以及处理大规模数据。

2年前 0条评论

fiy

Worktile&PingCode市场小伙伴

Hadoop是一个开源的分布式计算框架，用于处理大规模数据集的存储和处理。在Linux中，可以使用Hadoop命令来执行各种操作和管理任务。以下是一些常用的Hadoop命令列表：

1. HDFS命令：
– hadoop fs -ls [path]：显示HDFS上指定路径下的文件和目录列表。
– hadoop fs -mkdir [path]：创建一个新的目录。
– hadoop fs -put [localsrc] [dst]：将本地文件或目录上传到HDFS上的指定位置。
– hadoop fs -get [src] [localdst]：将HDFS上的文件或目录下载到本地目录。

2. MapReduce命令：
– hadoop jar [jar-file] [main-class] [input-path] [output-path]：运行MapReduce任务。
– hadoop job -list：列出当前正在运行的MapReduce任务。
– hadoop job -kill [job-id]：终止指定的MapReduce任务。

3. YARN命令：
– yarn application -list：列出当前正在运行的YARN应用程序。
– yarn application -kill [application-id]：终止指定的YARN应用程序。
– yarn logs -applicationId [application-id]：显示指定YARN应用程序的日志。

4. HBase命令：
– hbase shell：启动HBase交互式命令行界面。
– create ‘table-name’, ‘column-family’：创建一个新的HBase表。
– put ‘table-name’, ‘row-key’, ‘column-family:column’, ‘value’：向HBase表中插入数据。

5. Hive命令：
– hive：启动Hive交互式命令行界面。
– create table [table-name] (column1 data-type, column2 data-type, …)：创建一个新的Hive表。
– load data local inpath ‘input-file’ into table [table-name]：将本地文件加载到Hive表中。

这只是Hadoop命令的一小部分，还有许多其他命令可以用于不同的操作和管理任务。要进一步了解这些命令的详细用法，可以查阅相关的文档和资料。

2年前 0条评论

worktile

Worktile官方账号

Hadoop是一个开源的分布式计算框架，被广泛应用于大数据处理和分析场景。在Linux中使用Hadoop，需要运行一系列的Hadoop命令来管理和操作Hadoop集群。下面是一个Linux中Hadoop命令的大全，包括常用的Hadoop核心命令、HDFS文件系统命令、YARN资源管理器命令和MapReduce作业命令。

1. Hadoop核心命令
Hadoop核心命令用于管理和监控Hadoop集群。

1.1 启动和关闭Hadoop集群

– 启动Hadoop集群：
start-all.sh # 启动所有Hadoop服务
start-dfs.sh # 启动HDFS服务
start-yarn.sh # 启动YARN服务

– 关闭Hadoop集群：
stop-all.sh # 关闭所有Hadoop服务
stop-dfs.sh # 关闭HDFS服务
stop-yarn.sh # 关闭YARN服务

1.2 查看Hadoop集群状态

– 查看HDFS状态：
hdfs dfsadmin -report # 查看HDFS集群报告
hdfs dfs -du -s -h / # 查看HDFS根目录大小
hdfs fsck / # 检查和修复HDFS文件系统

– 查看YARN状态：
yarn node -list # 查看YARN节点列表
yarn application -list # 查看YARN应用列表

1.3 上传和下载文件

– 上传文件到HDFS：
hdfs dfs -put localfile hdfsfile # 上传本地文件到HDFS

– 下载文件从HDFS：
hdfs dfs -get hdfsfile localfile # 从HDFS下载文件到本地

1.4 删除文件和目录

– 删除文件：
hdfs dfs -rm filename # 删除HDFS文件

– 删除目录：
hdfs dfs -rm -r directory # 删除HDFS目录

2. HDFS文件系统命令
HDFS文件系统命令用于管理HDFS文件系统中的文件和目录。

2.1 查看文件和目录

– 查看文件和目录列表：
hdfs dfs -ls / # 查看根目录下的文件和目录
hdfs dfs -ls -R / # 递归查看文件和目录列表

– 查看文件内容：
hdfs dfs -cat filename # 查看文件内容

2.2 创建和删除目录

– 创建目录：
hdfs dfs -mkdir directory # 在HDFS中创建目录

– 删除目录：
hdfs dfs -rmdir directory # 删除HDFS中的空目录

2.3 移动和复制文件

– 移动文件：
hdfs dfs -mv srcfile destfile # 将文件从srcfile移动到destfile

– 复制文件：
hdfs dfs -cp srcfile destfile # 将文件从srcfile复制到destfile

2.4 修改文件和目录权限

– 修改文件权限：
hdfs dfs -chmod permissions filename # 修改文件权限

– 修改目录权限：
hdfs dfs -chmod permissions directory # 修改目录权限

3. YARN资源管理器命令
YARN资源管理器命令用于管理和监控YARN集群。

3.1 查看应用程序和队列

– 查看所有正在运行的应用程序：
yarn application -list # 查看YARN应用列表

– 查看队列：
yarn queue -list # 查看YARN队列列表

3.2 杀死应用程序

– 杀死某个应用程序：
yarn application -kill application_id # 杀死指定的YARN应用程序

4. MapReduce作业命令
MapReduce作业命令用于提交和管理MapReduce作业。

4.1 提交MapReduce作业

– 提交MapReduce作业：
hadoop jar jarfile mainclass input output # 提交MapReduce作业

4.2 查看作业状态和日志

– 查看作业状态：
mapred job -list # 查看所有作业列表
mapred job -status job_id # 查看指定作业的状态

– 查看作业日志：
mapred job -logs job_id # 查看作业的日志

以上是Linux中常用的Hadoop命令，可以通过在终端中运行这些命令来管理和操作Hadoop集群。通过熟练掌握这些命令，可以有效地管理和操作Hadoop集群，实现大数据处理和分析的需求。

2年前 0条评论