行者大数据linux命令

不及物动词 其他 33

回复

共3条回复 我来回复
  • worktile的头像
    worktile
    Worktile官方账号
    评论

    大数据领域中使用的Linux命令可以根据不同的情况和需求而有所变化,下面列举了一些常见的大数据领域中使用的Linux命令:

    1. hdfs命令:
    – hdfs dfs -ls:列出HDFS上的文件和文件夹;
    – hdfs dfs -cat:查看HDFS上的文件内容;
    – hdfs dfs -put:将本地文件上传到HDFS;
    – hdfs dfs -get:将HDFS上的文件下载到本地;
    – hdfs dfs -rm:删除HDFS上的文件或文件夹;
    – hdfs dfs -mkdir:在HDFS上创建文件夹;
    – hdfs dfs -du:查看HDFS上文件的大小。

    2. yarn命令:
    – yarn application -list:列出所有正在运行的YARN应用程序;
    – yarn application -kill:终止指定的YARN应用程序;
    – yarn application -status:查看指定YARN应用程序的状态;
    – yarn logs -applicationId:查看指定YARN应用程序的日志。

    3. Hive命令:
    – hive -e “SQL语句”:执行Hive中的SQL语句;
    – hive -f “脚本文件”:执行Hive脚本文件;
    – hive -S:以静默模式运行Hive,不输出额外的信息;
    – hive -d “变量名=值”:设置Hive中的变量。

    4. Spark命令:
    – spark-submit:提交Spark应用程序;
    – spark-shell:启动Spark的交互式Shell;
    – spark-sql:启动Spark的SQL命令行;
    – spark-class:运行Spark的其他类。

    5. HBase命令:
    – hbase shell:启动HBase的命令行;
    – list:列出所有的表;
    – create ‘表名’,’列族’:创建表;
    – disable ‘表名’:禁用表;
    – enable ‘表名’:启用表;
    – put ‘表名’,’行键’,’列族:列名’,’值’:插入数据;
    – get ‘表名’,’行键’:获取数据。

    除了上述列举的命令,大数据领域中还有其他常用的Linux命令,如:grep、awk、sed、cut等,用于数据处理和分析。大数据领域中的Linux命令非常丰富多样,根据实际需求选择合适的命令进行操作可以提高工作效率。

    2年前 0条评论
  • 不及物动词的头像
    不及物动词
    这个人很懒,什么都没有留下~
    评论

    Linux操作系统作为一种开源、稳定、强大的操作系统,被广泛应用于服务器、嵌入式设备、个人电脑等领域。在大数据领域,Linux命令几乎是必备技能,行者拥有对大数据领域的深刻理解和实践经验,特此整理了一些常用的Linux命令,以供参考:

    1. ls命令:用于列出当前目录下的文件和子目录。常用参数包括-l(显示详细信息)、-a(显示所有文件,包括隐藏文件)等。

    2. cd命令:用于切换当前工作目录。例如,cd /data可以切换到data目录;cd .. 可以返回上一级目录。

    3. mkdir命令:用于创建目录。例如,mkdir data可以创建一个名为data的目录。

    4. cp命令:用于复制文件或目录。例如,cp file1 file2可以将file1复制到file2。

    5. rm命令:用于删除文件或目录。例如,rm file1可以删除名为file1的文件,rm -r dir1可以删除名为dir1的目录。

    6. mv命令:用于移动文件或目录,并且可以用于重命名文件或目录。例如,mv file1 dir1可以将file1移动到dir1目录中,mv file1 file2可以将文件名从file1改为file2。

    7. cat命令:用于查看或连接文件。例如,cat file1可以查看file1的内容;cat file1 file2可以将file1和file2的内容连接起来。

    8. grep命令:用于在文件中查找指定的字符串。例如,grep “keyword” file可以在file中查找包含”keyword”的行。

    9. head和tail命令:用于显示文件的前几行或后几行。例如,head -n 10 file可以显示file的前10行;tail -n 5 file可以显示file的后5行。

    10. chmod命令:用于改变文件或目录的权限。例如,chmod 755 file可以将文件file的权限设置为755。

    11. chown命令:用于改变文件或目录的所有者。例如,chown user file可以将文件file的所有者设置为user。

    12. find命令:用于根据指定的条件查找文件或目录。例如,find /data -name “*.txt”可以在/data目录下查找所有后缀名为.txt的文件。

    13. wget命令:用于下载文件。例如,wget url可以从指定的url地址下载文件。

    14. tar命令:用于打包和解包文件。例如,tar -cvf file.tar dir可以将目录dir打包为file.tar;tar -xvf file.tar可以解包file.tar。

    这些是行者大数据领域常用的一些Linux命令,掌握了这些命令,可以帮助你更好地管理和操作大数据环境。当然,随着技术的发展,新的命令和工具也不断出现,保持学习和探索的态度,才能更好地应对大数据的挑战。

    2年前 0条评论
  • fiy的头像
    fiy
    Worktile&PingCode市场小伙伴
    评论

    一、基本命令
    1. ls:显示当前目录下的文件和目录列表。
    语法:ls [选项] [文件/目录]
    常用选项:
    -a:显示隐藏文件;
    -l:以列表方式显示文件和目录的详细信息;
    -R:递归显示子目录下的文件和目录;
    2. cd:切换当前工作目录。
    语法:cd [目录路径]
    例子:
    cd /home:进入home目录;
    cd ..:进入上一级目录;
    3. pwd:显示当前工作目录的路径。
    语法:pwd
    例子:
    pwd:显示当前工作目录的完整路径;
    4. mkdir:创建新目录。
    语法:mkdir [选项] 目录名
    常用选项:
    -p:递归创建目录;
    -v:显示创建的目录名。
    5. touch:创建新的空文件。
    语法:touch 文件名
    例子:
    touch file.txt:创建一个名为file.txt的空文件;
    6. cp:复制文件和目录。
    语法:cp [选项] 源文件/目录 目标文件/目录
    常用选项:
    -r:复制目录及其内容;
    -a:保留文件属性;
    -i:询问是否覆盖已存在的目标文件;
    例子:
    cp file.txt /home:将file.txt文件复制到/home目录;
    cp -r /home/dir1 /home/dir2:复制dir1目录及其内容到dir2目录;
    7. mv:移动或重命名文件和目录。
    语法:mv [选项] 源文件/目录 目标文件/目录
    常用选项:
    -i:询问是否覆盖已存在的目标文件;
    例子:
    mv file.txt /home:将file.txt文件移动到/home目录;
    mv dir1 new_dir:将dir1目录重命名为new_dir;
    8. rm:删除文件和目录。
    语法:rm [选项] 文件/目录
    常用选项:
    -r:递归删除目录及其内容;
    -f:强制删除,不提示任何信息;
    -i:询问是否删除;
    例子:
    rm file.txt:删除file.txt文件;
    rm -r dir1:删除dir1目录及其内容;
    9. cat:连接文件并打印到标准输出或文件中。
    语法:cat [选项] 文件
    常用选项:
    -n:显示行号;
    -b:显示行号,但不包括空行;
    -A:显示特殊字符(空白字符、换行符等);
    例子:
    cat file.txt:显示file.txt文件内容;
    10. more:逐页显示文本文件内容。
    语法:more [选项] 文件
    常用选项:
    输入空格键:显示下一页;
    输入q键:退出查看;
    例子:
    more file.txt:逐页显示file.txt文件内容;
    二、系统管理命令
    1. top:实时查看系统的运行状态和进程信息。
    语法:top
    常用操作:
    输入q键:退出top命令;
    输入k键:杀死指定的进程;
    2. ps:显示当前进程的信息。
    语法:ps [选项]
    常用选项:
    -a:显示所有终端上的进程(包括其他用户的进程);
    -u:显示用户所启动的进程;
    -x:显示以exec方式执行的进程;
    例子:
    ps aux:以列表方式显示当前所有进程的详细信息;
    3. kill:终止进程。
    语法:kill [选项] 进程ID
    常用选项:
    -9:强制终止进程;
    例子:
    kill 12345:终止进程ID为12345的进程;
    4. netstat:显示网络连接、路由表和网络接口信息。
    语法:netstat [选项]
    常用选项:
    -n:以数字方式显示IP地址和端口号;
    -a:显示所有网络连接,包括监听和非监听端口;
    -t:仅显示TCP连接;
    -u:仅显示UDP连接;
    例子:
    netstat -nltp:显示所有正在监听的TCP端口;
    5. ifconfig:配置和显示网络设备的信息。
    语法:ifconfig [选项] 网络设备名
    常用选项:
    -a:显示全部网络设备信息;
    例子:
    ifconfig eth0:显示eth0网络设备的信息;
    6. systemctl:系统服务管理工具。
    语法:systemctl [选项] 命令 服务名
    常用命令:
    start:启动服务;
    stop:停止服务;
    restart:重启服务;
    enable:设置服务开机启动;
    disable:设置服务不开机启动;
    status:查看服务状态;
    例子:
    systemctl start httpd:启动httpd服务;
    systemctl stop httpd:停止httpd服务;
    三、文件处理命令
    1. find:根据条件查找文件。
    语法:find [路径] [选项] 操作
    常用选项:
    -name:按名称查找文件;
    -size:按文件大小查找文件;
    -type:按文件类型查找文件;
    例子:
    find /home -name file.txt:在/home目录中查找名为file.txt的文件;
    find /var -size +1M:在/var目录中查找大小超过1M的文件;
    2. grep:在文件中查找指定的字符串。
    语法:grep [选项] 字符串 文件
    常用选项:
    -i:忽略大小写;
    -v:显示不包含指定字符串的行;
    -n:显示行号;
    例子:
    grep “keyword” file.txt:在file.txt文件中查找包含“keyword”的行;
    3. sed:对文本进行流编辑操作。
    语法:sed [选项] ‘操作’ 文件
    常用选项:
    -i:直接修改文件内容;
    -e:指定多个操作;
    例子:
    sed ‘s/old_string/new_string/g’ file.txt:将文件中的所有“old_string”替换为“new_string”;
    4. awk:对文本进行格式化和其他操作。
    语法:awk ‘条件1{操作1} 条件2{操作2} …’ 文件
    例子:
    awk ‘{print $1,$3}’ file.txt:打印文件中每行的第1列和第3列;
    四、压缩和解压命令
    1. tar:打包和解包文件。
    语法:tar [选项] 压缩文件名 源文件/目录
    常用选项:
    -c:创建压缩文件;
    -x:解包压缩文件;
    -f:指定压缩文件的名称;
    -z:使用gzip压缩文件(.tar.gz);
    例子:
    tar -cvf archive.tar file1 file2:将file1和file2打包成archive.tar文件;
    tar -xvf archive.tar:解包archive.tar文件;
    2. gzip:压缩文件。
    语法:gzip [选项] 文件
    常用选项:
    -r:递归压缩目录及其内容;
    -d:解压缩文件;
    例子:
    gzip file.txt:压缩file.txt文件为file.txt.gz;
    gzip -d file.txt.gz:解压缩file.txt.gz文件;
    3. zip:打包和解包文件。
    语法:zip [选项] 压缩文件名 源文件/目录
    常用选项:
    -r:递归打包目录及其内容;
    -d:解包压缩文件;
    例子:
    zip -r archive.zip dir1 dir2:将dir1和dir2打包成archive.zip文件;
    unzip archive.zip:解包archive.zip文件;
    五、网络命令
    1. ping:测试网络连通性。
    语法:ping [选项] IP地址/主机名
    常用选项:
    -c:发送指定数量的数据包;
    -i:设定数据包之间的时间间隔;
    例子:
    ping http://www.baidu.com:测试与百度主机的连通性;
    2. nslookup:查询域名解析信息。
    语法:nslookup [选项] 域名/IP地址
    常用选项:
    -qt:指定查询类型;
    例子:
    nslookup http://www.baidu.com:查询百度主机的IP地址;
    3. ifup/ifdown:启动/停止网络接口。
    语法:ifup 网络接口名
    例子:
    ifup eth0:启动eth0网络接口;
    四、中级命令
    1. grep搜索。
    信息查找处理命令,grep能使用正则表达式进行搜索,搜索满足条件的行,并将结果输出。
    $ grep [option] pattern file
    常用参数选项:
    -n 输出显示行号,显示行号及符合范本样式的那一行。
    -e 指定范本样式,多样式查询。
    -v 反向选择,显示不包含范本样式的行。
    2. lsof查看开放的文件。
    Linux系统中,任何事物都以文件形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。所以对系统的观察和调试过程中都少不了对文件的操作。lsof命令就是在列出Linux系统中已经被打开的文件,它是一种查看Unix / Linux系统中已打开的文件的工具。
    $ lsof -c 命令名称
    3. cat查看文件内容。
    cat命令是Linux下常用的查看文件内容的命令。
    $ cat [option] filename
    常用参数选项:
    -n 由1开始对所有输出的行数编号。
    -b 由1开始对所有非空输出行编号。
    -v 区别显示制表符、换行符和行结束符。
    -e 在每行结束处显示$符号。
    4. head显示文件开头内容。
    head 命令用于显示文件的开头若干内容。默认情况下,head命令显示文件的头10行内容。
    $ head [option] filename
    常用参数选项:
    -n 显示文件的前n行内容。
    -c 显示文件的前n字节内容。
    5. tail显示文件结尾内容。
    tail 命令用于显示文件的结尾若干内容。默认情况下,tail命令显示文件的尾10行内容。
    $ tail [option] filename
    常用参数选项:
    -n 显示文件的后n行内容。
    -c 显示文件的后n字节内容。
    -f 循环读取文件的新添加的数据。
    6. wc统计文件的字符、字和行数。
    wc 命令用于统计文件中的字符数、字数、行数。
    $ wc [option] filename
    常用参数选项:
    -c 统计文件的字符数。
    -w 统计文件的单词数。
    -l 统计文件的行数。
    7. cut截取文件的指定部分。
    cut 命令用于截取文件的指定部分。
    $ cut [option] filename
    常用参数选项:
    -d 指定分隔符。
    -f 指定要截取的第几个字段。
    8. sort对文件内容排序。
    sort 命令用于对文件的每行内容进行排序,默认是以字母的升序来排列。
    $ sort [option] filename
    常用参数选项:
    -n 以数值型进行排序。
    -r 以倒序方式排序。
    -u 当有重复行时删除重复行。
    -k 以指定的字段进行排序。
    9. uniq去重显示。
    uniq 命令用于过滤文件中的重复行,它会去掉文件中相邻的重复行。
    $ uniq [option] filename
    常用参数选项:
    -c 在每行输出前加上重复出现的次数。
    -d 仅显示重复出现的行。
    -u 仅显示不重复的行。
    10. diff比较文件之间的差异。
    diff 命令用于比较两个文件的内容的差异。如果两个文件是相同的,则diff命令不会输出任何内容。
    $ diff [option] file1 file2
    常用参数选项:
    -c 以上下文的方式输出差异。
    -u 以统一的格式输出差异。
    11. sed对文件内容进行文本替换。
    sed 命令是一种流编辑器,它是文本处理中非常中的工具,能够在命令行上对文件内容进行替换操作。
    $ sed [option] command filename
    常用参数选项:
    -i 直接修改文件内容。
    -e 可以在一行内跑多个sed命令。
    12. awk提取文本信息。
    awk是一种流行的文本处理工具,它通常用于数据提取和报告生成。它支持自定义的操作和内置函数,并且以行为单位执行操作。
    $ awk [option] ‘condition1 { action1} condition2 { action2} …’ filename
    常用参数选项:
    -F 指定字段分隔符。
    -v 定义用户自定义变量。
    13. xargs命令从标准输入中读取数据,并将其作为参数传递给其他命令。
    xargs 命令是Linux下一个强大的命令行工具,可以将标准输入的数据转换成命令行参数。它有助于读取标准输入数据,并使用这些数据作为其他命令的参数。
    $ command | xargs [option] [command]
    常用参数选项:
    -d 指定分隔符。
    -I 指定替换字符串。
    14. tee命令将标准输入复制到标准输出,并将其保存到文件中。
    tee 命令可以将标准输入的内容复制到标准输出,并将其保存到文件中。它常用于同时在屏幕上显示输出和将其写入文件。
    $ command | tee [option] filename
    常用参数选项:
    -a 追加内容到文件中。

    2年前 0条评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部