linux中uniq命令详解 • Worktile社区

worktile

Worktile官方账号

uniq命令是Linux中一个用于去除重复行的命令，其主要功能是用来检测和删除文本文件中相邻的重复行。下面是对uniq命令的详细解释。

1. uniq命令的基本语法：
uniq [选项] [输入文件] [输出文件]

2. uniq命令的常用选项：
-c：在每行前面显示该行重复出现的次数；
-d：仅显示重复出现的行；
-i：忽略大小写进行比较；
-u：仅显示不重复的行；
-f num：忽略前num个字符进行比较；
-s num：跳过前num个字符进行比较。

3. uniq命令的使用示例：

（1）去除重复行：
uniq input.txt > output.txt

（2）统计每行重复出现的次数：
uniq -c input.txt

（3）仅显示重复出现的行：
uniq -d input.txt

（4）忽略大小写进行比较：
uniq -i input.txt

（5）仅显示不重复的行：
uniq -u input.txt

（6）忽略前n个字符进行比较：
uniq -f 2 input.txt

（7）跳过前n个字符进行比较：
uniq -s 4 input.txt

4. uniq命令的注意事项：
（1）uniq命令只能对有序的文本进行处理，因此在使用之前需要先对文本进行排序（可以使用sort命令进行排序）；
（2）uniq命令默认直接比较整行，如果需要比较指定的列，则需要先使用cut命令截取指定列。

总结：uniq命令是Linux中用于去除重复行的强大工具，通过简单的命令选项，可以轻松实现对文本中重复行的删除、统计和筛选等操作。掌握uniq命令的使用方法，能够提高数据处理的效率和准确性。

2年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

uniq命令用于从输入数据中删除重复的行，并将结果输出到标准输出。它是一个非常有用的命令，可以用于处理文本数据，查找重复内容或统计唯一项。以下是对uniq命令的详细解释。

1. 基本用法：
uniq命令的基本用法是从输入数据中删除重复的行并输出结果。可以将uniq命令与管道操作符配合使用，实现从文件或其他命令的输出中删除重复行。例如，可以使用以下命令来从文件中删除重复的行并输出结果：
“`shell
uniq filename
“`
如果想要输出结果到新文件而不是标准输出，可以使用重定向符号”>”将uniq的输出重定向到新文件中：
“`shell
uniq filename > newfile
“`

2. 排序后去重：
uniq命令默认只删除相邻的重复行。如果要删除所有重复的行，需要先对输入数据进行排序，然后再使用uniq命令。可以使用sort命令对输入数据进行排序，然后再将结果传递给uniq命令。例如，可以使用以下命令对文件进行排序并删除重复的行：
“`shell
sort filename | uniq
“`
如果想要删除重复行的同时保留排序顺序，可以添加参数”-d”，该参数会保留重复行，并将只出现一次的行删除：
“`shell
sort filename | uniq -d
“`

3. 统计重复行的数量：
uniq命令也可以用于统计重复行的数量。可以使用参数”-c”来显示每个重复行出现的次数。例如，可以使用以下命令统计每个重复行的数量：
“`shell
sort filename | uniq -c
“`
该命令会输出每个重复行的数量以及该行的内容。

4. 忽略指定的前缀字符：
uniq命令还提供了参数”-s”用于忽略指定数量的前缀字符。可以使用该参数来指定忽略行首的前缀字符数量。例如，可以使用以下命令忽略前两个字符并删除重复的行：
“`shell
sort filename | uniq -s 2
“`
也可以使用参数”-w”来指定忽略前缀的字符数量。例如，可以使用以下命令忽略前3个字符并删除重复的行：
“`shell
sort filename | uniq -w 3
“`

5. 按照指定的字段进行去重：
在某些情况下，需要按照特定的字段进行去重。可以使用参数”-f”来指定忽略开头的字段数量。例如，可以使用以下命令按照第二个字段进行去重：
“`shell
sort -k2 filename | uniq -f 1
“`
该命令会按照第二个字段进行排序，并且忽略开头的一个字段，然后删除重复的行。

总结：
uniq命令是一个非常有用的Linux命令，可以用于删除重复的行，统计唯一项以及按照指定的字段进行去重。可以结合其他命令如sort、grep等使用，增加uniq命令的灵活性。了解uniq命令及其不同的参数使用方式，可以更好地处理文本数据，提高工作效率。

2年前 0条评论

fiy

Worktile&PingCode市场小伙伴

一、概述
uniq命令是Linux系统中的一个常用工具，用于从输入中检测和删除重复的行。它会将重复的行集中显示，或者只显示唯一的行。uniq命令通常与其他命令一起使用，如sort命令对输入进行排序，然后再使用uniq命令进行去重。

二、语法
uniq命令的基本语法如下：
“`
uniq [选项] 文件名
“`
常用的选项包括：
– -c，显示每行重复出现的次数。
– -d，只显示重复的行。
– -i，忽略大小写进行比较。
– -f N，忽略前N个字段。
– -s N，忽略前N个字符。

三、示例
1. 从文件中去除重复行，并输出唯一行到另一个文件
“`
uniq file1.txt file2.txt
“`
此命令将读取file1.txt文件的内容，去除重复的行，并将唯一行写入file2.txt文件。

2. 统计出现的重复行的次数
“`
uniq -c file.txt
“`
此命令将读取file.txt文件的内容，并显示每行重复出现的次数。

3. 仅显示重复的行
“`
uniq -d file.txt
“`
此命令将读取file.txt文件的内容，并仅显示重复的行。

4. 忽略大小写进行比较
“`
uniq -i file.txt
“`
此命令将读取file.txt文件的内容，并忽略大小写进行比较。

5. 忽略前N个字段
“`
uniq -f N file.txt
“`
此命令将读取file.txt文件的内容，并忽略前N个字段进行比较。N为数字。

6. 忽略前N个字符
“`
uniq -s N file.txt
“`
此命令将读取file.txt文件的内容，并忽略前N个字符进行比较。N为数字。

四、uniq命令的原理
uniq命令的去重原理是基于文本行的重复性，去重时需要保持输入文本的行序。uniq命令要求输入是已经按照某种规则排序的文本，它会将相邻的重复行集中，并根据需要进行统计或去重。

uniq命令的去重过程包括两个阶段：排序阶段和去重阶段。排序阶段通过sort命令进行排序，排序的结果作为uniq命令的输入。去重阶段则是根据相邻行的内容进行比较，去除重复的行。

uniq命令通过比较输入文本行的内容是否相同，来判断是否为重复行。比较时可以选择是否忽略大小写，忽略前N个字段或前N个字符。如果输入文本已经排序，那么uniq命令可以直接判断相邻行是否重复。如果输入文本没有排序，可使用sort命令对输入文本进行排序，然后再使用uniq命令进行去重。

五、小结
uniq命令在Linux系统中是一个非常实用的工具，用于检测和删除重复的行。通过合理使用uniq命令的选项，可以根据不同的需求进行去重操作，同时通过组合其他命令如sort命令，可以实现更复杂的功能。

2年前 0条评论