linux的去重复命令 • Worktile社区

不及物动词

这个人很懒，什么都没有留下～

在Linux中，可以使用`uniq`命令去除重复行。`uniq`命令可以从标准输入或者文件中删除相邻的重复行，并将结果输出到标准输出。该命令有一些常用的选项，可以帮助我们处理不同情况下的重复行。

下面是一些常用的`uniq`命令选项：
– `-d`：只显示重复行，即只显示连续出现的相同行。
– `-u`：只显示不重复的行，即只显示不出现过的行。
– `-c`：在每行前面显示重复出现的次数。
– `-i`：忽略大小写，对比行时不区分大小写。
– `-s`：跳过开头的前N个字符。
– `-w`：对比行时只对比开头的前N个字符。

以下是一些示例：

1. 从文件中去重复行并输出结果：
“`
uniq file.txt
“`

2. 从标准输入中读取数据并去重复行：
“`
cat file.txt | uniq
“`

3. 只显示重复的行：
“`
uniq -d file.txt
“`

4. 只显示不重复的行：
“`
uniq -u file.txt
“`

5. 在每行前面显示重复出现的次数：
“`
uniq -c file.txt
“`

6. 忽略大小写进行对比：
“`
uniq -i file.txt
“`

以上是一些常用的`uniq`命令选项，通过这些选项可以灵活运用`uniq`命令去除重复行。希望对你有所帮助！

2年前 0条评论

fiy

Worktile&PingCode市场小伙伴

在Linux中，有几个命令可以用来去除重复的行或文件。下面是五个常用的去重复命令：

1. `uniq`命令
`uniq`命令用于去除已经排好序的文件中的重复行。它会将相邻的重复行合并成一个，只输出其中的一行。使用`uniq`命令时，需要确保文件已经按照某种排序方式进行了排序。可以使用`sort`命令预先对文件进行排序，然后再使用`uniq`命令去除重复行。
示例：
“`
sort file.txt | uniq > output.txt
“`

2. `awk`命令
`awk`是一种功能强大的文本处理工具，可以用于在处理文本时去除重复行。使用`awk`命令时，可以通过`!seen[$0]++`来去除重复行，它利用了`seen`数组来记录已经出现过的行，并在第二次出现时过滤掉。
示例：
“`
awk ‘!seen[$0]++’ file.txt > output.txt
“`

3. `sort -u`命令
`sort -u`命令可以对文件进行排序并去除重复行。它会将排序后的文件中的重复行只输出其中的一行。
示例：
“`
sort -u file.txt > output.txt
“`

4. `comm`命令
`comm`命令用于比较两个已经排序的文件，并输出它们的共同行、不同行等信息。如果只需要输出不重复的行，可以通过结合`sort`命令来实现。
示例：
“`
comm -23 <(sort file1.txt) <(sort file2.txt) > output.txt
“`

5. `awk ‘!a[$0]++’`命令
此命令实现了在处理文本时去除重复行的功能，类似于`awk`命令的用法。它利用了数组`a`来记录已经出现过的行，并在第二次出现时过滤掉。
示例：
“`
awk ‘!a[$0]++’ file.txt > output.txt
“`

以上是Linux中常用的去重复命令，根据具体的需求选择适合的命令即可。

2年前 0条评论

worktile

Worktile官方账号

在Linux系统中，可以使用多种命令进行去重操作。下面将介绍几个常用的去重复命令及其使用方法。

1. `sort`命令配合`uniq`命令去重：
（1）使用`sort`命令对文件内容进行排序，然后使用`uniq`命令去除相邻的重复行。
“`shell
sort file.txt | uniq > result.txt
“`
（2）使用`sort`命令的`-u`选项对文件内容进行排序并去除重复行。
“`shell
sort -u file.txt > result.txt
“`
（3）使用`sort`命令的`-u`选项对文件内容进行排序并压缩重复行。
“`shell
sort -u -o result.txt file.txt
“`

2. `awk`命令去重：
使用`awk`命令的数组功能，对每一行进行处理，通过数组的唯一性实现去重。

“`shell
awk ‘!a[$0]++’ file.txt > result.txt
“`

3. `sed`命令去重：
使用`sed`命令对文件内容进行处理，通过删除重复行实现去重。

“`shell
sed -i ‘$!N; /^$.*$\n\1$/!P; D’ file.txt
“`

4. `comm`命令去重：
`comm`命令主要用于比较两个已排序的文件，并输出它们的不同之处。如果将同一个文件作为两个参数，则可以实现去重的效果。

“`shell
comm -12 <(sort file.txt) <(sort file.txt) > result.txt
“`

5. `uniq`命令去重：
`uniq`命令可以去除排序过的文件的重复行。

“`shell
uniq file.txt > result.txt
“`

6. `perl`命令去重：
使用`perl`命令对文件内容进行处理，通过正则表达式去重。

“`shell
perl -ne ‘print unless $seen{$_}++’ file.txt > result.txt
“`

以上是Linux系统常用的去重复命令及其使用方法。根据具体需求，选择合适的命令进行去重操作。

2年前 0条评论