linux删除重复行命令 • Worktile社区

fiy

Worktile&PingCode市场小伙伴

要使用Linux删除重复行的命令，可以使用`uniq`命令。`uniq`命令用于去除已排序文件中的连续重复行。

基本的`uniq`命令语法如下：
“`
uniq [选项] [输入文件] [输出文件]
“`
其中，选项包括：
– `-c`：在输出结果中每行的前面显示该行在文件中的出现次数；
– `-d`：仅显示重复的行；
– `-i`：忽略大小写；
– `-u`：仅显示不重复的行。

以下是一些常见的用法示例：

1. 删除文件中的重复行（不区分大小写）并将结果输出到另一个文件：
“`bash
uniq -i input.txt output.txt
“`

2. 在输出结果中显示重复行及其出现次数：
“`bash
uniq -c input.txt
“`

3. 仅显示不重复的行：
“`bash
uniq -u input.txt
“`

注意：使用`uniq`命令删除重复行前，需要先按照需要的方式对文件进行排序，否则无法正确去除重复行。可以使用`sort`命令对文件进行排序，然后再使用`uniq`命令删除重复行，例如：
“`bash
sort input.txt | uniq > output.txt
“`

以上是Linux中删除重复行的基本命令。根据实际需求，可以结合其他命令和选项来完成更复杂的任务。

2年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

在Linux系统中，可以使用以下几种命令来删除重复行：

1. `sort`和`uniq`命令的组合
使用`sort`命令将文本文件的内容按照字典顺序排序，并将结果通过管道传递给`uniq`命令。`uniq`命令会从排序后的结果中删除连续出现的重复行。
例如，要删除名为`input.txt`的文件中的重复行，可以执行以下命令：
“`
sort input.txt | uniq > output.txt
“`
这将在`output.txt`文件中生成没有重复行的内容。

2. `awk`命令
`awk`是一个强大的文本处理工具，也可以用来删除重复行。使用`awk`命令可以创建一个数组来存储每行的内容，然后检查数组中是否已存在相同内容的行。如果存在，则不打印该行，从而删除重复行。
以下是使用`awk`命令删除重复行的示例：
“`
awk ‘!seen[$0]++’ input.txt > output.txt
“`

3. `sed`命令
`sed`是一个流编辑器，也可以用来删除重复行。它可以根据模式匹配和替换的规则来对输入进行编辑。通过使用`sed`的`N`命令，可以将下一行添加到模式空间，然后根据需要进行比较和替换，从而删除重复行。
使用`sed`命令删除重复行的示例：
“`
sed ‘$!N; /^$.*$\n\1$/!P; D’ input.txt > output.txt
“`

4. `awk`和`sort`命令的组合
另一种通过`awk`和`sort`命令组合使用的方法是，首先使用`sort`对输入进行排序，然后使用`awk`来比较相邻行的内容，删除重复行。
例如：
“`
sort input.txt | awk ‘!($0 in a){a[$0]; print}’ > output.txt
“`

5. `perl`命令
`perl`是一种通用的脚本语言，也可以用来处理文本文件。通过使用`perl`的哈希表功能，可以很容易地删除重复行。
以下是使用`perl`命令删除重复行的示例：
“`
perl -ne ‘print unless $seen{$_}++’ input.txt > output.txt
“`

以上是在Linux系统中删除重复行的几种常用方法。根据实际情况选择合适的命令来完成任务。

2年前 0条评论

worktile

Worktile官方账号

在Linux中删除重复行有多种方法，下面将介绍三种常用的方法：使用awk命令、使用sort和uniq命令、使用sed命令。

方法一：使用awk命令删除重复行
1. 打开终端并进入要操作的文件所在目录；
2. 输入以下命令并按下回车键：
“`
awk ‘!a[$0]++’ 文件名
“`
其中，`!a[$0]++` 表示对每一行进行操作，`a[$0]++` 表示将每一行数据保存到数组 `a` 中，并判断是否已存在，若存在则不输出；
3. 删除文件中的重复行。

方法二：使用sort和uniq命令删除重复行
1. 打开终端并进入要操作的文件所在目录；
2. 输入以下命令并按下回车键：
“`
sort 文件名 | uniq > 新文件名
“`
其中，`sort` 命令将文件中的内容进行排序，`uniq` 命令则去除重复的行，`>` 表示将结果输出到一个新文件中；
3. 删除原文件，并将新文件重命名为原文件名。

方法三：使用sed命令删除重复行
1. 打开终端并进入要操作的文件所在目录；
2. 输入以下命令并按下回车键：
“`
sed ‘$!N; /^$.*$\n\1$/!P; D’ 文件名 > 新文件名
“`
其中，`$!N; /^$.*$\n\1$/!P; D` 表示对每一行进行操作，判断是否为重复行，并仅保留首次出现的行；
3. 删除原文件，并将新文件重命名为原文件名。

注意事项：
– 在使用上述方法时，需要将 `文件名` 替换为实际的文件名；
– 使用方法二和方法三时，需要使用新文件进行处理，并删除原文件，以防意外数据损失。

通过以上方法，你可以轻松地在Linux中删除重复行。

2年前 0条评论