linux如何去掉文档中重复

在 Linux 系统中，有很多方法可以去掉文档里的重复行，下面为你介绍几种常见的方式：

1. 使用
sort和
uniq命令

sort命令可对文本内容进行排序，uniq命令则用于去除相邻的重复行。所以要先排序，再去除重复行。
bash

your_file.txt new_file.txt

解释：

2. 仅使用
sort命令

sort命令自带去除重复行的功能，借助-u选项就可以实现。
bash

your_file.txt new_file.txt

解释：

3. 使用
awk命令

awk是一个强大的文本处理工具，能编写脚本来去除重复行。
bash

your_file.txt new_file.txt

912 your_file.txt > new_file.txt

解释：

seen[$0]：是一个关联数组，$0代表当前行。seen[$0]++先使用seen[$0]的值，再将其值加 1。
!seen[$0]++：若seen[$0]的值为 0（即该行第一次出现），则表达式为真，打印当前行；若不为 0（即该行已出现过），则表达式为假，不打印。
> new_file.txt：把处理后的结果输出到new_file.txt文件。

你可以根据实际情况选择合适的方法。若文件内容已排序，可直接使用uniq命令；若未排序，使用sort -u更方便；若需要更复杂的处理，awk命令会是更好的选择。

← 上一篇: cmd怎么执行linux下一篇: linux如何挂载u盘代码→

相关文章：