导航：首页 > 服务器 >

shell脚本中文本处理工具的介绍和使用

发表于：2025-12-03 作者：千家信息网编辑

千家信息网最后更新 2025年12月03日，这篇文章为大家带来有关shell脚本中文本处理工具使用的详细介绍。大部分工具可能大家会经常用到，为此分享给大家做个详细的总结，希望你们能深刻了解shell文本处理工具的用法。1. grep工具grep

千家信息网最后更新 2025年12月03日shell脚本中文本处理工具的介绍和使用

这篇文章为大家带来有关shell脚本中文本处理工具使用的详细介绍。大部分工具可能大家会经常用到，为此分享给大家做个详细的总结，希望你们能深刻了解shell文本处理工具的用法。

1. grep工具

grep是行过滤工具；用于根据关键字进行行过滤

语法和选项

语法：

# grep [选项] '关键字' 文件名

常见选项：

OPTIONS:    -i: 不区分大小写    -v: 查找不包含指定内容的行,反向选择    -w: 按单词搜索    -o: 打印匹配关键字    -c: 统计匹配到的行数    -n: 显示行号    -r: 逐层遍历目录查找    -A: 显示匹配行及后面多少行     -B: 显示匹配行及前面多少行    -C: 显示匹配行前后多少行    -l：只列出匹配的文件名    -L：列出不匹配的文件名    -e: 使用正则匹配    -E:使用扩展正则匹配    ^key:以关键字开头    key$:以关键字结尾    ^$:匹配空行    --color=auto ：可以将找到的关键词部分加上颜色的显示

颜色显示（别名设置）：

临时设置：# alias grep='grep --color=auto'            //只针对当前终端和当前用户生效永久设置：1）全局（针对所有用户生效）vim /etc/bashrcalias grep='grep --color=auto'source /etc/bashrc2）局部（针对具体的某个用户）vim ~/.bashrcalias grep='grep --color=auto'source ~/.bashrc

举例说明：

==说明：不要直接使用/etc/passwd文件，将其拷贝到/tmp下做实验！==

# grep -i root passwd                       忽略大小写匹配包含root的行# grep -w ftp passwd                        精确匹配ftp单词# grep -w hello passwd                      精确匹配hello单词;自己添加包含hello的行到文件# grep -wo ftp passwd                       打印匹配到的关键字ftp# grep -n root passwd                       打印匹配到root关键字的行好# grep -ni root passwd                      忽略大小写匹配统计包含关键字root的行# grep -nic root passwd                     忽略大小写匹配统计包含关键字root的行数# grep -i ^root passwd                      忽略大小写匹配以root开头的行# grep bash$ passwd                             匹配以bash结尾的行# grep -n ^$ passwd                             匹配空行并打印行号# grep ^# /etc/vsftpd/vsftpd.conf       匹配以#号开头的行# grep -v ^# /etc/vsftpd/vsftpd.conf    匹配不以#号开头的行# grep -A 5 mail passwd                     匹配包含mail关键字及其后5行# grep -B 5 mail passwd                     匹配包含mail关键字及其前5行# grep -C 5 mail passwd                     匹配包含mail关键字及其前后5行

2. cut工具

cut是列截取工具，用于列的截取

语法和选项

语法：

# cut 选项  文件名

常见选项：

-c: 以字符为单位进行分割,截取-d: 自定义分隔符，默认为制表符\t-f: 与-d一起使用，指定截取哪个区域

举例说明:

# cut -d: -f1 1.txt             以:冒号分割，截取第1列内容# cut -d: -f1,6,7 1.txt     以:冒号分割，截取第1,6,7列内容# cut -c4 1.txt                 截取文件中每行第4个字符# cut -c1-4 1.txt           截取文件中每行的1-4个字符# cut -c4-10 1.txt          截取文件中每行的4-10个字符# cut -c5- 1.txt                从第5个字符开始截取后面所有字符

3. sort工具

sort工具用于排序;它将文件的每一行作为一个单位，从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

语法和选项

-u ：去除重复行-r ：降序排列，默认是升序-o : 将排序结果输出到文件中,类似重定向符号>-n ：以数字排序，默认是按字符排序-t ：分隔符-k ：第N列-b ：忽略前导空格。-R ：随机排序，每次运行的结果均不同

举例说明

# sort -n -t: -k3 1.txt             按照用户的uid进行升序排列# sort -nr -t: -k3 1.txt            按照用户的uid进行降序排列# sort -n 2.txt                         按照数字排序# sort -nu 2.txt                        按照数字排序并且去重# sort -nr 2.txt # sort -nru 2.txt # sort -nru 2.txt # sort -n 2.txt -o 3.txt            按照数字排序并将结果重定向到文件# sort -R 2.txt # sort -u 2.txt

4.uniq工具

uniq用于去除==连续==的==重复==行

常见选项：-i: 忽略大小写-c: 统计重复行次数-d:只显示重复行举例说明：# uniq 2.txt # uniq -d 2.txt # uniq -dc 2.txt

5.tee工具

tee工具是从标准输入读取并写入到标准输出和文件，即：双向覆盖重定向（屏幕输出|文本输入）

选项：-a 双向追加重定向# echo hello world# echo hello world|tee file1# cat file1 # echo 999|tee -a file1# cat file1

6.diff工具

diff工具用于逐行比较文件的不同

注意：diff描述两个文件不同的方式是告诉我们==怎样改变第一个==文件之后==与第二个文件匹配==。

语法和选项

语法：

diff [选项] 文件1 文件2

常用选项：

选项	含义	备注
-b	不检查空格
-B	不检查空白行
-i	不检查大小写
-w	忽略所有的空格
--normal	正常格式显示(默认)
-c	上下文格式显示
-u	合并格式显示

举例说明：

比较两个==普通文件==异同，文件准备：

[root@MissHou ~]# cat file1aaaa111hello world222333bbb[root@MissHou ~]#[root@MissHou ~]# cat file2aaahello111222bbb333world

1）正常显示

diff目的：file1如何改变才能和file2匹配[root@MissHou ~]# diff file1 file21c1,2                   第一个文件的第1行需要改变(c=change)才能和第二个文件的第1到2行匹配         < aaaa              小于号"<"表示左边文件(file1)文件内容---                 ---表示分隔符> aaa                   大于号">"表示右边文件(file2)文件内容> hello3d3                 第一个文件的第3行删除(d=delete)后才能和第二个文件的第3行匹配< hello world5d4                 第一个文件的第5行删除后才能和第二个文件的第4行匹配< 3336a6,7                   第一个文件的第6行增加(a=add)内容后才能和第二个文件的第6到7行匹配> 333                   需要增加的内容在第二个文件里是333和world> world

2）上下文格式显示

[root@MissHou ~]# diff -c file1 file2前两行主要列出需要比较的文件名和文件的时间戳；文件名前面的符号***表示file1，---表示file2*** file1       2019-04-16 16:26:05.748650262 +0800--- file2       2019-04-16 16:26:30.470646030 +0800*************** 我是分隔符*** 1,6 ****        以***开头表示file1文件，1,6表示1到6行! aaaa              !表示该行需要修改才与第二个文件匹配  111- hello world       -表示需要删除该行才与第二个文件匹配  222- 333                   -表示需要删除该行才与第二个文件匹配  bbb--- 1,7 ----        以---开头表示file2文件，1,7表示1到7行! aaa                   表示第一个文件需要修改才与第二个文件匹配! hello             表示第一个文件需要修改才与第二个文件匹配  111  222  bbb+ 333                   表示第一个文件需要加上该行才与第二个文件匹配+ world             表示第一个文件需要加上该行才与第二个文件匹配

3）合并格式显示

[root@MissHou ~]# diff -u file1 file2前两行主要列出需要比较的文件名和文件的时间戳；文件名前面的符号---表示file1，+++表示file2--- file1       2019-04-16 16:26:05.748650262 +0800+++ file2       2019-04-16 16:26:30.470646030 +0800@@ -1,6 +1,7 @@-aaaa+aaa+hello 111-hello world 222-333 bbb+333+world

默认情况下也会比较两个目录里相同文件的内容[root@MissHou  tmp]# diff dir1 dir2diff dir1/file1 dir2/file10a1> helloOnly in dir1: file3Only in dir2: test1如果只需要比较两个目录里文件的不同，不需要进一步比较文件内容，需要加-q选项[root@MissHou  tmp]# diff -q dir1 dir2Files dir1/file1 and dir2/file1 differOnly in dir1: file3Only in dir2: test1

其他小技巧：

有时候我们需要以一个文件为标准，去修改其他文件，并且修改的地方较多时，我们可以通过打补丁的方式完成。

1）先找出文件不同，然后输出到一个文件[root@MissHou ~]# diff -uN file1 file2 > file.patch-u:上下文模式-N:将不存在的文件当作空文件2）将不同内容打补丁到文件[root@MissHou ~]# patch file1 file.patchpatching file file13）测试验证[root@MissHou ~]# diff file1 file2[root@MissHou ~]#

7. paste工具

paste工具用于合并文件行

常用选项：-d：自定义间隔符，默认是tab-s：串行处理，非并行

##8. tr工具

tr用于字符转换，替换和删除；主要用于==删除文件中控制字符==或进行==字符转换==

语法和选项

语法：

用法1：命令的执行结果交给tr处理，其中string1用于查询，string2用于转换处理# commands|tr  'string1'  'string2'用法2：tr处理的内容来自文件，记住要使用"<"标准输入# tr  'string1'  'string2' < filename用法3：匹配string1进行相应操作，如删除操作# tr options 'string1' < filename

常用选项：

-d 删除字符串1中所有输入字符。-s 删除所有重复出现字符序列，只保留第一个；即将重复出现字符串压缩为一个字符串

常匹配字符串：

字符串	含义	备注
==a-z==或[:lower:]	匹配所有小写字母	[a-zA-Z0-9]
==A-Z==或[:upper:]	匹配所有大写字母
==0-9==或[:digit:]	匹配所有数字
[:alnum:]	匹配所有字母和数字
[:alpha:]	匹配所有字母
[:blank:]	所有水平空白
[:punct:]	匹配所有标点符号
[:space:]	所有水平或垂直的空格
[:cntrl:]	所有控制字符	\f Ctrl-L 走行换页 \n Ctrl-J 换行

\r Ctrl-M 回车
\t Ctrl-I tab键 |

举例说明：

[root@MissHou  shell01]# cat 3.txt  自己创建该文件用于测试ROOT:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologinlp:x:4:7:lp:/var/spool/lpd:/sbin/nologinsync:x:5:0:sync:/sbin:/bin/syncshutdown:x:6:0:shutdown:/sbin:/sbin/shutdownhalt:x:7:0:halt:/sbin:/sbin/haltmail:x:8:12:mail:/var/spool/mail:/sbin/nologinuucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologinboss02:x:516:511::/home/boss02:/bin/bashvip:x:517:517::/home/vip:/bin/bashstu1:x:518:518::/home/stu1:/bin/bashmailnull:x:47:47::/var/spool/mqueue:/sbin/nologinsmmsp:x:51:51::/var/spool/mqueue:/sbin/nologinaaaaaaaaaaaaaaaaaaaabbbbbb111111122222222222233333333cccccccchello world 888666777999# tr -d '[:/]' < 3.txt              删除文件中的:和/# cat 3.txt |tr -d '[:/]'           删除文件中的:和/# tr '[0-9]' '@' < 3.txt            将文件中的数字替换为@符号# tr '[a-z]' '[A-Z]' < 3.txt        将文件中的小写字母替换成大写字母# tr -s '[a-z]' < 3.txt             匹配小写字母并将重复的压缩为一个# tr -s '[a-z0-9]' < 3.txt      匹配小写字母和数字并将重复的压缩为一个# tr -d '[:digit:]' < 3.txt         删除文件中的数字# tr -d '[:blank:]' < 3.txt         删除水平空白# tr -d '[:space:]' < 3.txt         删除所有水平和垂直空白

小试牛刀

使用小工具分别截取当前主机IP；截取NETMASK；截取广播地址；截取MAC地址

# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,410.1.1.1:10.1.1.255:255.255.255.0# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '\n'10.1.1.110.1.1.255255.255.255.0# ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f400:0C:29:25:AE:54# ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f500:0C:29:B4:9E:4E# ifconfig eth2|grep Bcast|cut -d: -f2|cut -d' ' -f1# ifconfig eth2|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'# ifconfig eth2|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '\n'|grep -v ^$# ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '\n'|grep -v ^$# ifconfig eth2|grep HWaddr|cut -d ' ' -f11# ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5# ifconfig eth2|grep HWaddr|tr -s ' '|cut -d' ' -f5# ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '\n'|grep -v '^$'

将系统中所有普通用户的用户名、密码和默认shell保存到一个文件中，要求用户名密码和默认shell之间用tab键分割

# grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '\t' |tee abc.txt

以上就是shell脚本中文本处理工具的介绍和使用，工具的详细使用情况还得要大家自己使用过才能知道具体要领。如果想阅读更多相关内容的文章，欢迎关注行业资讯频道！

很赞哦！

文件工具字符关键关键字内容数字语法字母文件名用户排序处理不同大小开头两个字符串格式符号数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全 iapp 数据库助手代码媒体存储服务器软件开发企业怎么税收筹划数据库表属性行的关系知网统计年鉴数据库液相异地服务器异常河北交友软件开发价钱是多少软件开发和测试的流程南昌服务器散热片定制 xray服务器查询公司服务器一般配置在哪里济南手机软件开发定制费用深圳软件开发公司已倒闭开展国家网络安全教育为什么有些软件开发员要手机通威集团软件开发如何广州邦聚网络技术有限公司招聘设备点检软件开发计划表嘉兴软件开发驻厂需要多少钱四川日银互联网科技英语二网络安全专业考研我的世界服务器管理员的家我的世界服务器验证小学信息技术网络安全试讲赋码软件开发需要多长时间十堰市讯联网络技术服务 c文件读入测试数据库湖州银行软件开发考试题库浪潮服务器配置20万 web程序必须要服务器吗

千家信息网

千家信息网

shell脚本中文本处理工具的介绍和使用

1. grep工具

语法和选项

2. cut工具

语法和选项

3. sort工具

语法和选项

4.uniq工具

5.tee工具

6.diff工具

语法和选项

7. paste工具

语法和选项

小试牛刀

如何运用linux云服务器下的的/dev/shm/

Vi编辑器使用

相关文章