Total Pageviews

Sunday, 28 July 2024

Linux上,统计某个字符串的个数

在 Linux 系统下,有时候,我们可能要对一个日志文件进行分析。比如,分析日志文件中某个单词或者某个特殊字符串出现了多少次。

对于匹配统计,一般用到正则方法,下面总结了几个统计字符串个数的方法。

方法一:使用 grep 命令

1
grep -o '字符串' file |wc -l

方法二:使用awk命令进行统计

1
awk -v RS="@#$j" '{print gsub(/字符串/,"&")}' file

方法三:另一种使用awk命令进行统计的方法

1
awk  '{s+=gsub(/字符串/,"&")}END{print s}' file

备注:上面的 file 是要统计的文件名。上面的字符串换成你具体要统计的内容。

awk简介

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。

简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

关于 awk 命令可以参考:http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.html

实例

假设现在一个文件里面的内容如下:

1
2
3
4
5
6
[root@ihh logs]# cat test.txt 
userid:121212
userid:232323
userid:3434
username:3434
username:4343

然后我要统计 userid 在 test.txt 文件里出现了多少次,那么根据上面提供的命令,可以这样操作:

1
2
3
4
5
6
7
8
[root@ihh logs]# grep -o 'userid' test.txt |wc -l
3
 
[root@ihh logs]# awk -v RS="@#$j" '{print gsub(/userid/,"&")}' test.txt 
3
 
[root@ihh logs]# awk  '{s+=gsub(/userid/,"&")}END{print s}' test.txt 
3

No comments:

Post a Comment