Total Pageviews

Tuesday, 12 February 2013

AWStats 其实可以统计任意格式的日志

一款如此流行的统计软件怎么会只支持单一的日志格式呢。于是偶继续找,最后果然发现,其实AWStats是支持自定义日志格式的,官方手册上都写有了,配置文件里面也以注释形式指出了如何使用自定义格式。
配置文件中有一个配置字段:LogFormat。如果该字段值设为1,则使用Apache的combined格式的日志。值为2的话则使用IIS的指定格式的日志。
实 际上,配置文件里面也说得很清楚,可以通过设置LogFormat字段来指定自定义的日志格式。只要把LogFormat设置为一个字符串就可以了,这个 字符串就是自定义的日志格式,定义格式和Apache的差不多,不过字段名字不同。至于每个字段是什么名字,配置文件中都写得很清楚,看看配置文件就知道 了。
似乎英语苦手的人不少,偶顺便翻译一下配置文件里面的字段名字的说明吧:

# %host 客户端主机名或 IP 地址(如果是邮件日志,则为发送者的主机名或 IP 地址)
# %host_r 接收者的主机名或 IP 地址(仅对邮件日志有效)
# %lognamequot 带引号的登录认证用户名,如 “john”
# %logname 不带引号的登录认证用户名,如 john
# %time1 [dd/mon/yyyy:hh:mm:ss +0000] 或 [dd/mon/yyyy:hh:mm:ss] 这种格式的日期
# %time2 yyyy-mm-dd hh:mm:ss 这种格式的日期
# %time3 Mon dd hh:mm:ss 或 Mon dd hh:mm:ss yyyy 这种格式的日期
# %time4 Unix 时间戳时间格式
# %methodurl “GET /index.html HTTP/x.x” 这种格式的 HTTP 请求方法和地址
# %methodurlnoprot “GET /index.html” 这种格式的 HTTP 请求方法和格式
# %method HTTP 请求方法,如 GET
# %url 请求的URL,如:/index.html
# %query 查询字串(Query string)
# %code 返回的状态码
# %bytesd 请求的文档大小,单位:字节
# %refererquot 带引号的引用页,如 “http://from.com/from.htm”
# %referer 不带引号的引用页,如 http://from.com/from.htm
# %uabracket 以方括号表示的用户代理(User Agent),如 [Mozilla/4.0 (compatible, …)]
# %uaquot 带引号的用户代理(User Agent),如 “Mozilla/4.0 (compatible, …)”
# %ua 不带引号的用户代理(User Agent),如 Mozilla/4.0_(compatible…)
# %gzipin 使用 mod_gzip 进行压缩前文档的大小,单位:字节
# %gzipout 使用 mod_gzip 进行压缩后的文档大小和压缩率,单位:字节
# %gzipratio 使用 mod_gzip 进行压缩的压缩率
# %deflateratio 使用 mod_deflate 进行压缩的压缩率,格式: (ZZ)
# %email 电子邮件发送者 (仅对邮件日志有效)
# %email_r 电子邮件接收者 (仅对邮件日志有效)
# %virtualname 网页服务器的虚拟主机名。当一个日志中有多个虚拟主机的访问记录时,应该使用该字段。AWStats 将忽略主机名不在 SiteDomain 和 HostAliases 字段中的记录。
# %cluster 如果日志文件存在于多台服务器上(使用 logresolvemerge.pl 脚本进行了合并),请使用该字段来定义群集编号(cluster id)值。
# %extraX 如果你需要使用在 ExtraSection 中定义了的特性来生成个性化的访问统计报告,则应该配合使用该字段,详情请参考后面的说明。
#
# 如果你的日志中还有其他的字段,请使用下面的字段定义名字来忽略它们
# %other AWStats 不需要使用的字段,不带引号.