看得透又看得远者prevail. ppt.cc/flUmLx ppt.cc/fqtgqx ppt.cc/fZsXUx ppt.cc/fhWnZx ppt.cc/fnrkVx ppt.cc/f2CBVx: grep提供了一个参数来设置它的输出流缓冲模式

有时候我们需要在 shell 中执行类似 some-cmd | grep keyword | tee filtered.log 的命令，如果管道的起始命令输出的东西不够多，那么 grep 会攒够一定长度的输出才进行 flush 操作。这个行为会导致若提前使用 ^C 来结束管道，则会丢失很大一部分本应过滤出来的内容。

一个麻烦但是可行的解决方法是只结束管道的起点进程，如找到上述的 some-cmd 进程的 pid 并用 kill 发送 TERM 或其他信号使之退出，这样后面的 grep 在检测到输入流被关闭后会进行 flush 操作，将缓冲区的数据刷新到标准输出。

实际上 grep 提供了一个参数来设置它的输出流缓冲模式，即 --line-buffered ，该选项会将输出流设置成行缓冲，这在我们处理日志时十分有用，因为管道的源头一般是按行为单位产生日志的，这样如果 grep 也是行缓冲则在使用 ^C 结束整个管道时也并不会丢失内容。这样上述的命令就变成了这样：

some-cmd | grep --line-buffered | tee filtered.log

需要注意的是，如果管道中有多个 grep 命令，那么它们都需要设置该参数来确保每一行都会被 flush 到输出流；可以设置一个 shell alias 来简化该操作。这种方法的缺点是降低了 grep 的吞吐量，不过在大部分的调试场景应该是够用的了。

看得透又看得远者prevail. ppt.cc/flUmLx ppt.cc/fqtgqx ppt.cc/fZsXUx ppt.cc/fhWnZx ppt.cc/fnrkVx ppt.cc/f2CBVx

Pages

Monday, 26 August 2024

grep提供了一个参数来设置它的输出流缓冲模式

No comments:

Post a Comment