彩票走势图

Linux命令行如何“四两拨千斤”

原创|使用教程|编辑:龚雪|2015-01-05 09:36:32.000|阅读 198 次

概述:这里说的“Linux命令行”是指那些简单的一句命令就能完成其它高级语言一大片代码才能完成的工作。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

一、通过sort/uniq获取文件内容的交集、合集和不同之处:

假设有a、b两个文本文件,文件本身已经去除了重复内容。下面是效率最高的方法,可以处理任何体积的文件,甚至几个G的文件。(Sort对内存没有要求,但也许你需要用 -T 参数。)可以试着比较一下,你可以看看如果用Java来处理磁盘上文件的合并,需要用多少行代码。

   cat a b | sort | uniq > c   # c 是a和b的合集

   cat a b | sort | uniq -d > c   # c 是a和b的交集

   cat a b b | sort | uniq -u > c   # c 是a和b的不同

二、汇总一个文本内容里第三列数字的和(这个方法要比用Python来做快3倍并只需1/3的代码量):

   awk ‘{ x += $3 } END { print x }’ myfile

三、如果你想查看一个目录树里的文件的体积和修改日期,用下面的方法,相当于你挨个目录做”ls -l”,而且输出的形式比你用”ls -lR”更可读:

   find . -type f -ls

四、使用xargs命令。这个命令非常的强大。注意每行上你可以控制多少个东西的执行。如果你不确定它是正确的执行,先使用xargs echo。同样,-I{} 也非常有用。例子:

   find . -name \*.py | xargs grep some_function

   cat hosts | xargs -I{} ssh root@{} hostname

五、假设你有一个文本文件,比如一个web服务器日志,在某些行上有一些值,比如URL中的acct_id参数。如果你想统计每个acct_id的所有请求记录:

   cat access.log | egrep -o ‘acct_id=[0-9]+’ | cut -d= -f2 | sort | uniq -c | sort -rn

From ChinaUnix

狂欢继续!【年终大促 巅峰盛"慧" 】促销火热进行中 iPhone 6 Plus、 iPhone 6、iPad Air满就送,还不赶快买买买!


标签:Unix/Linux

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP