位置: 编程技术 - 正文

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

编辑:rootadmin

推荐整理分享awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:awk实现文件中45列交换,awk实现for循环按行遍历,awk实现for循环按行遍历,awk实现group by,awk实现for循环的写法,awk实现wc功能,awk实现for循环的写法,awk实现字符串拼接,内容如对您有帮助,希望把文章链接给更多的朋友!

最近看到论坛里面有几个不错的小例子,对于学习awk还是有帮助,在这儿详细的说一下

一、类似数据库中的left join查询

要求输出结果是,aaa,,,ddd,rts,

实现方法:

解释:当NR和FNR相同时,这就说明在对第一个文件进行操作,a[$1]=$2表示,建立一个数组,以第一个字段为下标,第二个字段为值。当NR!=FNR时,说明在对第二个文件进行操作,注意:这个时候的$1和前面的$1不是同一个东西了,前面的$1表示的是a.txt的第一个字段,而后面的$1表示的是b.txt的第一个字段。a[$1]表示以b.txt中第一个字段的为下标的值,如果a[$1]有值的话,说明也存在于a.txt文件中,这样就把数据print出来就行了。

实现方法2:

解释:-v OFS=","这个是设置输出时的列分割符,$1 in a这个是b.txt文件中的第一列的值是不是在数组a的key中,这个对做程序的来说很好理解,各种语言当中都有这样的用法,或者函数。例如,php中有in_array函数。比较一下,方法1和方法2中的print,方法1我加了双引号,方法2我却没有加,但是输出的效果却是一样的。

二、去除重复的值

如果有a,b和b,a这样的情况,就删除b,a,当然数字也一样;

awk实现Left、join查询、去除重复值以及局部变量讲解例子(awk实现wc功能)

实现方法1:

解释:for(i=1;i<=NF;i++)a[i]=$i;将每一列中的二个字段放到数组中,asort(a),这个数组进行排序,后面的代码是将数组数据输出来,通sort命令对输入的数据进行排序,相同数据会排在一起,通过uniq来进行去除相同的列。这种方法比较有通用性,不光适合二列,三列,四列都行。不过效率差了点。

实现方法2:

解释:方法2的二种写法,出来的结果是一样的,a[$0];没有赋值也没有报错,为什么呢?awk在遇到这样没有定义的变量时,会给它一个初值。if (!($2 OFS $1 in a))表示返转字段不在数组a中,这里所说的在,表示key是不是存在,不是值。print 不写默认是一行。

实现方法3:

解释:!a[$1_$2]++&&!a[$2_$1]++等于if(!a[$1_$2]++&&!a[$2_$1]++),对于首次出现的记录,a[$2_$1]的值是未定义的,由于后面的 ++ 是数学计算,所以a[$2_$1]会被赋值成数字0,也是由于 ++ 操作符,会先取值,再计算,从左到右 ++ 运算符的优先级大于!运算符的,所以对于第一行记录实际上是if(! 0) print $0 ! 是取反,0 是假,! 0 就是真,那么就会执行后面的 print $0对于后面出现的重复记录,a[$0] 经过 ++ 的计算已经变为 1、2、3 。。。而 ! 1 ! 2 ! 3 ... 都为假,不会打印。

三、awk的局部变量

这个例子来说明一下,awk怪异的局部变量

把都是数字的行,最大的那个数字加起来,第一行是2,第二行是3,每四行是3,第五行是4,总和是

在max方法里面,变量sum是会影响外面的,这里的sum是全局的。[root@krlcgcms mytest]# awk -f add.sh sumsum=

[root@krlcgcms mytest]# awk -f add.sh sumsum=

shell自定义函数的6个特点总结 最近系统的学习了一下shell的函数,总体感觉根其他语言的函数差不多,不过它也有自身的特点一,调用函数必须在定义函数的后,不然会报错的funfun(){

shell备份文件、重命名文件、删除指定文件的3个脚本分享 因为经常会用到shell脚本,所以经常会写一些,但是我从来没有系统的学习过shell脚本,遇到问题,就去看手册,或者google一下,到了一定的程度才发现

总结的7个shell字符串操作方法和实例分享 每一种语言都有他独自的字符串操作方法,shell也一样,下面以以例子的方式,简单介绍常用方法。1,取得字符串长度string=abc//等号二边不要有空

标签: awk实现wc功能

本文链接地址:https://www.jiuchutong.com/biancheng/371588.html 转载请保留说明!

上一篇:shell中的循环语句、判断语句实例(shell中的循环语句有哪些)

下一篇:shell自定义函数的6个特点总结(shell自定义命令)

  • 一人在两家公司上班怎么缴纳个税
  • 证书挂靠要申报个人所得税年度汇算吗
  • 小规模纳税人有增值税吗
  • 租赁合同管理台账范本
  • 业务招待费进项
  • 金蝶k3费用发票怎么做
  • 残保金退回属于什么业务
  • 月收入不足10万免增值税的账务处理
  • 政策性搬迁损失赔偿标准
  • 现金比率一般多少
  • 用友如何取消月末结转
  • 企业赔款可以抵税吗
  • 关联企业间无偿资金的占用属于借款费用吗
  • 物业管理提供的服务变化
  • 住宿费增值税怎么算
  • 房地产企业按照功能可分为
  • 利息支出手续费
  • 借库存商品贷生产成本这笔会计分录反映的经济业务是
  • 房产企业可计入开发成本的利息如何确定?
  • 2018年年终奖个税计算方法
  • 专票小数点后两位没有显示出来可以认证吗
  • 回迁安置房拆一次多少钱
  • 贴息收据税前扣除是什么
  • vpn加速有什么用呢?
  • windows无法访问共享文件夹
  • 产品 研发
  • 小规模固定资产会计科目
  • 印花税计税依据及计算方式
  • 巴蒂斯塔卡里
  • 如何在旧的php系统中删除
  • ubuntu 安装vs code
  • 房屋租赁费如何结转成本
  • GrooveMonitor.exe是什么进程?GrooveMonitor.exe可以禁用卸载吗?
  • 售后回购不符合法律规定
  • 增值税按简易计价方式
  • wordpress自定义函数
  • 闲置房的相关政策
  • 彩石湖公园门票
  • 今天中秋节
  • 坏账准备属于哪一类账户
  • php parse_str() 函数的定义和用法
  • php ajax请求
  • php文档系统
  • 公司少申报个税
  • mysql命令大全手册
  • 核定征收和查账征收可以自己选择吗
  • 解决企业应收账款问题
  • 盈余公积多计提对报表的影响
  • 股权过户费用
  • 财报实收资本
  • 营改增之后账务怎么处理
  • 营业外支出可以抵扣进项税吗
  • 融资租入固定资产计提折旧吗
  • 进项税额转出忘记结转
  • 付外汇代缴税费
  • 集团管理费收入是否纳税
  • 财产清查存在的问题及原因分析
  • 新建企业应如何建账
  • 非营利医疗机构由谁批准
  • 记账凭证种类介绍
  • sqlserver表死锁
  • mysql 5.7.33安装
  • linux系统基本指令
  • windows快速预览
  • win 驱动
  • linux查看文件夹大小
  • win80x0000007b修复
  • win8软件不兼容怎么办
  • 如何检测电脑能否上网
  • linux硬盘找不到
  • shell脚本连接服务器
  • nodejs后端教程
  • unity android build support
  • Python类的继承动物类
  • 如何保养铜香炉
  • python搭建虚拟环境torch
  • 在linux安装python
  • 电子税务局怎么添加银行账户信息
  • 水产品 免税
  • 为什么我电脑登微信显示二维码失效
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设