位置: 编程技术 - 正文

MongoDB中强大的统计框架Aggregation使用实例解析(mongodb用法)

编辑:rootadmin

推荐整理分享MongoDB中强大的统计框架Aggregation使用实例解析(mongodb用法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mongodb使用案例,mongodb operator,mongodb lsm,mongodb的语句,mongodb用法,mongodb用法,mongodb用法,mongodb $nin,内容如对您有帮助,希望把文章链接给更多的朋友!

听说项目里面Aggregation用的多,那就专门针对这个多多练习一下。

基本的操作包括:

&#;$project - 可以从子文档中提取字段,可以重命名字段

&#;$match - 可以实现查找的功能

&#;$limit - 接受一个数字n,返回结果集中的前n个文档。

&#;$skip - 接受一个数字n,丢弃结果集中的前n个文档。效率比较低,依然会遍历前n个文档。

&#;$unwind - 可以将一个包含数组的文档切分成多个, 比如你的文档有 中有个数组字段 A, A中有个元素, 那么经过 $unwind处理后会产生个文档,这些文档只有 字段 A不同

&#;$group - 统计操作, 还提供了一系列子命令

?$avg, $sum …

&#;$sort - 排序

Python篇实验一、学生数据统计1、生成学生数据:

好了,现在数据库里面有条学生数据了。

现在我要得到广东学生的平均年龄,在mongo控制台输入:

如果想到得到所有省份的平均年龄,那就更加简单了:

如果想得到广东省所有科目的平均成绩:

加上排序:

实验二、寻找发帖水王有一个保存着杂志文章的集合,你可能希望找出发表文章最多的那个作者。假设每篇文章被保存为MongoDB中的一个文档。

1、插入数据

现在我们拥有了条文章数据了。

2、用$project将author字段投射出来

这个语法与查询中的字段选择器比较像:可以通过指定"fieldname" : 1选择需要投射的字段,或者通过指定"fieldname":0排除不需要的字段。

执行完这个"$project"操作之后,结果集中的每个文档都会以{"_id" : id, "author" : "authorName"}这样的形式表示。这些结果只会在内存中存在,不会被写入磁盘。

3、用group将作者名称分组

这样就会将作者按照名字排序,某个作者的名字每出现一次,就会对这个作者的"count"加1。

这里首先指定了需要进行分组的字段"author"。这是由"_id" : "$author"指定的。可以将这个操作想象为:这个操作执行完后,每个作者只对应一个结果文档,所以"author"就成了文档的唯一标识符("_id")。

第二个字段的意思是为分组内每个文档的"count"字段加1。注意,新加入的文档中并不会有"count"字段;这"$group"创建的一个新字段。

执行完这一步之后,结果集中的每个文档会是这样的结构:{"_id" : "authorName", "count" : articleCount}。

4、用sort排序

这个操作会对结果集中的文档根据"count"字段进行降序排列。

5、限制结果为前5个文档

MongoDB中强大的统计框架Aggregation使用实例解析(mongodb用法)

这个操作将最终的返回结果限制为当前结果中的前5个文档。在MongoDB中实际运行时,要将这些操作分别传给aggregate()函数:

aggregate()会返回一个文档数组,其中的内容是发表文章最多的5个作者。

Java篇

我在db中造了些数据(数据时随机生成的, 能用即可),没有建索引,文档结构如下:

Document结构:

接下来要实现两个功能:

统计上海学生平均年龄 统计每个省各科平均成绩

接下来一一道来

统计上海学生平均年龄

从这个需求来讲,要实现功能要有几个步骤: 1. 找出上海的学生. 2. 统计平均年龄 (当然也可以先算出所有省份的平均值再找出上海的)。如此思路也就清晰了

首先上 $match, 取出上海学生

接下来 用 $group 统计平均年龄

$avg 是 $group的子命令,用于求平均值,类似的还有 $sum, $max ....上面两个命令等价于

下面是Java代码

输出结果:

如此工程就结束了,再看另外一个需求

统计每个省各科平均成绩

首先更具数据库文档结构,subjects是数组形式,需要先‘劈'开,然后再进行统计

主要处理步骤如下:

1. 先用$unwind 拆数组 2. 按照 province, subject 分租并求各科目平均分

$unwind 拆数组

按照 province, subject 分组,并求平均分

java代码如下:

输出结果

统计就此结束.... 稍等,似乎有点太粗糙了,虽然统计出来的,但是根本没法看,同一个省份的科目都不在一起。??/p>

接下来进行下加强,

支线任务: 将同一省份的科目成绩统计到一起( 即,期望 'province':'xxxxx', avgscores:[ {'xxx':xxx}, ....] 这样的形式)

要做的有一件事,在前面的统计结果的基础上,先用 $project 将平均分和成绩揉到一起,即形如下面的样子

再按省份group,将各科目的平均分push到一块,命令如下:

$project 重构group结果

$使用 group 再次分组

java 代码如下:

结果如下:

MongoDB最基本命令速查笔记 安装后在控制台输入:mongo启动客户端。showdbs显示所有数据库。usexxx选中数据库为当前使用的数据库。showcollections显示当前数据库的所有集合。db.colleciton

Ubuntu系统中安装MongoDB及其启动命令mongod的教程 UBuntu上安装MongoDBserver获取最新版本

Mongodb 删除添加分片与非分片表维护 MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系

标签: mongodb用法

本文链接地址:https://www.jiuchutong.com/biancheng/312097.html 转载请保留说明!

上一篇:详解MongoDB管理命令(mongodb管理工具)

下一篇:MongoDB最基本命令速查笔记(mongodb基础命令)

  • 社保由税务局统一征收的地区
  • 减少实收资本需要缴纳什么税
  • 现金流量表现金流量项目明细分类
  • 转让金融资产需要交税吗
  • 如何查询外经证缴了多少税
  • 金蝶利润表没有数据怎么办
  • 资产减值损失包括应收账款减值损失吗
  • 直接计入当期损益的利得和损失,是指( )的利得或损失
  • 小规模纳税人不允许开具零税率发票
  • 合伙企业发生亏损的原因
  • 商业银行的下列哪些行为违反了法律规定?给存款大户
  • 房租怎么抵扣个税计算方法
  • 产品缺陷处理流程
  • 企业股权转让收入申报表填哪里
  • 开具正数发票中如何体现扣款
  • 营改增后补缴营业税
  • 物业公司代收水费合理吗
  • 资源税征收管理纳税期限
  • 税友服务费能否抵扣
  • 罚没支出包括税收滞纳金吗
  • 递延所得税资产是什么
  • 个人网银测试要点
  • 税收滞纳金可以税前扣除吗
  • 烟酒专用发票能抵税吗
  • 加计扣除税怎么出分录
  • win7如何设置高级网卡功能适合玩网络游戏
  • 汇算清缴工资薪金支出包含社保费吗
  • win10更新21h1后很卡
  • 汽车维修的发票的购买方
  • 跟银行借入长期存款
  • 扩展组件可以删除吗
  • 增值税三流合一涉及子公司
  • 特兰西瓦尼亚的统一
  • js身份证正则验证
  • win11升级正式版
  • 施工企业如何开发票
  • js实现dialog
  • opencv开发项目
  • vue2.
  • 轻量级网络设计
  • 什么是多模态研究
  • 简单的画
  • 存放中央银行款项借方表示什么意思
  • GCC strict aliasing – 嫉妒就是承认自己不如别人
  • 《visual c++游戏编程基础》
  • 公允价值变动损益
  • 食堂增值服务有哪些
  • 增值税发票超过3个月可以作废吗
  • 小规模季度必须报税吗
  • 其他债权投资是长期投资吗
  • sql server数据迁移部分数据
  • 印花税减免计入什么科目
  • 应缴财政专户款年末有余额吗
  • 暂估成本发票最晚什么时候补齐
  • 收到境外支付的咨询费免税吗
  • 长期待摊销费用属于
  • 专款支出和事业支出
  • 保安公司购买的保险
  • 单位社保缴费收费标准
  • 建筑行业总产值占我国GDP的比重
  • 开票信息中电话怎么填
  • 废品损失如何处理
  • linux开机启动过程图解
  • win2016 ntp
  • 传统与现代的结合英文
  • xp系统无法停用wifi连接
  • mac如何自行检测硬盘信息
  • kdeskcore.exe是什么
  • win10 Mobile 10586.36预览版更新了哪些内容?
  • win7系统出现问题怎么修复
  • windows8输入法
  • linux跨服务器调用shell脚本
  • jquery获取复选框是否被选中
  • html截取字符串
  • opengl extension
  • android:gravity和android:layout_gravity的区别
  • 不需要背景
  • python 编程技巧
  • jquery显示div
  • 南京地税局上班时间
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设