Cassandra CQL中的聚合查询

编程入门行业动态更新时间:2024-10-16 02:23:33

本文介绍了Cassandra CQL中的聚合查询的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！问题描述

我们目前正在评估Cassandra作为分析应用程序的数据存储。该计划是在Cassandra中转储原始数据，然后在其上主要运行聚合查询。看看CQL，它似乎不支持一些传统的SQL操作符，如：

典型的聚合函数，如平均，总和，
我没有找到任何可以帮助达到上述目的的操作在文档中。还检查是否有任何钩子提供诸如扩展的功能。比如在Mongodb中的数据库map-reduce中，或者在关系数据库中的用户定义函数。

人们谈论的是付费的Datastax企业版，这也不是通过纯Cassandra，而是通过Hadoop-Hive-Pig-Hadoop等独立组件实现的。或者有一些建议，因为Cassandra写入速度快，因此在将数据转储到数据库之前，需要进行所需的预聚合。

它看起来像是太多的开销，至少对于基本的东西需要。我缺少一些根本的东西吗？

非常感谢您的帮助。
解决方案
在cassandra中作为 CASSANDRA-4914 的一部分，该版本在2.2.0- rc1版本。

We are currently evaluating Cassandra as the data store for an analytical application. The plan was to dump raw data in Cassandra and then run mainly aggregation queries over it. Looking at CQL, it does not seem to support some traditional SQL operators like:

Typical aggregation functions like average, sum, count-Distinct etc.

Groupby-having operators

I did not find anything that can help achieve the above in the documentation. Also checked if there were any hooks for providing such functions as extensions. Say like in database map-reduce in Mongodb, or user-defined-functions in Relational DBs.

People do talk about the paid Datastax Enterprise Edition, and that too achieves this not via plain Cassandra, but through separate components like Hadoop-Hive-Pig-Hadoop etc. Or there are suggestions about doing needed pre-aggregations before dumping data to the DB since Cassandra writes are fast.

It looked like too much of overheads, at least for basic stuff we need. Am I missing something fundamental here?

Would highly appreciate help on this.
解决方案
Aggregation is available in cassandra as part of CASSANDRA-4914 which is available in the 2.2.0-rc1 release.

更多推荐

Cassandra CQL中的聚合查询

本文发布于:2023-11-21 23:50:06，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1615156.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

Cassandra CQL

上一篇： Win10电脑更新显示缺少重要的安全和质量修复怎么解决？

下一篇：聚合子查询的错误查询评估

发布评论取消回复

评论列表（有 0 条评论）

最近发表

荆门网站建设的重要性

win10蓝屏终止代码CRITICAL_PROCESS_DIED解决方法

您可以尝试添加 --skip-broken 选项来解决该问题您可以尝试执行：rpm -Va --nofiles --nodigest 解决方案

关于无线网络波动大的解决办法

Windows10 关于系统中断CPU占用过高导致电脑变卡的解决办法

VS 2019 点击页面自动定位到解决方案资源管理器目录位置

（亲测解决）VMware打开需要半天才进入、打开系统很慢、运行很慢解决办法

Typora官网下载的最新版本mac10.13以下版本用不了的解决办法

成功解决ModuleNotFoundError: No module named ‘torch._C‘

MySQL:由于找不到VCRUNTIME140_1.dll，无法继续执行代码。重新安装程序可能会解决此问题

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍！

热门文章

从源“http://localhost:5173”访问“...”处的 XMLHttpRequest 已被 CORS 策略阻止

币安API错误代码1102，未发送强制参数“时间戳”

如果我在bot telegram nodejs中使用editMessageMedia，我如何制作标题

在 Node.js 中从网络流创建 blob

使用 Node.js / ES6 如何设置 dotenv 文件的自定义路径？

使用 NODE.JS 和 html5 实现低延迟（50 毫秒）视频流

如何从nodejs连接laravel>laravel

使用nodejs观看目录

如果文件包含特定字符串，如何跳过 GitHub 工作流程步骤？

FirebaseError：无法从.env加载环境变量

标签列表

文件

如何在

Python

系统

java

方法

数据

错误

windows

函数

android

linux

教程

如何使用

代码

字符串

计算机

电脑

服务器

NET

应用程序

数组

PHP

MySQL

SQL

对象

项目

程序

数据库

word