深入理解Cassandra中用户指定的Compaction执行「建议收藏」

深入理解Cassandra中用户指定的Compaction执行「建议收藏」在本文中,我将向您介绍Apache Cassandra中的一个高级选项,称为用户自定义compaction。顾名思义,这是一个告诉Cassandra显式地为一个或多个表创建compaction任务,…

在本文中,我将向您介绍Apache Cassandra中的一个高级选项,称为用户自定义compaction。顾名思义,这是一个告诉Cassandra显式地为一个或多个表创建compaction任务,然后这个任务被移交给Cassandra运行时,像其他任何compaction一样执行。

这不是你每天都需要做的操作。但是,当您希望立即回收磁盘空间,而不希望等待正常compaction启动时,它非常有用。

除非您运行的是Cassandra 3.4版(请参阅CASSANDRA-10660),否则需要使用JMX来发布用户定义的Compact.如果您以前没有使用过jmx命令,那么一开始可能会觉得很难接受。如果您来自非java背景,那么它很可能是一个完全陌生的概念。别让那吓跑你!在本文结束时,您将能够使用名为jmxterm的实用程序执行用户定义的compact。

为了演示这个过程,我们将使用本地安装的Cassandra 3.0.9,它加载了movielens数据(请参阅Movielens项目),使用CDM实用程序并强制刷新到磁盘(要了解更多关于CDM的信息,请参阅此TLP博客文章):

cdm install movielens
nodetool flush

代码100分

需要调用nodetool flush以确保memtables已写入磁盘,如果我们不这样做,我们的数据将被放在内存中,Compaction是需要数据存在磁盘上。

我注意到movielens keyspace的用户目录中的数据文件:

代码100分jhaddad@rustyrazorblade ~/dev/cassandra$ find data/data/movielens/  -name "*Data.db"
data/data/movielens//movies-6728183094d311e68b105dbb96ed2de2/mc-1-big-Data.db
data/data/movielens//ratings_by_movie-6c2408d094d311e68b105dbb96ed2de2/mc-1-big-Data.db
data/data/movielens//ratings_by_user-69a85a7094d311e68b105dbb96ed2de2/mc-1-big-Data.db
data/data/movielens//users-68668ba094d311e68b105dbb96ed2de2/mc-1-big-Data.db

你可以在上面的输出中看到,我们有一个“users”目录,其中有一个数据文件mc-1-big-data.db。我们稍后需要完整的路径。

既然磁盘上有SSTables,那么让我们使用JMX来调用compact,因此我们首先需要获取jmxterm,这可能是整个过程中最棘手的部分,因为原始jmxterm页面上的下载链接已断开。从下载jmxterm的目录中使用以下命令启动它:

  java -jar jmxterm-1.0-alpha-4-uber.jar

要查看所有可用的命令,请使用help命令(输出被截断):

代码100分$>help
#following commands are available to use:
about    - Display about page
bean     - Display or set current selected MBean.
beans    - List available beans under a domain or all domains
...
open     - Open JMX session or display current connection
option   - Set options for command session
quit     - Terminate console and exit
run      - Invoke an MBean operation
set      - Set value of an MBean attribute

不过,我们要做的第一件事实际上是链接上Cassandra。标准的jmx端口是7199,你可以将其与主机一起传递给open命令:

$>open localhost:7199
#Connection to localhost:7199 is opened

在连接打开的情况下,我们可以在这里键入bean以获取可以访问的mbean列表。mbean只是通过jmx控制数据库的一种方式。我简化了输出,以便更容易找到我们要找的东西,CompactionManager:

$>beans -d org.apache.cassandra.db
#domain = org.apache.cassandra.db:
org.apache.cassandra.db:columnfamily=IndexInfo,keyspace=system,type=ColumnFamilies
org.apache.cassandra.db:columnfamily=aggregates,keyspace=system_schema,type=ColumnFamilies
...
org.apache.cassandra.db:type=CompactionManager
...

现在我们知道了mbean的名称,可以调用run命令,将mbean方法名forceuserdefinedcompaction和一个或多个文件路径作为参数传递:

$>run -b org.apache.cassandra.db:type=CompactionManager forceUserDefinedCompaction data/data/movielens//users-68668ba094d311e68b105dbb96ed2de2/mc-1-big-Data.db
#calling operation forceUserDefinedCompaction of mbean org.apache.cassandra.db:type=CompactionManager
#operation returns:
null

不幸的是,不是很令人高兴的输出。只有在查看目录后,我们才能看到文件号已从mc-1更改为mc-2:

jhaddad@rustyrazorblade ~/dev/cassandra$ ls data/data/movielens/users-68668ba094d311e68b105dbb96ed2de2/*Data.db
data/data/movielens/users-68668ba094d311e68b105dbb96ed2de2/mc-2-big-Data.db

Compact多个文件只是将它们传递给MBean,用逗号分隔。

此时,您应该熟悉使用jmxterm通过JMX启动用户定义的compact的过程我建议您在笔记本电脑上尝试一下,以适应这个过程,并探索其他可用的MBean。如果您更喜欢使用可视化工具而不是命令行工具,请查看jconsole,它随oracle jdk一起提供,但通常在生产中不太有用。

本文翻译自:https://thelastpickle.com/blog/2016/10/18/user-defined-compaction.html

入群邀约
为了营造一个开放的 Cassandra 技术交流环境,社区建立了微信群公众号和钉钉群,为广大用户提供专业的技术分享及问答,定期开展专家技术直播,欢迎大家加入。另外阿里云提供免费Cassandra试用:https://www.aliyun.com/product/cds

 

》》阿里云双11领亿元补贴,拼手气抽iPhone 11 Pro、卫衣等好礼,点此参与:http://t.cn/Ai1hLLJT

阅读原文
本文为云栖社区原创内容,未经允许不得转载。
 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/11153.html

(0)
上一篇 2022-12-15
下一篇 2022-12-15

相关推荐

  • Mysql–存储引擎[通俗易懂]

    Mysql–存储引擎[通俗易懂]一、存储引擎简介 1.文件系统: 1.1 操作系统组织和存取数据的一种机制。 1.2 文件系统是一种软件。 2.文件系统类型:ext2 3 4 ,xfs 数据 2.1 不管使用什么文件系统,数据内容…

    2023-02-22
    148
  • Python库安装指南

    Python库安装指南Python是一种高级编程语言,它广泛应用于数据分析、科学计算、Web开发和人工智能等领域。Python库是Python程序常用的一种扩展方式,它可以提供各种功能和工具,让开发者可以更加高效地完成任务。在本文中,我们将为您介绍Python库的安装和使用指南。

    2024-04-30
    89
  • 利用Python快速获取字符串的长度

    利用Python快速获取字符串的长度字符串长度指的是字符串中字符的数量,通常以Unicode字符为计量单位。在Python中,我们可以使用len()函数来获取一个字符串的长度。

    2024-01-15
    116
  • 围绕Python config的工程实践

    围绕Python config的工程实践Python config是指在Python开发过程中对配置文件进行管理,以便程序的配置参数更加灵活和易于修改。在复杂的工程中,往往需要 大量的配置参数,而这些参数的值往往具有临时性、不确定性,或者是需要根据启动环境的不同而变化。如果将这些参数耦合在代码里,则 会让代码变得难以维护,修改也非常麻烦,所以提供一个通用的配置框架,可以更好地促进开发的进行。

    2024-04-28
    80
  • hog梯度特征提取python(hog特征提取代码)

    hog梯度特征提取python(hog特征提取代码)本文适合刚入门物体检测的人群学习,不涉及公式推理。

    2023-12-03
    125
  • MongoDB复制集RS(ReplicationSet)「建议收藏」

    MongoDB复制集RS(ReplicationSet)「建议收藏」MongoDB复制集RS(ReplicationSet) 1.基本原理 基本构成是1主2从的结构,自带互相监控投票机制(Raft(MongoDB) Paxos(mysql MGR 用的是变种))如果…

    2023-03-30
    160
  • 在centos7.x环境中SQL Server附加数据库[亲测有效]

    在centos7.x环境中SQL Server附加数据库[亲测有效]第一步,准备好windows与Linux之间文件传递的工具,下载并安装 https://winscp.net/eng/download.php 第二步,把本地的数据库文件拷贝一份,放到别的文件夹中,因

    2023-01-31
    257
  • 快速处理大量数值数据:Python NumPy库的应用

    快速处理大量数值数据:Python NumPy库的应用在数据科学和分析领域,大量的数值计算是必不可少的。Python是一门功能丰富的编程语言,也是数据科学和分析领域最受欢迎的语言之一。Python由于其灵活性,便捷性和可扩展性而被广泛使用。Python的一个强大的库NumPy,允许Python用户从事高级数学,数值处理和线性代数操作,特别是对于处理大量数值数据,NumPy库有着举足轻重的作用。本文将介绍NumPy库的主要功能以及如何应用NumPy快速处理大量数值数据。

    2024-03-15
    81

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注