时间:2021-07-01 10:21:17 帮助过:4人阅读
使用STATISTICS的方法也很简单。
它的头文件位于:
include/rocksdb/statistics.h
monitoring/statistics.h
使用方法:
Options options;
options.statistics = rocksdb::CreateDBStatistics();
可选统计级别:
数据统计类型分成两种:
统计函数的接口:
获取结果的接口:
RocksDB实现了StatisticsImpl类,继承了Statistics的接口。
主要接口:
成员变量:
这里的TickerInfo和HistogramInfo类型的数据结构是相似的:一个线程局部的counter或者time;加上一个非线程局部的统计值用来累加counter或者time。
TickerInfo类型包含两个参数:
ThreadLocalPtr类型(真实类型ThreadTickerInfo)的thread_value,包含:
ThreadLocalPtr类型(真实类型ThreadHistogramInfo)的thread_value,包含:
事实上,STATISTICS相关实现是比较巧妙的,也是使用STATISTICS仅增加5%-10%的关键。为了避免线程间共享数据导致CPU的cache频繁失效,merged_sum和merged_hist初始化时都是空的,而且当且仅当线程退出时,才调用mergeThreadValue函数将TickerInfo和HistogreamInfo中的线程局部变量累加到merged_sum和merged_hist。
MyRocks使用了RocksDB提供的接口进行数据统计。通过声明了变量rocksdb_stats,并且随着RocksDB引擎启动时通过rocksdb_init_func函数进行初始化。
rocksdb_stats = rocksdb::CreateDBStatistics();
rocksdb_db_options->statistics = rocksdb_stats;
除了使用所有RocksDB引擎层的统计,MyRocks还通过定义了
commit_latency_stats = new rocksdb::HistogramImpl();
在rocksdb_commit_by_xid和rocksdb_commit两个函数中通过计时的方式,统计了每一次commit所花费的时间。
rocksdb::StopWatchNano timer(rocksdb::Env::Default(), true); ... commit_latency_stats->Add(timer.ElapsedNanos() / 1000);
在rocksdb_show_status函数中,输出Statistics统计的过程如下:
通过调用SHOW ENGINE ROCKSDB STATUS可以得到与BG_THREADS相关结果,它的输出结果类似于:
Type: BG_THREADS Name: 140173379593984 Status: thread_type: Low Pri## cf_name: default operation_type: Compaction operation_stage: CompactionJob::ProcessKeyValueCompaction elapsed_time_ms: 6172.244 ms BaseInputLevel: 0 BytesRead: 992806363 BytesWritten: 992071408 IsDeletion: 0 IsManual: 0 IsTrivialMove: 0 JobID: 1936 OutputLevel: 5 TotalInputBytes: 1586832446 state_type:
可以看到较多的信息量:这个线程正在进行Compaction,处于CompactionJob::ProcessKeyValueCompaction阶段,已经耗时6172.244 ms,读取的字节数为992806363,写出的字节数为992071408。然而并不包括可能感兴趣的正在进行Compaction的源文件和目标文件等信息。正如文章开头提到的,了解实现原理能够使我们更好地进行扩展。
MyRocks中的SHOW ENGINE ROCKSDB STATUS指令展示BG_THREAD的机制使用了RocksDB中关于thread status的接口。
它的头文件位于:
include/rocksdb/env.h include/rocksdb/thread_status.h util/thread_operation.h monitoring/thread_status_updater.h monitoring/thread_status_util.h
关键类:
ThreadStatusUpdater:存储了各自后台线程的状态和所有后台线程状态的指针。 ThreadStatusUtil:该类只有静态变量和静态方法,推荐通过该类的方法去更新ThreadStatusUpdater中的状态。
使用方法:
通过调用env的GetThreadList()函数可以获得当前后台线程的状态,状态的状态值存放于一个vector中。将其中的内容展现出来,类似于下图:
从代码中可以看到,实现thread status的目的展示flush和compaction的运行状态。当然,我们也可以将用户线程的状态存储到thread status,通过调用SHOW ENGINE ROCKSDB STATUS指令展示。
特别地,可以看到compaction特有的状态值有:
enum CompactionPropertyType : int { COMPACTION_JOB_ID = 0, COMPACTION_INPUT_OUTPUT_LEVEL, COMPACTION_PROP_FLAGS, COMPACTION_TOTAL_INPUT_BYTES, COMPACTION_BYTES_READ, COMPACTION_BYTES_WRITTEN, NUM_COMPACTION_PROPERTIES };
flush特有的状态值有:
enum FlushPropertyType : int { FLUSH_JOB_ID = 0, FLUSH_BYTES_MEMTABLES, FLUSH_BYTES_WRITTEN, NUM_FLUSH_PROPERTIES };
在RocksDB的线程池实现中,每一个启动的后台线程都会通过调用ThreadStatusUtil::RegisterThread加入被观测的后台线程的集合中。
ThreadPoolImpl::Impl::StartBGThreads-->BGThreadWrapper-->ThreadStatusUtil::RegisterThread
在rocksdb_show_status函数中,输出BG_THREAD的过程如下:
本文章介绍了SHOW ENGINE ROCKSDB STATUS指令中关于STATISTICS与BG_THREAD的相关内容。
MySQL 内核深度优化
【腾讯云CDB】深入解析MySQL binlog
【腾讯云CDB】源码分析 · MySQL binlog组提交和Multi-Threaded-Slave
此文已由作者授权腾讯云技术社区发布,转载请注明文章出处;
腾讯工程师教你玩转 RocksDB
标签:介绍 分享 return 它的 def mic ade 分享图片 process