osd 监控埋点指标

文章目录

1. WBThrottle

监控类型 监控项 说明
perf dump WBThrottle bytes_dirtied 脏数据大小
bytes_wb 写入数据大小
ios_dirtied 脏数据操作
ios_wb 写操作
inodes_dirtied 等待写入的条目
inodes_wb 写记录

2. filestore

监控类型 监控项 说明
perf dump filestore journal_queue_max_ops 日志队列中的最大操作
journal_queue_ops 日志队列中的操作大小
journal_ops 日志请求数
journal_bytes 日志大小
journal_latency.avgcount 日志等待队列平均大小
journal_latency.sum 日志等待队列总大小
journal_latency.avgtime 日志等待队列平均时间
journal_wr 日志读写 io
journal_wr_bytes.avgcount 日志读写大小的队列平均数量
journal_wr_bytes.sum 日志读写大小的队列总数
journal_full 日志写满
committing 正在提交数量
commitcycle_interval.avgcount 提交之间的间隔队列平均数量
commitcycle_interval.sum 提交之间的间隔队列总数
commitcycle_interval.avgtime 提交之间的间隔队列平均时间
commitcycle_latency.avgcount 提交延迟队列平均数量
commitcycle_latency.sum 提交延迟队列总数
commitcycle_latency.avgtime 提交延迟队列平均时间
op_queue_max_ops 队列中最大的操作数
op_queue_max_ops 队列队中的操作数
ops 操作数
op_queue_max_bytes 操作队列最大 bytes 数
op_queue_bytes 操作队列 bytes 数
bytes 写入存储的数据
apply_latency.avgcount 申请延迟队列平均数
apply_latency.sum 申请延迟队列总数
apply_latency.avgtime 申请延迟队列平均时间
queue_transaction_latency_avg.avgcount 存储操作等待队列平均数
queue_transaction_latency_avg.sum 存储操作等待队列总数
queue_transaction_latency_avg.avgtime 存储操作等待队列平均数

3. leveldb

监控类型 监控项 说明
perf dump leveldb leveldb_get 获取的数量
leveldb_get_latency.avgcount 获取延迟队列里面的平均数量
leveldb_get_latency.sum 获取延迟队列里面的总数
leveldb_submit_latency.avgcount 提交延迟队列里面的平均数量
leveldb_submit_latency.sum 提交延迟队列里面的总数
leveldb_submit_sync_latency.avgcount 提交同步延迟队列里面的平均数量
leveldb_submit_sync_latency.sum 提交同步延迟队列里面的总数
leveldb_compact 压缩
leveldb_compact_range 压缩范围
leveldb_compact_queue_merge 压缩合并队列
leveldb_compact_queue_len 压缩队列长度

4. objecter

监控类型 监控项 说明
perf dump objecter op_active 主动操作数
op_laggy 消极操作数
op_send 发送操作数
op_send_bytes 发送操作 bytes
op_resend 重操作数
op_reply 回复操作数
op 操作数
op_r 读操作数
op_w 写操作数
op_rmw 读写修改操作数
op_pg PG 操作数
osdop_stat 操作状态
osdop_create 创建对象操作
osdop_read 读操作
osdop_write 写操作
osdop_writefull 写满对象操作
osdop_writesame 写相同的对象操作
osdop_append 追加操作
osdop_zero 设置对象 0 操作
osdop_truncate 截断对象操作
osdop_delete 删除对象操作
osdop_mapext 映射范围操作
osdop_sparse_read 稀少读操作
osdop_clonerange 克隆范围操作
osdop_getxattr 获取 xattr 操作
osdop_setxattr 设置 xattr 操作
osdop_cmpxattr 比较 xattr 操作
osdop_rmxattr 移除 xattr 操作
osdop_resetxattrs 重置 xattr 操作
osdop_tmap_up tmap 更新操作
osdop_tmap_put tmap 推送操作
osdop_tmap_get tmap 获取操作
osdop_call 调用执行操作
osdop_watch 监控对象操作
osdop_notify 对象操作通知
osdop_src_cmpxattr 多个操作扩展属性
osdop_pgls pg 对象操作
osdop_pgls_filter pg 过滤对象操作
osdop_other 其他操作
linger_active 主动延迟操作
linger_send 延迟发送操作
linger_resend 延迟重新发送
linger_ping 延迟 ping 操作
poolop_active 主动池操作
poolop_send 发送池操作
poolop_resend 重新发送池操作
poolstat_active 主动获取池子统计操作
poolstat_send 发送池子统计操作
poolstat_resend 重新发送池子统计操作
statfs_active fs 状态操作
statfs_send 发送 fs 状态
statfs_resend 重新发送 fs 状态
command_active 活动的命令
command_send 发送指令
command_resend 重新发送指令
map_epoch OSD map epoch
map_full 接收满的 OSD map
map_inc 接收到增量 OSD map
osd_sessions osd 会话
osd_session_open 打开 osd 会话
osd_session_close 关闭 osd 会话
osd_laggy 缓慢的 osd 会话
omap_wr osd map 读写操作
omap_rd osd map 读操作
omap_del osd map 删除操作

5. osd

监控类型 监控项 说明
perf dump osd ceph.osd.op_wip 当前正在处理的复制操作(主节点)
ceph.osd.op 操作数
ceph.osd.op_in_bytes 客户端操作总写入大小
ceph.osd.op_out_bytes 客户端操作总读取大小
ceph.osd.op_latency.avgcount 客户端操作的延迟(包括队列时间)的平均数
ceph.osd.op_latency.sum 客户端操作的延迟(包括队列时间)总数
ceph.osd.op_latency.avgtime 客户端操作的延迟(包括队列时间)平均时间
ceph.osd.op_process_latency.avgcount 客户端操作的延迟(不包括排队时间)的平均数
ceph.osd.op_process_latency.sum 客户端操作的延迟(不包括排队时间)总数
ceph.osd.op_process_latency.avgtime 客户端操作的延迟(不包括排队时间)平均时间
ceph.osd.op_prepare_latency.avgcount 客户端操作的延迟(不包括排队时间和等待完成)平均数
ceph.osd.op_prepare_latency.sum 客户端操作的延迟(不包括排队时间和等待完成)总数
ceph.osd.op_prepare_latency.avgtime 客户端操作的延迟(不包括排队时间和等待完成)平均时间
ceph.osd.op_r 客户端读取操作
ceph.osd.op_r_out_bytes 客户端数据读取
ceph.osd.op_r_latency.avgcount 读取操作的延迟(包括队列时间)平均数
ceph.osd.op_r_latency.sum 读取操作的延迟(包括队列时间)总数
ceph.osd.op_r_latency.avgtime 读取操作的延迟(包括队列时间)平均时间
ceph.osd.op_r_process_latency.avgcount 读取操作的延迟(不包括排队时间)平均数
ceph.osd.op_r_process_latency.sum 读取操作的延迟(不包括排队时间)总数
ceph.osd.op_r_process_latency.avgtime 读取操作的延迟(不包括排队时间)平均时间
ceph.osd.op_r_prepare_latency.avgcount 读取操作的等待时间(不包括排队时间和等待完成)平均数
ceph.osd.op_r_prepare_latency.sum 读取操作的等待时间(不包括排队时间和等待完成)总数
ceph.osd.op_r_prepare_latency.avgtime 读取操作的等待时间(不包括排队时间和等待完成)平均时间
ceph.osd.op_w 客户端写操作
ceph.osd.op_w_in_bytes 客户端写入数据
ceph.osd.op_w_latency.avgcount 写操作的延迟(包括排队时间)平均数
ceph.osd.op_w_latency.sum 写操作的延迟(包括排队时间)总数
ceph.osd.op_w_latency.avgtime 写操作的延迟(包括排队时间)平均时间
ceph.osd.op_w_process_latency.avgcount 写操作的延迟(不包括排队时间)平均数
ceph.osd.op_w_process_latency.sum 写操作的延迟(不包括排队时间)总数
ceph.osd.op_w_process_latency.avgtime 写操作的延迟(不包括排队时间)平均时间
ceph.osd.op_w_prepare_latency.avgcount 写操作的延迟(不包括排队时间和等待完成)平均数
ceph.osd.op_w_prepare_latency.sum 写操作的延迟(不包括排队时间和等待完成)总数
ceph.osd.op_w_prepare_latency.avgcount 写操作的延迟(不包括排队时间和等待完成)平均时间
ceph.osd.rw 客户端读修改写操作
ceph.osd.op_rw_in_bytes 客户端读取修改写入操作写入
ceph.osd.op_rw_out_bytes 客户端读修改写操作读出
ceph.osd.op_rw_latency.avgcount 读修改写操作的延迟(包括排队时间)平均数
ceph.osd.op_rw_latency.sum 读修改写操作的延迟(包括排队时间)总数
ceph.osd.op_rw_latency.avgtime 读修改写操作的延迟(包括排队时间)平均时间
ceph.osd.op_rw_process_latency.avgcount 读修改写操作的延迟(不包括排队时间)平均数
ceph.osd.op_rw_process_latency.sum 读修改写操作的延迟(不包括排队时间)总数
ceph.osd.op_rw_process_latency.avgtime 读修改写操作的延迟(不包括排队时间)平均时间
ceph.osd.op_rw_prepare_latency.avgcount 读修改写操作的延迟(不包括排队时间和等待完成)平均数
ceph.osd.op_rw_prepare_latency.sum 读修改写操作的延迟(不包括排队时间和等待完成)总数
ceph.osd.op_rw_prepare_latency.avgtime 读修改写操作的延迟(不包括排队时间和等待完成)平均时间
ceph.osd.op_before_queue_op_lat.avgcount 调用队列之前的 IO 等待时间(在真正进入 ShardedOpWq 之前,客户端 IO 在队列 OpWQ 等待时间之前 ) 平均数
ceph.osd.op_before_queue_op_lat.sum 调用队列之前的 IO 等待时间(在真正进入 ShardedOpWq 之前,客户端 IO 在队列 OpWQ 等待时间之前 ) 总数
ceph.osd.op_before_queue_op_lat.avgtime 调用队列之前的 IO 等待时间(在真正进入 ShardedOpWq 之前,客户端 IO 在队列 OpWQ 等待时间之前 ) 平均时间
ceph.osd.op_before_dequeue_op_lat.avgcount 在调用 dequeue_op(已经排队并获得 PG 锁)之前,IO 的等待时间(客户端 IO 在 dequeue_op 等待时间之前) 平均数
ceph.osd.op_before_dequeue_op_lat.sum 在调用 dequeue_op(已经排队并获得 PG 锁)之前,IO 的等待时间(客户端 IO 在 dequeue_op 等待时间之前) 总数
ceph.osd.op_before_dequeue_op_lat.avgtime 在调用 dequeue_op(已经排队并获得 PG 锁)之前,IO 的等待时间(客户端 IO 在 dequeue_op 等待时间之前) 平均时间
ceph.osd.subop 子操作数
ceph.osd.subop_in_bytes 子操作总大小
ceph.osd.subop_latency.avgcount 子操作延迟 平均数
ceph.osd.subop_latency.sum 子操作延迟 总数
ceph.osd.subop_latency.avgtime 子操作延迟 平均时间
ceph.osd.subop_w 复制写入
ceph.osd.subop_w_in_bytes 复制的写入数据大小
ceph.osd.subop_w_latency.avgcount 复制的写入延迟 平均数
ceph.osd.subop_w_latency.avgtime 复制的写入延迟 平均时间
ceph.osd.subop_w_latency.sum 复制的写入延迟 总数
ceph.osd.subop_pull 子操作拉取请求
ceph.osd.subop_pull_latency.avgcount 子操作拉取延迟 平均数
ceph.osd.subop_pull_latency.sum 子操作拉取延迟 总数
ceph.osd.subop_pull_latency.avgtime 子操作拉取延迟 平均时间
ceph.osd.subop_push 子操作推送消息
ceph.osd.subop_push_in_bytes 子操作推送大小
ceph.osd.subop_push_latency.avgcount 子操作推送延迟 平均数
ceph.osd.subop_push_latency.sum 子操作推送延迟 总数
ceph.osd.subop_push_latency.avgtime 子操作推送延迟 平均时间
ceph.osd.pull 拉取请求发送
ceph.osd.push 推送消息
ceph.osd.push_out_bytes 推送大小
ceph.osd.push_in 入栈推送消息
ceph.osd.push_in_bytes 入栈推送大小
ceph.osd.recovery_ops 恢复操作数
ceph.osd.loadavg cpu load
ceph.osd.buffer_bytes 分配的缓冲区大小
ceph.osd.history_alloc_Mbytes 历史分配大小
ceph.osd.history_alloc_num 历史分配数量
ceph.osd.cached_crc 获取 crc_cached 获取的总数量
ceph.osd.missed_crc 未名字 crc_cached 的总数量
ceph.osd.numpg pg 数量
ceph.osd.numpg_primary 主 pg 数量
ceph.osd.numpg_replica 副本 pg 数量
ceph.osd.numpg_stray 删除的 pg 数量
ceph.osd.heartbeat_to_peers 发送心跳 ping 数
ceph.osd.heartbeat_from_peers 接收心跳 ping 数
ceph.osd.map_messages osd map 消息
ceph.osd.map_message_epochs osd map 消息的 epochs 号
ceph.osd.map_message_epoch_dups osd map 复制
ceph.osd.messages_delayed_for_map 等待 osd map 操作
ceph.osd.stat_bytes osd 大小
ceph.osd.stat_bytes_used osd 占用大小
ceph.osd.stat_bytes_avail osd 可以用大小
ceph.osd.osd_map_cache_hit osd map 命中缓存
ceph.osd.osd_map_cache_miss osd map 穿透缓存
ceph.osd.osd_map_cache_miss_low osd map 穿透缓存下限
ceph.osd.osd_map_cache_miss_low_avg.avgcount osd map 穿透缓存下限 平均数
ceph.osd.osd_map_cache_miss_low_avg.sum osd map 穿透缓存下限 总数
ceph.osd.osd_map_bl_cache_hit osd map 缓冲区缓存命中
ceph.osd.osd_map_bl_cache_miss osd map 缓冲区缓存穿透
ceph.osd.copyfrom rados 复制操作
ceph.osd.tier_promote 提升
ceph.osd.tier_flush 刷新
ceph.osd.tier_flush_fail 刷新失败
ceph.osd.tier_try_flush 尝试刷新
ceph.osd.tier_try_flush_fail 尝试刷新失败
ceph.osd.tier_evict 逐出
ceph.osd.tier_whiteout 白名单
ceph.osd.tier_dirty 设置脏数据标志
ceph.osd.tier_clean 清除设置的脏数据标志
ceph.osd.tier_delay 延迟
ceph.osd.tier_proxy_read 代理读取
ceph.osd.tier_proxy_write 代理写入
ceph.osd.agent_wake agent 唤醒 up
ceph.osd.agent_skip 被 agent 跳过的对象数
ceph.osd.agent_flush agent 刷新
ceph.osd.agent_evict agent 逐出
ceph.osd.object_ctx_cache_hit 对象内容命中缓存
ceph.osd.object_ctx_cache_total 查找对象内存缓存
ceph.osd.op_cache_hit 操作命中缓存
ceph.osd.osd_tier_flush_lat.avgcount 对象刷新延迟 平均数
ceph.osd.osd_tier_flush_lat.sum 对象刷新延迟 总数
ceph.osd.osd_tier_flush_lat.avgtime 对象刷新延迟 平均时间
ceph.osd.osd_tier_promote_lat.avgcount 对象促进延迟 平均数
ceph.osd.osd_tier_promote_lat.sum 对象促进延迟 总数
ceph.osd.osd_tier_promote_lat.avgtime 对象促进延迟 平均时间
ceph.osd.osd_tier_r_lat.avgcount 对象代理读取延迟 平均数
ceph.osd.osd_tier_r_lat.sum 对象代理读取延迟 总数
ceph.osd.osd_tier_r_lat.avgtime 对象代理读取延迟 平均时间
ceph.osd.osd_pg_info pg 更新的信息
ceph.osd.osd_pg_fastinfo pg 使用 fastinfo 更新信息
ceph.osd.osd_pg_biginfo pg 更新大信息属性

6. recoverystate_perf

监控类型 监控项 说明
perf dump
recoverystate_perf
ceph.recoverystate_perf.
initial_latency.avgcount
初始化恢复状态延迟 平均数
ceph.recoverystate_perf.
initial_latency.sum
初始化恢复状态延迟 总数
ceph.recoverystate_perf.
initial_latency.avgtime
初始化恢复状态延迟 平均时间
ceph.recoverystate_perf.
started_latency.avgcount
启动恢复状态延迟 平均数
ceph.recoverystate_perf.
started_latency.sum
启动恢复状态延迟 总数
ceph.recoverystate_perf.
started_latency.avgtime
启动恢复状态延迟 平均时间
ceph.recoverystate_perf.
reset_latency.avgcount
复位恢复状态延迟 平均数
ceph.recoverystate_perf.
reset_latency.sum
复位恢复状态延迟 总数
ceph.recoverystate_perf.
reset_latency.avgtime
复位恢复状态延迟 平均时间
ceph.recoverystate_perf.
start_latency.avgcount
启动恢复状态延迟 平均数
ceph.recoverystate_perf.
start_latency.sum
启动恢复状态延迟 总数
ceph.recoverystate_perf.
start_latency.avgtime
启动恢复状态延迟 平均时间
ceph.recoverystate_perf.
primary_latency.avgcount
主节点恢复状态延迟 平均数
ceph.recoverystate_perf.
primary_latency.sum
主节点恢复状态延迟 总数
ceph.recoverystate_perf.
primary_latency.avgtime
主节点恢复状态延迟 平均时间
ceph.recoverystate_perf.
peering_latency.avgcount
凝视恢复状态延迟 平均数
ceph.recoverystate_perf.
peering_latency.sum
凝视恢复状态延迟 总数
ceph.recoverystate_perf.
peering_latency.avgtime
凝视恢复状态延迟 平均时间
ceph.recoverystate_perf.
backfilling_latency.avgcount
回填恢复状态延迟 平均数
ceph.recoverystate_perf.
backfilling_latency.sum
回填恢复状态延迟 总数
ceph.recoverystate_perf.
backfilling_latency.avgtime
回填恢复状态延迟 平均时间
ceph.recoverystate_perf.
waitremotebackfillreserved_latency.avgcount
等待远程回填保留恢复状态延迟 平均数
ceph.recoverystate_perf.
waitremotebackfillreserved_latency.sum
等待远程回填保留恢复状态延迟 总数
ceph.recoverystate_perf.
waitremotebackfillreserved_latency.avgtime
等待远程回填保留恢复状态延迟 平均时间
ceph.recoverystate_perf.
waitlocalbackfillreserved_latency.avgcount
等待本地回填保留恢复状态延迟 平均数
ceph.recoverystate_perf.
waitlocalbackfillreserved_latency.sum
等待本地回填保留恢复状态延迟 总数
ceph.recoverystate_perf.
waitlocalbackfillreserved_latency.avgtime
等待本地回填保留恢复状态延迟 平均时间
ceph.recoverystate_perf.
notbackfilling_latency.avgcount
非回填恢复状态延迟 平均数
ceph.recoverystate_perf.
notbackfilling_latency.sum
非回填恢复状态延迟 总数
ceph.recoverystate_perf.
notbackfilling_latency.avgtime
非回填恢复状态延迟 平均时间
ceph.recoverystate_perf.
repnotrecovering_latency.avgcount
爬行覆盖恢复状态延迟 平均数
ceph.recoverystate_perf.
repnotrecovering_latency.sum
爬行覆盖恢复状态延迟 总数
ceph.recoverystate_perf.
repnotrecovering_latency.avgtime
爬行覆盖恢复状态延迟 平均时间
ceph.recoverystate_perf.
repwaitrecoveryreserved_latency.avgcount
保留等待恢复状态延迟 平均数
ceph.recoverystate_perf.
repwaitrecoveryreserved_latency.sum
保留等待恢复状态延迟 总数
ceph.recoverystate_perf.
repwaitrecoveryreserved_latency.avgtime
保留等待恢复状态延迟 平均时间
ceph.recoverystate_perf.
repwaitbackfillreserved_latency.avgcount
保留等待回填状态延迟 平均数
ceph.recoverystate_perf.
repwaitbackfillreserved_latency.sum
保留等待回填状态延迟 总数
ceph.recoverystate_perf.
repwaitbackfillreserved_latency.avgtime
保留等待回填状态延迟 平均时间
ceph.recoverystate_perf.
reprecovering_latency.avgcount
重修恢复状态延迟 平均数
ceph.recoverystate_perf.
reprecovering_latency.sum
重修恢复状态延迟 总数
ceph.recoverystate_perf.
reprecovering_latency.avgtime
重修恢复状态延迟 平均时间
ceph.recoverystate_perf.
activating_latency.avgcount
激活恢复状态延迟 平均数
ceph.recoverystate_perf.
activating_latency.sum
激活恢复状态延迟 总数
ceph.recoverystate_perf.
activating_latency.avgtime
激活恢复状态延迟 平均时间
ceph.recoverystate_perf.
waitlocalrecoveryreserved_latency.avgcount
等待本地恢复保留恢复状态延迟 平均数
ceph.recoverystate_perf.
waitlocalrecoveryreserved_latency.sum
等待本地恢复保留恢复状态延迟 总数
ceph.recoverystate_perf.
waitlocalrecoveryreserved_latency.avgtime
等待本地恢复保留恢复状态延迟 平均时间
ceph.recoverystate_perf.
waitremoterecoveryreserved_latency.avgcount
等待远程恢复保留恢复状态延迟 平均数
ceph.recoverystate_perf.
waitremoterecoveryreserved_latency.sum
等待远程恢复保留恢复状态延迟 总数
ceph.recoverystate_perf.
waitremoterecoveryreserved_latency.avgtime
等待远程恢复保留恢复状态延迟 平均时间
ceph.recoverystate_perf.
recovering_latency.avgcount
恢复中的恢复状态延迟 平均数
ceph.recoverystate_perf.
recovering_latency.sum
恢复中的恢复状态延迟 总数
ceph.recoverystate_perf.
recovering_latency.avgtime
恢复中的恢复状态延迟 平均时间
ceph.recoverystate_perf.
recovered_latency.avgcount
已恢复的恢复状态延迟 平均数
ceph.recoverystate_perf.
recovered_latency.sum
已恢复的恢复状态延迟 总数
ceph.recoverystate_perf.
recovered_latency.avgtime
已恢复的恢复状态延迟 平均时间
ceph.recoverystate_perf.
clean_latency.avgcount
清除恢复状态延迟 平均数
ceph.recoverystate_perf.
clean_latency.sum
清除恢复状态延迟 总数
ceph.recoverystate_perf.
clean_latency.avgtime
清除恢复状态延迟 平均时间
ceph.recoverystate_perf.
active_latency.avgcount
活跃的恢复状态延迟 平均数
ceph.recoverystate_perf.
active_latency.sum
活跃的恢复状态延迟 总数
ceph.recoverystate_perf.
active_latency.avgtime
活跃的恢复状态延迟 平均时间
ceph.recoverystate_perf.
replicaactive_latency.avgcount
复制激活恢复状态延迟 平均数
ceph.recoverystate_perf.
replicaactive_latency.sum
复制激活恢复状态延迟 总数
ceph.recoverystate_perf.
replicaactive_latency.avgtime
复制激活恢复状态延迟 平均时间
ceph.recoverystate_perf.
stray_latency.avgcount
无主的恢复状态延迟 平均数
ceph.recoverystate_perf.
stray_latency.sum
无主的恢复状态延迟 总数
ceph.recoverystate_perf.
stray_latency.avgtime
无主的恢复状态延迟 平均时间
ceph.recoverystate_perf.
getinfo_latency.avgcount
恢复状态信息的延迟 平均数
ceph.recoverystate_perf.
getinfo_latency.sum
恢复状态信息的延迟 总数
ceph.recoverystate_perf.
getinfo_latency.avgtime
恢复状态信息的延迟 平均时间
ceph.recoverystate_perf.
getlog_latency.avgcount
恢复状态日志的延迟 平均数
ceph.recoverystate_perf.getlog_latency.sum 恢复状态日志的延迟 总数
ceph.recoverystate_perf.
getlog_latency.avgtime
恢复状态日志的延迟 平均时间
ceph.recoverystate_perf.
waitactingchange_latency.avgcount
等待改变恢复状态的延迟 平均数
ceph.recoverystate_perf.
waitactingchange_latency.sum
等待改变恢复状态的延迟 总数
ceph.recoverystate_perf. waitactingchange_latency waitactingchange_latency.avgtime 等待改变恢复状态的延迟 平均时间
ceph.recoverystate_perf.
incomplete_latency.avgcount
不完全恢复状态的延迟 平均数
ceph.recoverystate_perf.
incomplete_latency.sum
不完全恢复状态的延迟 总数
ceph.recoverystate_perf.
incomplete_latency.avgtime
不完全恢复状态的延迟 平均时间
ceph.recoverystate_perf.
down_latency.avgcount
挂掉恢复状态的延迟 平均数
ceph.recoverystate_perf.
down_latency.sum
挂掉恢复状态的延迟 总数
ceph.recoverystate_perf.
down_latency.avgtime
挂掉恢复状态的延迟 平均时间
ceph.recoverystate_perf.
getmissing_latency.avgcount
缺失恢复状态的延迟 平均数
ceph.recoverystate_perf.
getmissing_latency.sum
缺失恢复状态的延迟 总数
ceph.recoverystate_perf.
getmissing_latency.avgtime
缺失恢复状态的延迟 平均时间
ceph.recoverystate_perf.
waitupthru_latency.avgcount
守候恢复状态的延迟 平均数
ceph.recoverystate_perf.
waitupthru_latency.sum
守候恢复状态的延迟 总数
ceph.recoverystate_perf.
waitupthru_latency.avgtime
守候恢复状态的延迟 平均时间
ceph.recoverystate_perf.
notrecovering_latency.avgcount
不恢复的恢复状态延迟 平均数
ceph.recoverystate_perf.
notrecovering_latency.sum
不恢复的恢复状态延迟 总数
ceph.recoverystate_perf.
notrecovering_latency.avgtime
不恢复的恢复状态延迟 平均时间

7. throttle

监控类型 监控项 说明 级别
perf dump throttle-* val 当前可用的值
* max 最大限制数
* get 获取到的值
* get_sum 获取到的总数
* get_or_fail_fail 获取或者错误值
* get_or_fail_success 获取或者错误成功值
* take 接受值
* take_sum 接受总数
* put 推送值
* put_sum 推送总数
* wait.avgcount 等待平均数量
* wait.sum 等待总数

8. ceph osd perf

监控类型 监控项 说明 级别
ceph osd perf osd osd id
commit_latency 写入延迟时间,表示写 journal 的完成时间(毫秒)
apply_latency 读取延迟,表示写到 osd 的 buffer cache 里的完成时间(毫秒)