Alluxio
ProductsLanguageHome
AI-3.5 (stable)
AI-3.5 (stable)
  • 概览
  • 部署Alluxio
    • 资源需求和兼容性
    • 在Kubernetes上安装Alluxio
    • 监控和指标
    • Alluxio 集群操作
    • 系统健康检查和快速恢复
    • 采集集群信息
  • 架构
    • Alluxio 命名空间和底层文件系统命名空间
    • I/O弹性
    • worker管理与一致性哈希
  • 底层存储系统
    • Amazon AWS S3
    • HDFS
    • 阿里云 OSS
    • 腾讯 COS
    • 火山引擎 TOS
    • 谷歌云 GCS
  • Client APIs
    • 基于 FSSpec 的Alluxio Python Filesystem API
    • 基于 FUSE 的 POSIX API
      • Client 写回
    • S3 API
  • 缓存操作
    • 缓存预加载
    • 缓存过滤
    • 缓存驱逐
      • TTL (有效时间)规则
      • 优先级规则
      • 通过命令行释放缓存空间
  • 资源管理
    • 基于目录的集群配额
    • UFS 带宽限制
  • 性能优化
    • 通过副本提高读取吞吐量
    • 读取大文件
    • 元数据列表
    • 数据预拉取
    • 写入临时文件
  • 安全
    • TLS 支持
  • 性能基准测试
    • Fio 测试概览
    • MLPerf Storage 基准测试
    • COSBench 性能基准测试
  • 参考
    • 用户命令行接口
    • 指标
    • S3 API 的使用
    • 第三方授权
  • 版本发布说明
Powered by GitBook
On this page
  • Alluxio 指标
  • 缓存存储
  • 数据访问
  • 分布式负载
  • 进程和JVM 指标
  1. 参考

指标

Alluxio 指标

缓存存储

指标
标签
类型
组件
描述

alluxio_cached_storage_bytes

-

gauge

worker

缓存的数据量

alluxio_cached_capacity_bytes

-

gauge

worker

配置的最大缓存存储

alluxio_cached_evicted_data_bytes_total

-

counter

worker

驱逐的数据量

数据访问

指标
标签
类型
组件
描述

alluxio_data_access_bytes

method=read/write

histogram

fuse, worker

汇总的所有数据访问请求

alluxio_data_throughput_bytes_total

method=read/write

counter

worker

所有数据访问的吞吐量计数器

alluxio_meta_operation_total

op=getStatus/listStatus/...

counter

worker

元数据操作的 RPC 调用计数器

alluxio_cached_data_read_bytes_total

-

counter

worker

page store 的缓存命中次数

alluxio_missed_data_read_bytes_total

-

counter

worker

page store 的缓存未命中次数

alluxio_ufs_data_access_bytes_total

method=read/write

counter

fuse, worker

ufs的访问次数

alluxio_fuse_concurrency

method=Fuse.Getattr/Fuse.readdir/...

gauge

fuse

记录 FUSE 机制的实时并发数

alluxio_s3_api_throughput_bytes

method=read/write/list

histogram

fuse, worker

S3 IO API 吞吐量的直方图

alluxio_s3_api_call_processing

method=GetObject/ListObjects/...

gauge

fuse, worker

正在处理中的 S3 API 调用次数计数器

分布式负载

指标
标签
类型
组件
描述

alluxio_distributed_load_job_scanned_total

-

counter

coordinator

分布式负载中扫描的 inode数量计数器

alluxio_distributed_load_job_processed_total

-

counter

coordinator

分布式负载中加载的非空文件副本数计数器

alluxio_distributed_load_job_skipped_total

-

counter

coordinator

分布式负载中跳过的 inode 数量计数器

alluxio_distributed_load_job_failure_total

reason, final_attempt, worker

counter

coordinator

分布式负载故障的计数器

alluxio_distributed_load_job_dispatched_size_total

-

counter

coordinator

分布式负载中分发的字节数计数器

alluxio_distributed_load_job_loaded_bytes_total

-

counter

coordinator

分布式负载中加载的字节数计数器

进程和JVM 指标

指标
标签
类型
描述

process_start_time_seconds

-

gauge

自 Unix epoch 以来的进程启动时间(单位:秒)

process_cpu_seconds_total

-

counter

用户和系统 CPU 总耗时(单位:秒)

jvm_threads_current

-

gauge

JVM 当前线程数

jvm_memory_used_bytes

area=heap/nonheap

gauge

特定 JVM 内存区域的已使用字节数

jvm_memory_max_bytes

area=heap/nonheap

gauge

特定 JVM 内存区域的最大字节数

jvm_gc_collection_seconds

gc="G1 Young Generation"/"G1 Old Generation"/...

summary

特定 JVM 垃圾收集器的耗时(单位:秒)

Last updated 3 months ago