> For the complete documentation index, see [llms.txt](https://documentation.alluxio.io/ee-ai-cn/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://documentation.alluxio.io/ee-ai-cn/administration/audit-access-logs/access-log.md).

# 访问日志

## 1. 概述

为了更好地支持企业级数据治理和数据访问监控需求，同时显著降低高并发场景下的日志存储与处理压力，系统引入了聚合型访问日志 (Aggregated Access Log) 机制。

**特别需要强调的是，Access Log 生效的进程是 Worker。** 它的核心作用是记录 Worker 中缓存的文件在整个生命周期中的关键操作轨迹。

## 2. 记录的关键操作

Access Log 会重点捕获文件在缓存生命周期中的以下五种关键操作：

* **LOAD**: 文件数据块首次加载到 Alluxio 缓存中。
* **HOT\_READ**: 从 Alluxio 缓存中读取数据（命中缓存），验证缓存加速效果，标识数据已处于“热”状态。
* **COLD\_READ**: 从底层的 UFS 读取数据（未命中缓存），用于分析数据的冷热转换过程。
* **EVICT**: 数据因缓存空间不足等策略，从 Alluxio 缓存中被驱逐。
* **DELETE**: 用户主动发起的缓存删除或释放事件。

## 3. 去重机制与假阳性说明

为了保持日志内容的精简，系统并没有采用流式输出每一次单一操作的方式，而是**采用了 Bloom Filter (布隆过滤器) 来进行日志去重**。这意味着 Access Log 不会记录重复的操作条目，从而大幅降>低日志噪音、性能开销和存储成本。

需要注意的是，由于 Bloom Filter 算法的固有特性，**系统可能会因为“假阳性 (False Positive)”现象，导致极少部分本该记录的条目被当作重复项而未被记录**。

## 4. 极限吞吐与配置标准

为了在极高的并发下仍能保持高效记录，系统当前的配置标准为：在极限吞吐情况下，能在 **3 小时内处理并产生 4.32 亿个操作条目**，同时将其假阳性率严格控制在 **0.0001**。这确保了在海量数据访问场景下，既能有效压缩日志体积，又能保证核心访问监控数据的高度可靠。

## 5. 使用方法

访问日志通过与审计日志相同的 REST API 和 User CLI 进行启用与调优。详见 [通过 REST API 和 CLI 进行动态配置](/ee-ai-cn/administration/audit-access-logs/audit-log.md#tong-guo-rest-api-he-cli-jin-xing-dong-tai-pei-zhi)。