# 访问日志

## 1. 概述

为了更好地支持企业级数据治理和数据访问监控需求，同时显著降低高并发场景下的日志存储与处理压力，系统引入了聚合型访问日志 (Aggregated Access Log) 机制。

**特别需要强调的是，Access Log 生效的进程是 Worker。** 它的核心作用是记录 Worker 中缓存的文件在整个生命周期中的关键操作轨迹。

## 2. 记录的关键操作

Access Log 会重点捕获文件在缓存生命周期中的以下五种关键操作：

* **LOAD**: 文件数据块首次加载到 Alluxio 缓存中。
* **HOT\_READ**: 从 Alluxio 缓存中读取数据（命中缓存），验证缓存加速效果，标识数据已处于“热”状态。
* **COLD\_READ**: 从底层的 UFS 读取数据（未命中缓存），用于分析数据的冷热转换过程。
* **EVICT**: 数据因缓存空间不足等策略，从 Alluxio 缓存中被驱逐。
* **DELETE**: 用户主动发起的缓存删除或释放事件。

## 3. 去重机制与假阳性说明

为了保持日志内容的精简，系统并没有采用流式输出每一次单一操作的方式，而是**采用了 Bloom Filter (布隆过滤器) 来进行日志去重**。这意味着 Access Log 不会记录重复的操作条目，从而大幅降>低日志噪音、性能开销和存储成本。

需要注意的是，由于 Bloom Filter 算法的固有特性，**系统可能会因为“假阳性 (False Positive)”现象，导致极少部分本该记录的条目被当作重复项而未被记录**。

## 4. 极限吞吐与配置标准

为了在极高的并发下仍能保持高效记录，系统当前的配置标准为：在极限吞吐情况下，能在 **3 小时内处理并产生 4.32 亿个操作条目**，同时将其假阳性率严格控制在 **0.0001**。这确保了在海量数据访问场景下，既能有效压缩日志体积，又能保证核心访问监控数据的高度可靠。

## 5. 使用方法

访问日志通过与审计日志相同的 REST API 和 User CLI 进行启用与调优。详见 [通过 REST API 和 CLI 进行动态配置](/ee-ai-cn/administration/audit-access-logs/audit-log.md#tong-guo-rest-api-he-cli-jin-xing-dong-tai-pei-zhi)。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://documentation.alluxio.io/ee-ai-cn/administration/audit-access-logs/access-log.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
