# 应用场景

世界上许多头部企业都在生产中部署Alluxio，以从数据中获取价值。我们在 [Powered-By](https://www.alluxio.io/powered-by-alluxio) 页面中列出了部分企业。下面我们将介绍一些最常见的 Alluxio 应用场景。

## 应用场景1：加速云上分析和AI 作业

<div align="center"><img src="https://d39kqat1wpn1o5.cloudfront.net/app/uploads/2021/10/overview-case-1-cloud.png" alt="" width="200"></div>

许多企业都在公有云（AWS S3、Google Cloud 或 Microsoft Azure）对象存储上运行分析和机器学习负载（Spark、Presto、Hive、Tensorflow 等）。

虽然云对象存储通常性价比更高，易于使用和扩展，但也存在一些挑战：

* 性能不稳定，难以实现SLA一致
* 元数据操作昂贵，拖慢负载运行
* 自带缓存对于短暂运行的集群无效

Alluxio 通过提供智能多级缓存和元数据管理来解决这些挑战。在计算集群上部署 Alluxio 有助于：

* 实现分析引擎的性能稳定
* 降低AI训练时间和成本
* 去除重复存储带来的成本
* 对于短暂运行的工作负载实现集群外缓存

本应用场景案例参见 [Electronic Arts](https://www.alluxio.io/blog/building-a-high-performance-platform-on-aws-to-support-real-time-gaming-services-using-presto-and-alluxio/)（美国艺电）。

## 应用场景2：加速本地对象存储的分析和AI作业

<div align="center"><img src="https://d39kqat1wpn1o5.cloudfront.net/app/uploads/2021/10/overview-case-2-on-prem.png" alt="" width="200"></div>

在本地部署的对象存储上运行数据驱动型应用会带来以下挑战：

* 分析和AI负载性能差
* 缺乏对主流框架的原生支持
* 元数据操作成本高昂且性能低下

Alluxio 通过提供缓存和 API 转换功能来解决这些问题。在应用端部署 Alluxio 带来以下益处：

* 分析和AI负载性能提升
* 可灵活实现存储隔离
* 支持多个API,不影响终端用户体验
* 降低总存储成本

本应用场景案例参见 [DBS](https://www.alluxio.io/resources/presentations/enabling-big-data-ai-workloads-on-the-object-store-at-dbs/)（新加坡星展银行）。

## 应用场景3："零拷贝"混合云迁移

<div align="center"><img src="https://d39kqat1wpn1o5.cloudfront.net/app/uploads/2021/10/overview-case-3-hybrid.png" alt="" width="200"></div>

随着越来越多的企业迁移上云，其中一种常见的过渡做法是利用云上的计算资源，同时从本地数据源读取数据。但是，这种混合架构带来了下列问题：

* 远程读取数据速度慢且不稳定
* 将数据拷贝到云存储耗时，复杂且易出错
* 合规性和数据主权相关规定不允许将数据拷贝上云

Alluxio提供"零拷贝"上云功能，使得云上的计算引擎能够访问本地数据，而无需持久化的数据复制或定期同步。这一功能可带来以下益处：

* 性能等同于数据位于云计算集群上
* 不影响终端用户体验和安全模式
* 普通数据访问层采用基于访问和策略的数据移动
* 可利用弹性云计算资源，降低成本

本应用场景案例参见 [Walmart](https://www.alluxio.io/resources/videos/enterprise-distributed-query-service-powered-by-presto-alluxio-across-clouds-at-walmartlabs/)（沃尔玛）。

## 应用场景4：云上数据的混合云存储网关

<div align="center"><img src="https://d39kqat1wpn1o5.cloudfront.net/app/uploads/2021/10/overview-case-4-hybrid.png" alt="" width="200"></div>

另一种混合云架构是从私有数据中心访问云存储。使用这种架构通常会导致以下问题：

* 没有云存储和本地存储的统一视图
* 网络流量成本过高
* 无法使用本地计算引擎访问云上数据
* 运行分析和AI作业时性能不佳

Alluxio 作为混合云存储网关，可利用本地计算处理云上数据， 从而解决这些问题。当Alluxio与本地计算一同部署时，Alluxio可管理计算集群的存储并将应用所需数据本地化，从而实现：

* 通过智能分布式缓存提高读写性能
* 减少数据复制，从而节约网络成本
* 提供灵活API接口和云存储安全模式，不影响终端用户体验

本应用场景案例参见 [Comcast](https://www.alluxio.io/resources/videos/securely-enhancing-data-access-in-hybrid-cloud-with-alluxio/)（康卡斯特）。

## 应用场景5：支持跨数据中心的数据访问

<div align="center"><img src="https://d39kqat1wpn1o5.cloudfront.net/app/uploads/2021/10/overview-case-5-multi-datacenter.png" alt="" width="200"></div>

许多企业出于性能、安全或资源隔离的目的，建立了独立于主数据集群的卫星计算集群。由于这些卫星集群需要通过主集群远程访问数据，有一定难度，这是因为：

* 跨数据中心的副本需要手动操作，非常耗时
* 数据拷贝导致不必要的高昂网络成本
* 在过载的存储集群上进行复制作业严重影响现有负载的性能

Alluxio 可以作为一个数据逻辑副本，部署在卫星集群中的计算节点上，并配置为连接到主数据集群，因此：

* 无需跨数据中心维护冗余的副本
* 减少复杂的数据同步
* 与远程访问数据相比实现性能提升
* 实现跨业务部门的自主数据架构


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://documentation.alluxio.io/os-cn/overview-1/use-cases.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
