Alluxio
ProductsLanguageHome
  • Alluxio概览
  • 用户指南
    • 快速上手指南
    • 架构
    • FAQ
    • 作业服务器
    • 应用场景
  • 核心功能
    • 缓存
    • 统一命名空间
  • 部署 Alluxio
    • 在Kubernetes上部署Alluxio
    • 本地运行Alluxio
    • 在集群上独立运行Alluxio
    • 在Docker上运行Alluxio
    • 在具有HA的群集上部署Alluxio
    • 使用Docker部署AlluxioFuse加速深度学习训练(试验)
    • 基本要求
  • 云源生
    • Tencent EMR
  • 计算应用
    • Apache Spark
    • Presto
    • Spark on Kubernetes
    • Apache Flink
    • Apache Hadoop MapReduce
    • Presto on Iceberg (Experimental)
    • Trino
    • Apache Hive
    • 深度学习框架
    • Tensorflow
  • 底层存储系统
    • Alluxio集成Amazon AWS S3作为底层存储
    • Alluxio集成GCS作为底层存储
    • Alluxio集成Azure Blob Store作为底层存储
    • Azure Data Lake Storage Gen2
    • Azure 数据湖存储
    • Alluxio集成HDFS作为底层存储
    • Alluxio集成COS作为底层存储
    • Alluxio集成COSN作为底层存储
    • Alluxio集成Ceph Object Storage作为底层存储
    • Alluxio集成NFS作为底层存储
    • Alluxio集成Kodo作为底层存储
    • Alluxio集成Swift作为底层存储
    • Alluxio集成WEB作为底层存储
    • Alluxio集成Minio作为底层存储
    • 阿里云对象存储服务
    • Alluxio集成Ozone作为底层存储
    • Alluxio集成CephFS作为底层存储
  • 安全设置
    • 安全性
  • 运维指南
    • 配置项设置
    • 命令行接口
    • 管理员命令行接口
    • Web界面
    • 日志
    • 度量指标系统
    • 远程记录日志
  • 管理
    • 升级
    • 异常诊断与调试
  • APIs
    • Filesystem API
    • S3 Client
    • POSIX API
    • REST API
    • Python Client
    • 兼容Hadoop的Java
    • Go 客户端
  • 开发者资源
    • 编译Alluxio源代码
    • 开发指南
    • 代码规范
    • 如何开发单元测试
    • 文档规范
  • 参考
    • 配置项列表
    • List of Metrics
  • REST API
    • Master REST API
    • Worker REST API
    • Proxy REST API
    • Job REST API
  • Javadoc
Powered by GitBook
On this page
  • 部署条件
  • 基本设置
  • 示例:将 Alluxio 与 OSS 一起在本地运行
  • 高级设置
  • 嵌套挂载
  1. 底层存储系统

阿里云对象存储服务

Last updated 6 months ago

本指南介绍了如何配置 将其作为Alluxio 的底层存储系统。对象存储服务(Object Storage Service, OSS)是阿里云提供的海量、安全、高可靠的云存储服务。

部署条件

电脑上应已安装好 Alluxio 程序。如果没有安装,可, 或在.

在将 OSS 与 Alluxio 一起运行前,请参照 注册 OSS 或创建一个 OSS bucket。

基本设置

如果要使用OSS作为 Alluxio的底层存储,需要通过修改 conf/alluxio-site.properties 来配置Alluxio。如果该配置文件不存在,可通过模板创建。

$ cp conf/alluxio-site.properties.template conf/alluxio-site.properties

编辑 conf/alluxio-site.properties 文件,将底层存储地址设置为 OSS bucket 和要挂载到 Alluxio 的 OSS 目录。例如,如果要将整个 bucket 挂载到 Alluxio,底层存储地址可以是 oss://alluxio-bucket/ ,如果将名为 alluxio-bucket、目录为 /alluxio/data 的 OSS bucket 挂载到 Alluxio,则底层存储地址为 oss://alluxio-bucket/alluxio/data。

alluxio.master.mount.table.root.ufs=oss://<OSS_BUCKET>/<OSS_DIRECTORY>

指定访问 OSS 的阿里云凭证。在 conf/alluxio-site.properties 中,添加:

fs.oss.accessKeyId=<OSS_ACCESS_KEY_ID>
fs.oss.accessKeySecret=<OSS_ACCESS_KEY_SECRET>
fs.oss.endpoint=<OSS_ENDPOINT>

fs.oss.accessKeyId 和 fs.oss.accessKeySecret 是 OSS 的 , 由创建和管理。

fs.oss.endpoint 是这个bucket的网络端点 (endpoint),见 bucket 概览页面,包含如 oss-us-west-1.aliyuncs.com 和 oss-cn-shanghai.aliyuncs.com 这样的值。可用的 endpoint 清单见 .

示例:将 Alluxio 与 OSS 一起在本地运行

启动 Alluxio 服务器:

$ ./bin/alluxio format
$ ./bin/alluxio-start.sh local

运行一个简单的示例程序:

$ ./bin/alluxio runTests

访问 OSS 的目录 oss://<OSS_BUCKET>/<OSS_DIRECTORY> 以验证 Alluxio 创建的文件和目录是否存在。就本次测试而言,将看到如下的文件:<OSS_BUCKET>/<OSS_DIRECTORY>/default_tests_files/BasicFile_CACHE_PROMOTE_MUST_CACHE.

运行以下命令终止 Alluxio:

$ ./bin/alluxio-stop.sh local

高级设置

嵌套挂载

$ ./bin/alluxio fs mount --option fs.oss.accessKeyId=<OSS_ACCESS_KEY_ID> \
  --option fs.oss.accessKeySecret=<OSS_ACCESS_KEY_SECRET> \
  --option fs.oss.endpoint=<OSS_ENDPOINT> \
  /oss oss://<OSS_BUCKET>/<OSS_DIRECTORY>/

该命令会启动一个 Alluxio master 和一个 Alluxio worker。可通过 查看 master UI。

OSS 存储位置可以挂载在 Alluxio 命名空间中的嵌套目录下,以便统一访问多个底层存储系统。可使用 Alluxio 的 (挂载命令)来进行挂载。例如:下述命令将 OSS bucket 里的一个目录挂载到 Alluxio 目录 /oss:

阿里云 OSS
编译Alluxio源代码
本地下载Alluxio程序
OSS 快速上手指南
AccessKey
阿里云AccessKey管理工作台
OSS网络端点文档
http://localhost:19999
Mount Command