Alluxio
ProductsLanguageHome
  • Alluxio概览
  • 用户指南
    • 快速上手指南
    • 架构
    • FAQ
    • 作业服务器
    • 应用场景
  • 核心功能
    • 缓存
    • 统一命名空间
  • 部署 Alluxio
    • 在Kubernetes上部署Alluxio
    • 本地运行Alluxio
    • 在集群上独立运行Alluxio
    • 在Docker上运行Alluxio
    • 在具有HA的群集上部署Alluxio
    • 使用Docker部署AlluxioFuse加速深度学习训练(试验)
    • 基本要求
  • 云源生
    • Tencent EMR
  • 计算应用
    • Apache Spark
    • Presto
    • Spark on Kubernetes
    • Apache Flink
    • Apache Hadoop MapReduce
    • Presto on Iceberg (Experimental)
    • Trino
    • Apache Hive
    • 深度学习框架
    • Tensorflow
  • 底层存储系统
    • Alluxio集成Amazon AWS S3作为底层存储
    • Alluxio集成GCS作为底层存储
    • Alluxio集成Azure Blob Store作为底层存储
    • Azure Data Lake Storage Gen2
    • Azure 数据湖存储
    • Alluxio集成HDFS作为底层存储
    • Alluxio集成COS作为底层存储
    • Alluxio集成COSN作为底层存储
    • Alluxio集成Ceph Object Storage作为底层存储
    • Alluxio集成NFS作为底层存储
    • Alluxio集成Kodo作为底层存储
    • Alluxio集成Swift作为底层存储
    • Alluxio集成WEB作为底层存储
    • Alluxio集成Minio作为底层存储
    • 阿里云对象存储服务
    • Alluxio集成Ozone作为底层存储
    • Alluxio集成CephFS作为底层存储
  • 安全设置
    • 安全性
  • 运维指南
    • 配置项设置
    • 命令行接口
    • 管理员命令行接口
    • Web界面
    • 日志
    • 度量指标系统
    • 远程记录日志
  • 管理
    • 升级
    • 异常诊断与调试
  • APIs
    • Filesystem API
    • S3 Client
    • POSIX API
    • REST API
    • Python Client
    • 兼容Hadoop的Java
    • Go 客户端
  • 开发者资源
    • 编译Alluxio源代码
    • 开发指南
    • 代码规范
    • 如何开发单元测试
    • 文档规范
  • 参考
    • 配置项列表
    • List of Metrics
  • REST API
    • Master REST API
    • Worker REST API
    • Proxy REST API
    • Job REST API
  • Javadoc
Powered by GitBook
On this page
  • 概述
  • 准备
  • 创建基于Alluxio的EMR集群
  • 基础配置
  • 基于Alluxio加速计算存储分离
  1. 云源生

Tencent EMR

Last updated 6 months ago

概述

在腾讯云EMR上提供了开箱可用的Alluxio服务,以帮助腾讯云客户可以快速实现分布式内存级缓存加速,简化数据管理等能力;同时还可以通过腾讯云EMR控制台或API接口,使用配置下发功能力快速配置多层级缓存和元数据管理等;获取一站式监控告警能力等能力。

准备

  • 腾讯云EMR的Hadoop标准2.x版本>=EMR-v2.3.0

  • 腾讯云EMR的Hadoop标准3.x版本>=EMR-v3.2.0

  • 有关EMR中版本中支持具体的Alluxio的版本支持可参考

创建基于Alluxio的EMR集群

这部分主要说明如何在腾讯云EMR上创建开箱即用的Alluxio集群。EMR提供了使用WEB购买页创建和API创建两种方式来构建集群:

购买页创建集群

您需要登陆腾讯云 ,在购买页选择支持的Alluxio发布版本,并且在可选组件列表中勾选上Alluxio组件.

其他的选项可根据业务具体业务场景,进行个性化配置,创建过程中的具体选项可参考

API创建集群

同时,腾讯云EMR还提供了API方式构建基于Alluxio的大数据集群,具体可参考 。

基础配置

了解跟多配置下发和重启策略细节,可以查阅相关文档:

基于Alluxio加速计算存储分离

腾讯云EMR基于腾讯云对象存储(COS)提供了计算存储分离能力,默认直接访问对象存储中的数据时,应用程序没有节点级数据本地性或跨应用程序缓存。使用 Alluxio 加速将缓解这些问题。 在腾讯云EMR集群上默认已经部署了使用COS作为UFS的依赖jar包,只需授权访问COS和把COS mount到Alluxio上即可使用。

API创建集群

创建了一个带Alluxio组件的腾讯云EMR,默认会把HDFS挂载到Alluxio上,并使用内存作为单层level0存储。如果有需要更改更符合业务特性的多级存储,或者其他对应优化项,可以使用配置下发功能来完成相关配置: 在配置下发后,有些配置需要重启Alluxio服务才能生效:

若当前集群未开启对象存储,可单击 Authorize 进行授权,授权后EMR中节点可以通过临时秘钥访问COS中数据。

更多在腾讯云EMR中使用Alluxio开发使用细节,可

配置管理
重启服务
查阅
这里
EMR购买页
这里
这里