Alluxio集成COSN作为底层存储
该指南介绍如何配置Alluxio以使用腾讯云对象存储(Cloud Object Storage,简称:COS)作为底层文件系统。 对象存储是腾讯云提供的面向非结构化数据,支持 HTTP/HTTPS协议访问的分布式存储服务,它能容纳海量数据并保证用户对带宽和容量扩充无感知,可以作为大数据计算与分析的数据池。
初始步骤
通常,Alluxio以集群模式在多个机器上运行。需要在机器上部署二进制包。 你可以自己编译Alluxio,或者下载二进制包。
为了在COS上使用Alluxio,需要创建一个bucket(或者使用一个已有的bucket)。然后在该bucket中新建一个目录,或者使用一个存在的目录。 在该指南中,COS Bucket的名称为COSN_ALLUXIO_BUCKET
,在该bucket里的目录名称为COSN_DATA
。还需提供一个COS的REGION,它们指定了你的bucket在哪个地域,本向导中的REGION名为COSN_REGION
。
安装COSN
Alluxio通过统一命名空间统一访问不同存储系统。COSN UFS是用于访问腾讯云对象存储的,其安装位置可以在Alluxio命名空间的根目录或嵌套目录下。
根目录安装
若要在Alluxio中使用COSN作为底层文件系统,需修改conf/alluxio-site.properties
和conf/core-site.xml
配置文件。首先要指定一个已有的COS bucket和其中的目录作为底层文件系统,可以在conf/alluxio-site.properties
中添加如下语句指定它:
接着,需要指定COS的配置信息以便访问COS,在conf/core-site.xml
中添加:
以上是最基本的配置,更多配置请参考这里。更改完成后,Alluxio应该能够将COSN作为底层文件系统运行,你可以尝试使用COSN在本地运行Alluxio
嵌套目录安装
COSN可以安装在Alluxio命名空间中的嵌套目录中,以统一访问多个存储系统。 Mount命令可以实现这一目的。例如,下面的命令将COSN实例内部的目录挂载到Alluxio的/cosn目录:
以上是最基本的配置,更多配置请参考这里。
使用COSN在本地运行Alluxio
配置完成后,你可以在本地启动Alluxio,观察一切是否正常运行:
该命令应当会启动一个Alluxio master和一个Alluxio worker,可以在浏览器中访问http://localhost:19999查看master UI。
接着,你可以运行一个简单的示例程序:
运行成功后,访问你的COS目录COSN_ALLUXIO_BUCKET/COSN_DATA
,确认其中包含了由Alluxio创建的文件和目录。在该测试中,创建的文件名称应像:
运行以下命令停止Alluxio:
Last updated