For the complete documentation index, see llms.txt. This page is also available as Markdown.

Alluxio 集群操作

本文档介绍如何对在 Kubernetes 上运行的 Alluxio 集群进行管理操作,如升级到新版本和添加新 Worker。

升级到新的 Alluxio 版本

升级 Operator

  1. 将与新版 Alluxio operator 对应的新 docker 镜像上传到镜像仓库(image registry),并解压该 operator 的 helm chart。 具体请参看 安装文件

  2. 运行以下命令,以将新的更改应用到集群。

# 卸载 operator 。 operator 是独立的,operator 的状态不会影响现有的 Alluxio 集群
$ helm uninstall operator
release "operator" uninstalled

# 检查是否所有资源都已移除。命名空间是最后移除的资源
$ kubectl get ns alluxio-operator
Error from server (NotFound): namespaces "alluxio-operator" not found

# 在新的 helm chart 目录下运行以下命令,来首先升级 CRD
$ kubectl apply -f alluxio-operator/crds 2>/dev/null
customresourcedefinition.apiextensions.k8s.io/alluxioclusters.k8s-operator.alluxio.com configured
customresourcedefinition.apiextensions.k8s.io/underfilesystems.k8s-operator.alluxio.com configured

# 使用相同的 operator-config.yaml,仅更改镜像的标签,以重启 operator
$ helm install operator -f operator-config.yaml alluxio-operator
NAME: operator
LAST DEPLOYED: Thu Jun 27 15:47:44 2024
NAMESPACE: default
STATUS: deployed
REVISION: 1
TEST SUITE: None

升级 Alluxio 集群

在操作之前应了解如下内容:

  • 升级操作开始后,coordinator 和 worker 将执行滚动升级以使用新的镜像。

  • 在集群升级期间,缓存命中率可能会略有下降,但在集群再次完全运行后就会完全恢复。

按照以下步骤升级集群:

  1. 将与新版 Alluxio 对应的新 docker 镜像上传到镜像仓库。具体请参看安装文档

  2. 更新 alluxio-cluster.yaml 中的 imageTag 字段,以反映新的 Alluxio 版本。在下面的示例中,新的 imageTagDA-3.5-10.2.0

  3. 运行以下命令将新更改应用到集群。

扩容集群

扩容 worker

在操作之前应了解如下内容:

  • 在集群升级期间,缓存命中率可能会略有下降,但在集群再次完全运行后就会完全恢复。

按照以下步骤扩容 worker:

  1. 更改 alluxio-cluster.yaml,以增加 worker 中的 count。在下面的示例中,我们将从 2 个 worker 扩展到 3 个 worker。

  2. 运行以下命令将新更改应用到集群。

Last updated