作业服务器

架构概览

Alluxio 作业服务器是负责将各种不同类型的操作分配给Job Worker的任务调度框架。

Master负责将作业分配为更小的任务,供Job Worker执行并管理作业的完成状态。

Job Worker将来自Job Master的任务排列(queue),并通过管理可配置的固定线程池(alluxio.job.worker.threadpool.size)来完成这些任务。

不同类型的作业

迁移 Migrate

fs distributedCpCLI命令中使用了迁移作业,使用固定的写入类型进行数据复制/移动。

持久化 Persist

fs persist CLI命令间接使用了持久化作业,以ASYNC_THROUGH写入类型写入Alluxio时使用持久化作业在后台进行持久化。

该作业负责将Alluxio中的文件持久化到特定的ufs路径中。

驱逐 Evict

fs free CLI命令和后台复制进程间接使用了驱逐作业。

该作业负责从Alluxio中驱逐出特定数量的数据块副本。

移动 Move

复制后台进程使用移动作业将数据块从一个worker移动到另一个worker。

复制 Replicate

后台复制进程使用复制作业将数据块从一个worker复制到特定数量的其他worker上。

巡检命令

作业服务器提供以下一系列的巡检命令。

fsadmin report jobservice

fsadmin report jobservice 会报告作业服务器摘要。

job ls

job ls 会列出正在作业服务器上运行或运行过的作业。

job stat -v <job_id>

job stat -v <job_id> 会列出某个作业的详细信息。(加 -v 表示包含worker上指定任务的信息)

Last updated