作业服务器
架构概览
Alluxio 作业服务器是负责将各种不同类型的操作分配给Job Worker的任务调度框架。
Master负责将作业分配为更小的任务,供Job Worker执行并管理作业的完成状态。
Job Worker将来自Job Master的任务排列(queue),并通过管理可配置的固定线程池(alluxio.job.worker.threadpool.size)来完成这些任务。
不同类型的作业
迁移 Migrate
fs distributedCpCLI命令中使用了迁移作业,使用固定的写入类型进行数据复制/移动。
持久化 Persist
fs persist CLI命令间接使用了持久化作业,以ASYNC_THROUGH写入类型写入Alluxio时使用持久化作业在后台进行持久化。
该作业负责将Alluxio中的文件持久化到特定的ufs路径中。
驱逐 Evict
fs free CLI命令和后台复制进程间接使用了驱逐作业。
该作业负责从Alluxio中驱逐出特定数量的数据块副本。
移动 Move
复制后台进程使用移动作业将数据块从一个worker移动到另一个worker。
复制 Replicate
后台复制进程使用复制作业将数据块从一个worker复制到特定数量的其他worker上。
巡检命令
作业服务器提供以下一系列的巡检命令。
fsadmin report jobservice
fsadmin report jobservice 会报告作业服务器摘要。
job ls
job ls 会列出正在作业服务器上运行或运行过的作业。
job stat -v <job_id>
job stat -v <job_id> 会列出某个作业的详细信息。(加 -v 表示包含worker上指定任务的信息)
Last updated