客户端 API
Alluxio 提供了多种接口供应用程序访问数据,确保与各种现有工具和框架的兼容性。
核心数据访问 API
Alluxio 为应用程序和用户提供了多种与所管理数据交互的方式:
通过 FUSE 的 POSIX API:将 Alluxio 挂载为本地文件系统,允许任何应用程序或命令行工具(
ls、cat、cp)使用标准文件操作与 Alluxio 交互。这是与现有应用程序无缝集成的最常用方法,尤其适用于 ML/AI 训练工作负载。S3 API:公开一个与 S3 兼容的端点,允许使用 AWS S3 SDK(如 Python 的
boto3或 Java S3 客户端)构建的应用程序连接到 Alluxio。这对于已经与 S3 集成的数据科学和 ML 工作负载是理想选择。通过 FSSpec 的 Python API:为使用 Pandas、PyArrow 和 Ray 等库的开发人员提供的 Pythonic 文件系统接口(
alluxiofs)。它提供了一种在 Python 生态系统内与 Alluxio 进行原生高效交互的方式。虚拟路径映射:使用正则表达式规则将虚拟路径映射到物理 UFS 路径,实现路径抽象和多租户命名空间隔离,无需更改应用程序代码。
Last updated