版本：2.x

数据加载概览

Apache Cloudberry 主要通过加载工具将外部数据转换为外部表来加载数据。然后从这些外部表中读取数据，或将数据写入外部表中，以此实现外部数据加载。

数据加载流程

加载数据进入 Apache Cloudberry 的一般流程如下：

Apache Cloudberry 提供了多种数据加载解决方案，你可以根据不同的数据源选择不同的数据加载方法。

加载方法	数据源	数据格式	是否并行
`copy`	本地文件系统 • Coordinator 节点主机（对于单文件） • Segment 节点主机（对于多文件）	• TXT • CSV • 二进制	否
`file://` 协议	本地文件系统（本地 Segment 主机，仅超级用户可访问）	• TXT • CSV	是
`gpfdist`	本地主机文件或者通过内网可访问的文件	• TXT • CSV • `FORMAT` 子句支持的任意分隔文本格式 • XML 和 JSON（需要通过 YAML 配置文件转换为文本格式）	是
使用 `gpload` 批量加载（使用 `gpfdists` 为底层工作组件）	本地主机文件或者可通过内网访问的文件	• TXT • CSV • `FORMAT` 子句支持的任意分隔文本格式 • XML 和 JSON（需要通过 YAML 配置文件转换为文本格式）	是
创建外部 Web 表	从网络服务或可通过命令行访问的任意来源提取的数据	• TXT • CSV	是
Kafka FDW	从 Apache Kafka 流式加载数据	• JSON • CSV	否