使用 gpfdist
将数据加载到 Cloudberry Database 中
要将数据从本地主机文件或通过内部网络访问的文件加载到 Cloudberry Database 中,你可以在 CREATE EXTERNAL TABLE
语句中使用 gpfdist
协议。gpfdist
是一个文件服务器实用程序,运行在 Cloudberry Database Coordinator 或备用 Coordinator 之外的主机上。gpfdist
从主机上的一个目录中为 Cloudberry Database Segment 提供文件服务。
使用 gpfdist
服务外部数据时,Cloudberry Database 系统中的所有 Segment 都可以并行读取或写入外部表数据。
支持加载的数据格式有:
- CSV 和 TXT
FORMAT
子句支持的任何分隔文本格式
以下是使用 gpfdist
加载数据的一般步骤:
- 在 Cloudberry Database 的 Coordinator 或备用 Coordinator 之外的主机上安装 gpfdist。请参见安装 gpfdist。
- 在主机上启动 gpfdist。请参见启动和停止 gpfdist。
- 使用
gpfdist
协议创建外部表。请参见使用 gpfdist 与外部表加载数据的示例。