400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
YMatrix 文档
关于 YMatrix
标准集群部署
数据写入
数据迁移
数据查询
运维监控
参考指南
工具指南
数据类型
存储引擎
执行引擎
系统配置参数
SQL 参考
常见问题(FAQ)
本文档介绍 PXF 相关的常见问题。
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
PXF 部署后,访问 HDFS 报错:
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
解决方案
PXF 访问文件的方式需要在 Master 节点开启 PXF server,但是数据文件需要在 Segment PXF 上。
pxf/servers/core-site.xml和hdfs-site.xml
一定要和 Hadoop 配置文件相同。
pxf/servers/core-site.xml
配置用户访问权限。
Hadoop 上文件的用户名和组需要和 pxf/core-site.xml
指定的一致。
解决方案
在选项里加入 escape 'off'
。
使用 format 'text:multi'
。
可以的。
前提条件
PXF 可以正常访问 S3。
解决方案
复制 aa.csv
文件并命名为 ab.csv
上传到 bucket ymatrix 文件路径为 ymatrix/test
目前 ymatrix/test
有文件 aa.csv
、ab.csv
数据条数均为 1000条。
DROP FOREIGN TABLE public.chen_test ;
CREATE FOREIGN TABLE public.chen_test (
c1 text,
c2 text,
c3 text
)
SERVER s3server_online
OPTIONS (
format 'csv',
resource 'ymatrix/test/a*.csv',
JSONIFY_ARRAY 'TRUE',
JSONIFY_MAP 'TRUE',
JSONIFY_RECORD 'TRUE'
);
SELECT count(*) FROM chen_test ;
count
-------
2000
(1 row)
使用通配符 *
可以递归目录下的所有子目录的所有文件。
注意!
使用通配符可以匹配到的文件,文件格式必须一致,否则会报错。
可以的。
TEXT
,CSV
,PARQUET
,JSON
格式的文件在被 PXF 读取时,会按照 128MB
一片的尺寸自动切片,并按照分片由相应 Segment 并行读取。