400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
400-800-0824
info@ymatrix.cn
YMatrix 文档
集群部署
SQL参考
工具指南
本文档介绍 PXF 相关的常见问题。
PXF 部署后,访问 HDFS 报错:
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
解决方案
pxf/servers/core-site.xml和hdfs-site.xml
一定要和 Hadoop 配置文件相同。pxf/servers/core-site.xml
配置用户访问权限。pxf/core-site.xml
指定的一致。解决方案
escape 'off'
。format 'text:multi'
。可以的。
前提条件
PXF 可以正常访问 S3。
解决方案
复制 aa.csv
文件并命名为 ab.csv
上传到 bucket ymatrix 文件路径为 ymatrix/test
目前 ymatrix/test
有文件 aa.csv
、ab.csv
数据条数均为 1000条。
DROP FOREIGN TABLE public.chen_test ;
CREATE FOREIGN TABLE public.chen_test (
c1 text,
c2 text,
c3 text
)
SERVER s3server_online
OPTIONS (
format 'csv',
resource 'ymatrix/test/a*.csv',
JSONIFY_ARRAY 'TRUE',
JSONIFY_MAP 'TRUE',
JSONIFY_RECORD 'TRUE'
);
SELECT count(*) FROM chen_test ;
count
-------
2000
(1 row)
使用通配符 *
可以递归目录下的所有子目录的所有文件。
注意!
使用通配符可以匹配到的文件,文件格式必须一致,否则会报错。
可以的。
TEXT
,CSV
,PARQUET
,JSON
格式的文件在被 PXF 读取时,会按照 128MB
一片的尺寸自动切片,并按照分片由相应 Segment 并行读取。