使用Hive读取CSV文件可以通过以下步骤实现:
创建一个外部表来定义CSV文件的模式。例如,假设CSV文件名为data.csv
,包含的列有col1
和col2
,可以使用以下命令创建外部表:
CREATE EXTERNAL TABLE csv_table (
col1 STRING,
col2 INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
LOCATION '/path/to/csv/file';
其中,LOCATION
指定了CSV文件的路径,可以是本地文件系统路径或者HDFS路径。
使用SELECT
语句从外部表中读取数据。例如:
SELECT col1, col2 FROM csv_table;
这样就可以读取CSV文件中的数据。
注意事项:
FIELDS TERMINATED BY ','
指定分隔符。