Hive支持复杂数据类型,包括STRUCT、ARRAY、MAP和UNIONTYPE。以下是如何在Hive中定义这些复杂数据类型的示例:
STRUCT:
CREATE TABLE employee (
id INT,
name STRING,
address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
在这个例子中,我们创建了一个名为employee的表,其中包含一个名为address的复杂字段,该字段是STRUCT类型,包含street、city、state和zip四个子字段。
ARRAY:
CREATE TABLE products (
id INT,
name STRING,
categories ARRAY<STRING>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
在这个例子中,我们创建了一个名为products的表,其中包含一个名为categories的复杂字段,该字段是ARRAY类型,包含多个STRING类型的元素。
MAP:
CREATE TABLE product_sales (
product_id INT,
product_name STRING,
sales_info MAP<STRING, INT>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
在这个例子中,我们创建了一个名为product_sales的表,其中包含一个名为sales_info的复杂字段,该字段是MAP类型,包含多个STRING到INT的键值对。
UNIONTYPE:
CREATE TABLE employee_types (
id INT,
name STRING,
job_type UNIONTYPE<ENGINEER, SALES, MANAGER>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
在这个例子中,我们创建了一个名为employee_types的表,其中包含一个名为job_type的复杂字段,该字段是UNIONTYPE类型,可以是ENGINEER、SALES或MANAGER三种类型之一。