Hive中的tblproperties提供了丰富的元数据信息,可以用来设置和获取表的属性。以下是一些常用的tblproperties:
- owner:表的所有者。
- create_time:表的创建时间。
- last_modified_time:表的最后修改时间。
- location:表数据的存储路径。
- inputformat:表数据的输入格式。
- outputformat:表数据的输出格式。
- serdeinfo:序列化/反序列化信息,包括serde类型和参数。
- columns:表的列信息,包括列名和数据类型。
- partitions:表的分区信息,包括分区名和分区数量。
- storage_descriptor:表的存储描述符,包括存储格式、位置、输入输出格式等。
- view_originaltext:视图的原始文本。
- view_expandedtext:视图的扩展文本。
- bucketing_version:表的桶版本信息。
- numrows:表中的行数。
- transient_last_dload_time:表最后一次加载的时间(对于瞬态表)。
- max_file_size:表的最大文件大小。
- min_row_size:表的最小行大小。
- max_row_size:表的最大行大小。
- location_quality:表数据存储位置的质量。
- replication_factor:表的副本因子。
- tbl_stats:表的统计信息,包括行数和大小等。
- partition_stats:表的分区统计信息。
- collation_type:表的排序规则。
- row_format:表的行格式。
- field_delimiter:表的字段分隔符。
- collection_type:表的集合类型。
- serde_parameters:序列化/反序列化的参数。
- file_format:表的存储格式,如TextFile、SequenceFile、RCFile等。
- compression:表的压缩类型,如NONE、SNAPPY、GZIP等。
- num_buckets:表的桶数量。
- bucket_col:用于分桶的列名。
- bucket_order:分桶顺序,如ASC、DESC等。
- storage_policy:表的存储策略。
- external:标识表是否为外部表。
- transient:标识表是否为瞬态表。
- created_by:创建表的用户。
- created_at_time:创建表的时间。
- last_access_time:表的最后访问时间。
- owner_type:表所有者的类型(如USER、ROLE等)。
- table_type:表的类型(如MANAGED、EXTERNAL等)。
请注意,这些属性并非全部,Hive还提供了许多其他tblproperties。在使用时,可以根据具体需求选择合适的属性进行设置和获取。