Hive

hive tblproperties的常用属性

小樊
81
2024-12-19 14:30:54
栏目: 大数据

Hive中的tblproperties提供了丰富的元数据信息,可以用来设置和获取表的属性。以下是一些常用的tblproperties:

  1. owner:表的所有者。
  2. create_time:表的创建时间。
  3. last_modified_time:表的最后修改时间。
  4. location:表数据的存储路径。
  5. inputformat:表数据的输入格式。
  6. outputformat:表数据的输出格式。
  7. serdeinfo:序列化/反序列化信息,包括serde类型和参数。
  8. columns:表的列信息,包括列名和数据类型。
  9. partitions:表的分区信息,包括分区名和分区数量。
  10. storage_descriptor:表的存储描述符,包括存储格式、位置、输入输出格式等。
  11. view_originaltext:视图的原始文本。
  12. view_expandedtext:视图的扩展文本。
  13. bucketing_version:表的桶版本信息。
  14. numrows:表中的行数。
  15. transient_last_dload_time:表最后一次加载的时间(对于瞬态表)。
  16. max_file_size:表的最大文件大小。
  17. min_row_size:表的最小行大小。
  18. max_row_size:表的最大行大小。
  19. location_quality:表数据存储位置的质量。
  20. replication_factor:表的副本因子。
  21. tbl_stats:表的统计信息,包括行数和大小等。
  22. partition_stats:表的分区统计信息。
  23. collation_type:表的排序规则。
  24. row_format:表的行格式。
  25. field_delimiter:表的字段分隔符。
  26. collection_type:表的集合类型。
  27. serde_parameters:序列化/反序列化的参数。
  28. file_format:表的存储格式,如TextFile、SequenceFile、RCFile等。
  29. compression:表的压缩类型,如NONE、SNAPPY、GZIP等。
  30. num_buckets:表的桶数量。
  31. bucket_col:用于分桶的列名。
  32. bucket_order:分桶顺序,如ASC、DESC等。
  33. storage_policy:表的存储策略。
  34. external:标识表是否为外部表。
  35. transient:标识表是否为瞬态表。
  36. created_by:创建表的用户。
  37. created_at_time:创建表的时间。
  38. last_access_time:表的最后访问时间。
  39. owner_type:表所有者的类型(如USER、ROLE等)。
  40. table_type:表的类型(如MANAGED、EXTERNAL等)。

请注意,这些属性并非全部,Hive还提供了许多其他tblproperties。在使用时,可以根据具体需求选择合适的属性进行设置和获取。

0
看了该问题的人还看了