Hive Metastore 本身并不直接进行数据清洗,而是存储和管理数据的元数据。数据清洗通常在数据被加载到 Hive 数据库之前或之后,通过 Hive SQL 脚本或其他数据处理工具进行。以下是一些在 Hive 环境中进行数据清洗的常见方法:
DROP
填充
插值
删除
替换
修正
合并
标记