在Hive中,可以使用正则表达式函数regexp_extract_all
来提取数据中的所有数字。
例如,假设有一个名为data
的表,包含一个名为text
的列,里面存储了一些文本数据,其中包含数字。可以使用以下方法来提取所有数字:
SELECT regexp_extract_all(text, '[0-9]+') AS numbers
FROM data;
上述语句将提取text
列中的所有数字,并将其数组返回。如果想要每个数字单独的行返回,可以使用explode
函数:
SELECT explode(regexp_extract_all(text, '[0-9]+')) AS number
FROM data;
这样将会返回每个数字作为一行的结果集。