Hive中如何配置与编写自定义UDF函数

发布时间:2021-12-10 14:08:16 作者:小新
来源:亿速云 阅读:297

小编给大家分享一下Hive中如何配置与编写自定义UDF函数,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

环境介绍:CentOS7+hive-1.1.0-cdh6.7.0+IntelliJ IDEA+Maven3.3.9
1、创建工程
   打开IntelliJ IDEA
     File-->New-->Project...-->Maven选择Create from archetye-->org.apache.maven.archety:maven-archetype-quitkstart

2、配置
  2.1、增加内容如下:
   在工程中找到pom.xml文件中hadoop-common 、hive-exec 、hive-jdbc

点击(此处)折叠或打开

  1. <properties>

  2.     <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>



  3.     <!-- hadoop、hive版本信息 -->

  4.     <hadoop.version>2.6.0-cdh6.7.0</hadoop.version>

  5.     <hive.version>1.1.0-cdh6.7.0</hive.version>

  6.   </properties>



  7.     <!-- hadoop依赖 -->

  8.     <dependency>

  9.       <groupId>org.apache.hadoop</groupId>

  10.       <artifactId>hadoop-common</artifactId>

  11.       <version>${hadoop.version}</version>

  12.     </dependency>



  13.     <!-- hive依赖 -->

  14.     <dependency>

  15.       <groupId>org.apache.hive</groupId>

  16.       <artifactId>hive-exec</artifactId>

  17.       <version>${hive.version}</version>

  18.     </dependency>

  19.   </dependencies>

  20.   

  21.   <!-- cdn资源仓库 -->

  22.   <repositories>

  23.     <repository>

  24.       <id>cloudera</id>

  25.       <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>

  26.     </repository>

  27.   </repositories>

  2.2、在<repository></repository>中修改内容如下:

点击(此处)折叠或打开

  1. <dependency>

  2.       <groupId>junit</groupId>

  3.       <artifactId>junit</artifactId>

  4.       <version>4.10</version>

  5.       <scope>test</scope>

  6.     </dependency>

3、创建类,并编写一个UDF HelloUDF.java,代码如下:

点击(此处)折叠或打开

  1. package org.apache.hadoop.hive.ql.udf;



  2. import org.apache.hadoop.hive.ql.exec.UDF;

  3. import org.apache.hadoop.io.Text;



  4. public class HelloUDF extends UDF {

  5.     public Text evaluate(Text input) {

  6.         return new Text("Hello:" + input);

  7.     }



  8.     public static void main(String args[]){

  9.         HelloUDF helloUDF = new HelloUDF();

  10.         Text rs = helloUDF.evaluate(new Text("zhangsan"));

  11.         System.out.println(rs.toString());

  12.     }

  13. }

4、测试UDF类,在上又键选择Run 'HelloUDF.main()'

5、打包:
   在IDEA菜单中选择view-->Tool Windows-->Maven Projects,然后在Maven Projects窗口中选择【工程名】-->Lifecycle-->package,在package中右键选择Run Maven Build开始打包
   执行成功后在日志中找:
     [INFO] Building jar: D:\software\ruozedata_workspace\basic02-hive\target\hive-1.0.jar

以上是“Hive中如何配置与编写自定义UDF函数”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

推荐阅读:
  1. hive编译源码支持自定义UDF函数
  2. hive使用UDF函数

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

hive udf

上一篇:Hadoop中怎么配置SSH免密码登录

下一篇:Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》