互联网中Pig是什么

发布时间:2021-12-16 10:38:13 作者:小新
来源:亿速云 阅读:226

这篇文章给大家分享的是有关互联网中Pig是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

        Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig    Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

        Pig特点:

            1、专注于大量数据分析(ad-hoc analysis,ad-hoc代表:a solution that has been custom designed for a specific problem).

            2、运行在集群的计算架构上,Yahoo Pig提供了多层抽象,简化并行计算让普通用户使用;这些抽象完成自动把用户请求queries翻译成有效的并行评估计划,然后在物理集群上执行这些计划;

            3、提供类似SQL的操作语法;

            4、开放源代码;

        关于Pig与Hive:

                对于开发人员,直接使用Java APIS可能是乏味或容易出错的,同时也限制了Java程序员在Hadoop上编程的运用灵活性。于是Hadoop提供了2个解决方案,使得Hadoop编程变得更加容易。

                Pig是一种编程语言,它简化了Hadoop常见的工作任务,Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件),同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换.

                Hive是Hadoop中扮演数据仓库的角色.Hive添加数据的结构在HDFS(hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询,与Pig一样,Hive的核心功能是可扩展的.

                Pig和Hive总是令人困惑的.Hive更适合于数据仓库的任务,Hive主要用于静态的结构以及需要经常分析的工作。Hive与SQL相识促使其成为Hadoop与其他BI工具结合的理想交集。Pig富裕开发人员在大数据集领域更多的灵活性,并允许开发简洁的脚本用于转换数据流以便嵌入到较大的应用程序。Pig相比Hive相对轻量,它主要的优势是相比于直接使用Hadoop Java Apis可大幅消减代码量。正因为如此,Pig仍然是吸引大量的软件开发人员。

感谢各位的阅读!关于“互联网中Pig是什么”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

推荐阅读:
  1. Pig读写HBase数据
  2. 安装Pig

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

互联网 pig

上一篇:​Numpy中怎么实现PCA

下一篇:Linux sftp命令的用法是怎样的

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》