Python使用impala包连接hive报错怎么解决

发布时间:2021-12-27 10:43:49 作者:iii
来源:亿速云 阅读:320

本篇内容介绍了“Python使用impala包连接hive报错怎么解决”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

由于是内网测试环境,没有外网,自然就先在本地用conda创建python虚拟环境,安装好所有需要的包再移过去。

一顿操作猛如虎,各种坑都填好了,然后发现impala.util中的as_pandas起不动,原因是其依赖的pandas起不动,归根结底是pandas依赖的numpy import报错:

ImportError: Something is wrong with the numpy installation. 
While importing we detected an older version of numpy in 
['/.../anconda3/lib/site-packages/numpy']. 
One method of fixing this is to repeatedly uninstall numpy 
until none is found, then reinstall this version.
 

定位问题是卡在numpy源码中的__init__.py这一段:

if not (hasattr(multiarray, '_multiarray_umath') and
        hasattr(umath, '_multiarray_umath')):
    import sys
    path = sys.modules['numpy'].__path__
    msg = ("Something is wrong with the numpy installation. "
        "While importing we detected an older version of "
        "numpy in {}. One method of fixing this is to repeatedly uninstall "
        "numpy until none is found, then reinstall this version.")
    raise ImportError(msg.format(path))
 

奇怪的是导入version是正常的,显示目前的numpy版本是1.19.4

from numpy.version import version as __version__
print(__version__)
 

报错信息中的建议是先完整卸载numpy,然后重装。网上看遍了解决办法,也都是如此。

秉承着匠人程序员精神,一定要追根溯源,另辟蹊径解决问题!

对不起,调子起高了,其实是内网环境太不方便了。

既然报错信息说了有older version的numpy,想办法把它清理干净不就行了吗?

先来看看到底之前装了什么老版本的numpyPython使用impala包连接hive报错怎么解决

这就奇怪了,.../lib/site-packages目录下1.14.3版的手动删除过了,怎么还有呢?看样子还有残存,翻一下...\Anaconda3\conda-metaPython使用impala包连接hive报错怎么解决

果然发现1.14.3的信息,delete这几项再运行一下conda list numpy,显示只有最新版的version了,666~

Python使用impala包连接hive报错怎么解决  

再次import numpy,依然是最初的报错。。。难道还有older version余孽?

Python使用impala包连接hive报错怎么解决  

解决问题还是要回归本源,咱们看一下import的原理:

对于python来说,所有被加载到内存的模块都是放在sys.modules里面,所以执行import时会首先去该列表中查询是否已添加。如果已经在sys.modules中,那就简单了,只需要将该module的name添加到我们正在调用该module的本地空间中。如果还没有放在sys.modules中,就需要在sys.path所有路径的目录中去按顺序查找该模块的文件,这些文件一般后缀为".py"、".pyo"、".pyc"、".pyd"、".dll",找到这些模块后就可以将这些模块添加到sys.modules中,再将module name导入到本地。

所以很有可能是在导入numpy时新老版本在sys.modules中撞车了?

先查看一下modules里都有什么:

import sys
sys.modules
 

Python使用impala包连接hive报错怎么解决

元凶终于找到了


赶紧跑去..\Anaconda3\Lib\site-packages\numpy\core__pycache 目录下把这些pyd文件删除!!!

Python使用impala包连接hive报错怎么解决  
Python使用impala包连接hive报错怎么解决    

“Python使用impala包连接hive报错怎么解决”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

推荐阅读:
  1. 解决python连接mysql报错问题
  2. 0039-如何使用Python Impyla客户端连接Hive和Impala

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python impala hive

上一篇:Mapreduce shuffle的示例分析

下一篇:TCP协议是什么

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》