python获取NLPIR网站数据

发布时间:2020-07-17 16:10:12 作者:wx5d72071a58c07
来源:网络 阅读:269

有个自然语言处理的人工智能网站特别有意思,还能快速生成可视化图表,推荐给大家:http://ictclas.nlpir.org/nlpir/
如何爬取这个网站隐藏在背后的数据呢?
我这里演示一下联想词数据的爬取:

import requests,json

content=str(input('请输入要查询的文本:'))
url='http://ictclas.nlpir.org/nlpir/index6/getWord2Vec.do'
headers={
    'Referer': 'http://ictclas.nlpir.org/nlpir/',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
data={
    'content': content
}
res=requests.post(url,headers=headers,data=data)

res_dic=json.loads(res.text)
w2vlist=res_dic['w2vlist']
for i in range(10):
    word=w2vlist[i]
    print(word)

这个网站的可视化功能也很强大,一键生成美丽图表~
这是快速生成词云图,用python的话比较麻烦一些,好处是可以进行个性化修改。如果没有太高要求的话,nlpir网站完全可以胜任:
python获取NLPIR网站数据
还有很多可视化图表,小伙伴们可以去尝试一下:
python获取NLPIR网站数据

推荐阅读:
  1. XmlHttp异步如何获取网站数据
  2. 利用Python怎么获取弹幕数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python爬虫 网站数据 lp

上一篇:搭建Babel运行环境,Traceur ES6模板,块级作用域,let和const命令

下一篇:Linux下如何实现mysql异地自动备份

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》