您好,登录后才能下订单哦!
密码登录
登录注册
点击 登录注册 即表示同意《亿速云用户服务条款》
这篇文章将为大家详细讲解有关 jieba库分词模式怎么在Python项目中使用,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
全模式:
import jieba seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True) print(type(seg_list),seg_list)
seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False) print(type(seg_list1),seg_list1)
seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。") print(type(seg_list2),seg_list2) print("全模式:" + "/ ".join(seg_list)) print("精确模式:" + "/ ".join(seg_list1)) print("搜索引擎模式:" + "/ ".join(seg_list2))
输出结果:
全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。
精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。
搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。
内容扩展:
获取词性
我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等
import jieba.posseg as psg seg_list = psg.cut("我要进行关键词提取") print([(s.word, s.flag) for s in seg_list]) # [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]
我们还可以提取动词或者名词,我们来提取下里面的动词
import jieba.posseg as psg seg_list = psg.cut("我要进行关键词提取") print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])
关于 jieba库分词模式怎么在Python项目中使用就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。