jieba库分词模式怎么在Python项目中使用

发布时间：2021-01-14 14:37:49 作者：Leah
来源：亿速云阅读：219

这篇文章将为大家详细讲解有关 jieba库分词模式怎么在Python项目中使用，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。

全模式：

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式：

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式：

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式：" + "/ ".join(seg_list))
print("精确模式：" + "/ ".join(seg_list1))
print("搜索引擎模式：" + "/ ".join(seg_list2))

输出结果：

全模式：南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。
精确模式：南京市/ 长江大桥/ 欢迎/ 你/ 。
搜索引擎模式：南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展：

获取词性

我们还可以通过jiaba这个库把词性进行区分，比如动词，名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

关于 jieba库分词模式怎么在Python项目中使用就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

jieba库分词模式怎么在Python项目中使用

精确模式：

搜索模式：

相关阅读