在spaCy中,可以使用similarity
方法来计算两个文本之间的相似度(文本距离)。以下是一个示例代码:
import spacy
# 加载预训练的模型
nlp = spacy.load("en_core_web_sm")
# 创建两个文本
text1 = "apple"
text2 = "banana"
# 处理文本
doc1 = nlp(text1)
doc2 = nlp(text2)
# 计算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)
在上面的示例中,我们加载了英文的预训练模型en_core_web_sm
,然后创建了两个文本text1
和text2
,并将它们分别处理为spaCy文档对象doc1
和doc2
。最后,我们使用similarity
方法计算了这两个文本之间的相似度,并打印输出结果。
请注意,文本相似度的值范围在0到1之间,值越接近1表示文本越相似。