TextBlob是一个Python库,它提供了一种简单的方法来进行文本分析和自然语言处理。虽然TextBlob主要支持英文文本分析,但是可以通过使用Google Translate API来实现跨语言关键词提取。下面是一个简单的示例代码,演示如何使用TextBlob和Google Translate API进行跨语言关键词提取:
```python
from textblob import TextBlob
from googletrans import Translator
def translate_text(text, dest_lang='en'):
translator = Translator()
translated_text = translator.translate(text, dest=dest_lang)
return translated_text.text
def extract_keywords(text, lang='en'):
translated_text = translate_text(text, lang)
blob = TextBlob(translated_text)
return blob.noun_phrases
if __name__ == '__main__':
text = "这是一个简单的示例代码用于跨语言关键词提取"
keywords = extract_keywords(text, lang='zh-cn')
print(keywords)
```
在这个示例中,我们首先定义了一个`translate_text`函数,它使用Google Translate API来将文本翻译为指定的目标语言。然后定义了一个`extract_keywords`函数,它将文本翻译为英文,然后使用TextBlob来提取名词短语作为关键词。最后,我们通过调用`extract_keywords`函数来提取关键词并打印输出。
需要注意的是,由于Google Translate API是付费的,需要在使用之前配置好API密钥。同时,由于Google Translate API有访问次数限制,建议在大批量处理文本时注意限制请求频率。