NLTK库可以通过使用align_words函数对文本进行对齐。以下是一个示例代码:
from nltk.translate import AlignedSent
from nltk.translate import Alignment
src_words = ['I', 'saw', 'the', 'man']
tgt_words = ['Je', 'ai', 'vu', 'l', 'homme']
alignment = Alignment([(0, 0), (1, 1), (2, 2), (3, 3)])
aligned_sent = AlignedSent(src_words, tgt_words, alignment)
print(aligned_sent.words)
print(aligned_sent.mots)
print(aligned_sent.alignment)
在这个示例中,我们创建了一个包含源语言单词列表和目标语言单词列表的AlignedSent对象,然后打印出对齐后的结果。您也可以使用Alignment()函数来指定单词之间的对应关系,以生成自定义的对齐结果。