在前面介绍组件的时候,我们看到了很多Rasa组件。这些组件组合在一起有非常多的可能。那么哪一种组合适合我们的中文开发者呢?我们推荐一种流水线配置。
上述流水线使用了基于BERT的语言模型和架构,性能非常优秀。值得说明的是,这里使用了JiebaTokenizer作为分词器。分词结果可能和实体边界产生冲突,从而触发misaligned entity annotation错误。我们将在第9章介绍来自社区的BERT分词组件,可以完美解决这个难题。