上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1 领域新词语快速获取
本章在简要回顾新词语识别和聚类的基础上,介绍了一种简便快捷的新词语发现和领域聚类的新方法。该方法直接抽取分类网页上人工标引的“关键词”和其他词语信息,并按照该网页栏目的对应类别将新词语分类,同时达到了新词语识别和领域聚类的目的。最终从15类6亿字的语料中抽取出约18万条分类新词语,并分析了这些新词语的特点及其在语言信息处理中的应用。
本章在简要回顾新词语识别和聚类的基础上,介绍了一种简便快捷的新词语发现和领域聚类的新方法。该方法直接抽取分类网页上人工标引的“关键词”和其他词语信息,并按照该网页栏目的对应类别将新词语分类,同时达到了新词语识别和领域聚类的目的。最终从15类6亿字的语料中抽取出约18万条分类新词语,并分析了这些新词语的特点及其在语言信息处理中的应用。