更新时间:2023-09-22 12:07:39
封面
版权信息
作者简介
序
1 领域新词语快速获取
1.1 新词语识别和聚类综述
1.2 基于分类网页链接分析的领域新词语发现
1.3 分类新词语分析
1.3.1 词语抽取的准确率与排错处理
1.3.2 抽取词语的新词率
1.3.3 新词语在切分中的作用
1.3.4 新词语的强文本表示功能
小结
参考文献
2 词语分类和词语聚类
2.1 词语分类和词语聚类综述
2.2 基于分类特征提取的词语分类
2.2.1 定义说明
2.2.2 特征提取方法分析
2.2.3 词语表与训练语料介绍
2.2.4 算法实现
2.2.5 实验结果分析
2.2.6 实验结果举例
2.3 基于大规模分类语料库关键词标引的词语聚类[1]
2.3.1 超大规模分类语料库和词语表说明
2.3.2 利用关键词标引确定种子词语
2.3.3 在大规模分类语料库中聚类词语
2.3.4 聚类词语集成
2.3.5 算法实现
2.3.6 实验结果和分析
3 词语计算与辅助汉语教学
3.1 计算机辅助汉语教学综述
3.2 辅助汉语教学的语料库建设
3.3 词语搭配自动获取
3.4 词汇常用度计算
3.5 例句难易度计算
3.6 基于语料库的对外汉语教学用分类词表的研制
3.6.1 分类词表的特点和任务描述
3.6.2 分类词表的研制原理
3.6.3 分类词表的研制流程[1]
3.6.4 几点说明
3.7 面向对外汉语教学的话题聚类研究
3.7.1 报刊阅读与话题课
3.7.2 话题与话题词簇
3.7.3 报刊阅读课现状分析与目标描述
3.7.4 系统实现及结果分析
4 词语主题度计算与自动标引
4.1 词语主题度数学模拟
4.1.1 词语主题度计算的理论基础
4.1.2 词语主题度数学模拟
4.2 基于词语主题度的标引知识自动获取
4.2.2 专家标引的网页关键词获取[1]
4.2.2 关键词主题度计算
4.3 基于词语主题度的文献综合自动标引
4.3.1 文献综合自动标引概述
4.3.2 文献综合自动标引总体流程[4]
4.3.3 关键词文档权重计算
4.3.4 关键词自动标引实现
4.3.5 自动文摘实现
4.3.6 基于关键短语的立体文本分类模型
4.4 文献情报自动标引系统介绍
4.4.1 系统概述
4.4.2 面向的行业类型
4.4.3 功能模块
附录1 网络新闻用层级分类体系
附录2 15大类分类词语表
附录3 244个层级小类分类词语
附录4 聚类种子词语
附录5 聚类词语
附录6 HSK(商务)词语表
后记