更新时间:2024-05-14 11:05:49
封面
版权信息
内容简介
前言
第1章 文本特征表示
1.1 语料与语料预处理
1.2 文本特征表示方法
1.3 词向量的评判标准
1.4 本章小结
第2章 内容重复理解
2.1 标题重复
2.2 段落重复识别实例
2.3 基于相似度计算的文章判重
2.4 本章小结
第3章 内容通顺度识别及纠正
3.1 数据增强
3.2 基于FastText算法的句子通顺度识别
3.3 基于TextCNN算法的分类任务实现
3.4 基于TextRNN算法的分类任务实现
3.5 基于Seq2Seq模型的纠正策略
3.6 本章小结
第4章 内容质量
4.1 GBDT算法
4.2 XGBoost算法
4.3 知识问答质量体系的搭建
4.4 本章小结
第5章 标签体系构建
5.1 标签体系
5.2 TF-IDF算法
5.3 PageRank算法
5.4 TextRank算法
5.5 本章小结
第6章 文本摘要生成
6.1 文本摘要相关介绍
6.2 基于无监督的抽取式文本摘要
6.3 基于有监督的抽取式文本摘要
6.4 基于深度神经网络的生成式文本摘要
6.5 文本摘要常用数据集
6.6 文本摘要评价方法
6.7 本章小结
第7章 文本纠错
7.1 错误来源及类型
7.2 文本纠错的3种传统方法
7.3 文本纠错深度学习方法
7.4 工业界解决方法
7.5 文本纠错工具
7.6 本章小结
推荐阅读
作者简介
文后