基于股评信息的个股投资者情绪指数与股票市场的关系研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 研究思路、研究内容与研究方法

1.3.1 研究思路

本书首先通过文本挖掘技术爬取东方财富网股吧论坛中中证500指数成分股500家上市公司的帖子文本信息、发帖量、帖子评论量、帖子点击量等股评信息数据,然后对文本信息进行分词处理以生成情感词典,运用LSTM模型对股吧论坛帖子进行情绪分类,进而构建个股投资者情绪指数;其次以个股投资者情绪指数和股票收益率、股票波动率为研究对象建立面板向量自回归模型,探讨个股投资者情绪与股票收益率和波动率的关系;再次进一步探讨不同市值、不同行业、不同市态以及不同换手率情况下,个股投资者情绪与股票收益率和波动率关系的异质性;最后将个股投资者情绪指数作为选股因子引入选股模型中,通过年化收益率、夏普比率、最大回撤等评价指标评估和论证该因子对选股策略的优化作用。

本书的研究路线如图1.4所示。

图1.4 本书的研究路线

1.3.2 研究内容

本书包括8个章节,具体如下:

第1章是绪论。本章首先介绍了我国股票市场的发展状况,分别对上证指数、深证成指和创业板指数的收益率和波动情况进行了分析;其次介绍了本书的研究背景和意义、研究思路、研究内容、研究方法以及创新与不足。

第2章是相关概念和理论基础。本章主要包括投资者情绪的定义、投资者情绪相关理论、投资者情绪指数构建的方法梳理和相关理论,以及本书实证部分所用到的面板向量自回归模型介绍。

第3章是文献综述。本章主要从投资者情绪指数的定义和构建、投资者情绪与股票收益率的关系、投资者情绪与股票波动率的关系以及选股策略4个方面进行阐述。

第4章是个股投资者情绪指数的构建。首先,介绍了个股投资者情绪指数的构建思路;其次,通过文本挖掘技术爬取东方财富网股吧论坛中中证500指数成分股500家上市公司的帖子文本信息、发帖量、帖子评论量、帖子点击量等股评信息数据,然后对文本信息进行分词处理以生成情感词典,运用LSTM模型对股吧论坛帖子进行情绪分类,选取帖子评论量数据代替阅读量来反映信息强度,进而构建个股投资者情绪指数;最后,随机选取10只股票结合实际市场状况对个股投资者情绪指数的有效性进行分析。

第5章是个股投资者情绪指数与股票收益率的关系研究。首先,基于个股投资者情绪与股票收益关系进行理论分析并提出假设;其次,以个股投资者情绪指数和股票收益率为研究对象建立面板向量自回归模型,探讨个股投资者情绪指数与股票收益率的关系;最后,进一步探讨不同市值、不同行业、不同市态情况下个股投资者情绪与股票收益率关系的异质性。

第6章是个股投资者情绪指数与股票波动率的关系研究。首先,基于个股投资者情绪与股票波动关系进行理论分析并提出假设;其次,以个股投资者情绪指数和股票波动率为研究对象建立面板向量自回归模型,探讨个股投资者情绪指数与股票波动率的关系;最后,进一步探讨不同市值、不同市态、不同换手率情况下个股投资者情绪指数与股票波动率关系的异质性。

第7章是个股投资者情绪指数在选股策略中的应用。首先,选取30个指标作为选股因子,然后对选股因子进行初步筛选,并剔除相关性高的冗余因子;其次,基于Logistic回归构建选股模型并构建交易策略;最后,对选股策略进行回测分析,并将其与未引入个股投资者情绪指数因子的选股模型进行比较,衡量和评价个股投资者情绪指数是否可以优化投资策略。

第8章是结论、展望及建议。本章主要总结以上各章的结论,说明本书的局限性和展望,并对金融市场监管者和中小投资者提出相关的建议。

1.3.3 研究方法

本书在进行分析时主要运用以下方法。

1)文本分析法

利用网络爬虫技术对本书所需的网页信息进行抓取,通过计算机语言借助长短期记忆模型(LSTM)对网络文本进行语义分析,判定信息发布者的情绪倾向,将文本情绪量化为数据,抽取文本高层语义信息,提高对文本情绪判断的有效性。

2)文献研究法

研读大量国内外相关文献,了解投资者情绪指数的构建以及投资者情绪与股票收益率和波动率相互关系研究的相关理论和方法,运用文献研究法掌握投资者情绪的定义、构建方法,梳理测度投资者情绪的各类指标,以及其与股票收益率和股票波动率的相互作用机制。

3)定性分析法和定量分析法

本书将两种方法相结合,对个股投资者情绪指数和股票收益率、波动率等指标间的关系和作用原理进行定性分析,并借助MATLAB、STATA等统计分析软件进行定量研究。

4)实证分析法

在个股投资者情绪指数与股票收益率、股票波动率的关系研究中,本书运用了单位根检验、协整检验、面板向量自回归模型、GMM估计和格兰杰因果关系检验等一系列方法进行实证分析以得出相关实证结论。