上QQ阅读APP看书,第一时间看更新
5.1.2 简易特征工程
下面我们给原始的数据增加两个新的字段,其中一个是up_or_down,用来表示当日股价是上涨还是下跌。如果change_pct(涨幅)这个字段为正数,说明股价上涨,则up_or_down用1来表示,反之,用0表示,代表当日股价下跌。
类似地,我们用money_in_out字段表示主力资金净流入还是净流出。如果net_amount_main大于0,说明主力资金净流入,则在money_in_out字段用1表示;反之说明主力资金净流出,money_in_out字段用0表示。示例代码如下:
运行代码,会得到如表5.2所示的结果。
表5.2 添加两个新字段的数据
【结果分析】在表5.2中可以看到,新的两个字段添加成功。例如,在2018年4月11日,股价上涨,up_or_down字段中的数值是1;同时当天主力资金净流出,故money_in_out字段中的数值是0。又如,在2018年4月12日,当日股价下跌,up_or_down字段中的数值为0;因为这一天主力资金净流入,所以money_in_out字段中的数值为1。如果读者朋友也得到了类似的结果,说明这个简单的特征工程成功了。