关闭
您正在使用的浏览器版本较低,无法支持聚宽的某些特性。
为了获得更好的体验,推荐使用:
Google Chrome
或者
Mozilla Firefox
或者
IE9以上
。
返回主题列表
机器学习,海量数据预测股票的未来趋势,+Model的研究
云海帆
发布于2016-11-22
回复 55
浏览 23181
326
listen
分享到:
微信
微博
雪球
早就有了这个念头,终于找个周末写完了,效果不太好,以后有心情再优化吧,这里做个总结 主要思路: 1. 选取股票池,主要考虑流行的低市值低市盈率的,每个时间段分别取 2. 选取特征,主要选了买盘卖盘,K线,大盘指数等 3. 准备训练数据,做归一化,PCA,剔除相关性,选取主要分量 4. 目标函数是未来20天涨幅超过10%的,回撤小于5%的 5. SVR 分类,训练集准确度90%, 测试集准确度80%,到这里看着还不错啊 6. 简单设定止盈(10%),止损(-5%),开始回测 总结: 1. 准备数据耗时太多,回测会超时。只能在研究里面先准备好训练数据,这里耗费了大量精力. 然后把训练好的模型直接load到回测里面使用 2. 训练数据用的是2014和2015年的,所以这两年的回测结果明显的过拟合+未来函数效应,只能看看2016年的数据,应该不到10%吧,回撤5%左右 3. 每一步的细节不同,结果会大不一样,非常不稳定,感觉模型只学习到了很少的东西,数据量还是太少了。 在这个平台增加数据量和深度学习看来都不太现实 4. 囿于计算量的限制,每天只能从很小的股票池中选择符合预测的标的,这样标的很少,所以成交不活跃,对回撤敏感,这也是效果差的一个原因吧 代码又乱又杂,要是有人有兴趣读的话,找时间整理出来。
326
listen
分享到:
微信
微博
雪球
评论
炎柱
研究呢
2016-11-22
karidayly
效果很不错呀,想知道机器学习的思路,能否加上研究
2016-11-22
云海帆
@karidayly 研究有点多,得花时间整理,明天上吧
2016-11-22
在风中
赞,期待研究,终于有大神写出神级东东
2016-11-22
tom555cat
恭喜迈出了关键一步
2016-11-22
glueman
进来膜拜一下,100多行代码就实现了?我怎么感觉就joinquant所能提供的计算资源而言,机器学习是不太可能或者在能实现的前提下意义并不大……
2016-11-22
nninjia
机器学习已经达到这么小的回撤了,学习学习
2016-11-22
glueman
关键在from MMM_sp import *这句哈,真正的内容在研究文件里呢:)
2016-11-22
tom555cat
"目标函数是未来20天涨幅超过10%的,回撤小于5%的",这个是标记成了1,还是计算成了一个什么值?
2016-11-22
hardy0000
我也是一直在研究机器学习,效果都很一般,没啥思路,可以学习下了。
2016-11-23
幻音
这么牛逼感觉很有未来函数嫌疑啊
2016-11-23
射手摩羯座
关键的在这里from MMM_sp import *
2016-11-23
tom555cat
2015年部分是包含训练测试数据的,增长比较好看,2016年是新的数据,增长就一般了@幻音
2016-11-23
云海帆
@幻音 请抬头看总结,训练数据是14和15年的,要是不牛逼就是Bug了
2016-11-23
兰花生
只选择最重要的五个影响因素建模,然后用前三个月的数据训练,每组参数跑2周然后再矫正试试看。
2016-11-23
云海帆
@兰花生 多谢建议。我想如果只选5个,可能会出现高度相关性,PCA的时候就抵消了。我觉得这算法需要海量数据和大量feature
2016-11-23
zxcvbn
顶
2016-11-23
hardy0000
训练数据 能提供一份嘛?感觉是不是有未来函数啊,15年预测16年都能这么准?
2016-11-24
云海帆
@hardy0000 放大之后16年的曲线并不好看,要有有未来函数就不是这样的了。训练数据我一会贴上来
2016-11-24
hardy0000
@云海帆 我想在我这边模拟下,NameError: global name 'load_pickle' is not defined 好像没定义 load_pickle 函数啊。是不是要自己定义下?
2016-11-24
首页
上一页
1
2
3
下一页
尾页
您尚未登录,请
登录
或者
注册
聚宽发表回复。
取 消
提 交