关闭
您正在使用的浏览器版本较低,无法支持聚宽的某些特性。
为了获得更好的体验,推荐使用:
Google Chrome
或者
Mozilla Firefox
或者
IE9以上
。
返回主题列表
【机器学习方法研究】——思路整理、支持向量机
冰柠檬
发布于2016-02-19
回复 18
浏览 22230
103
listen
分享到:
微信
微博
雪球
机器学习方法是计算机科学的一个分支,它借助于计算机算法,对数据进行分析后,实现模式识别,进而实现对未来数据的预测。 机器学习方法可以分为以下几个类别: ####** 1.监督学习:** 训练的输出分类是预先设定好的,根据输入和输出,算法的目标在于寻找其中的对应函数。 ####** 2.无监督学习:** 训练的输出分类是预先不知道的。算法的目标在于发现数据中的结构,如聚类分析。 ####** 3.半监督学习:** 介于监督学习和无监督学习之间。 ####** 4.增强学习:** 算法通过执行一系列的动作,影响环境中的可观察变量,从而得到环境对动作反应的规律。最后根据这个规律,判断该采取何种行动以最大化 某种回报。 监督式学习是机器学习的一个分支,可以通过训练样本而建立起一个输入和输出之间的函数,并以此对新的事件进行预测。 ####** 典型的监督学习流程如下:** ![监督学习流程.png][1] ####** 支持向量机** 是监督学习中一种常用的学习方法。 支持向量机( Support Vector Machines SVM )是一种比较好的实现了结构风险最小化思想的方法。它的机器学习策略是结构风险最小化原则 为了最小化期望风险,应同时最小化经验风险和置信范围)。具体就不详细介绍了,百度有很多资料。 http://scikit-learn.org/stable/modules/svm.html#svm 中是SVM函数和简单介绍。 from sklearn.svm import SVR 可以构造支持向量回归(Support Vector Regression)模型 from sklearn.svm import SVC 可以用于分类(Support Vector Classification) 首先来看支持向量回归(Support Vector Regression)模型如何使用,下面是官网的一个简单例子。 http://scikit-learn.org/stable/auto_examples/svm/plot_svm_regression.html#example-svm-plot-svm-regression-py 下面这是利用官网例子的方法对股票数据进行回归建模,具体代码在研究中 ![下载.png][3] **从回归的角度,我们可以根据之前的历史数据,预测下一个时间点的股价;分类的角度,我们可以根据历史数据,预测下一个时间点股价的正负。** 那么如何在策略中使用呢?一个暴力的方法就是预测未来股价,如果涨了就买入,跌了就卖出。使用SVR进行回归预测,需要预测中未来股价,那么学习这种非平稳、噪声的股价序列难度是很大的。 ----------------- ####** 下面是个人想法,作为引子,欢迎大家一起讨论** ####** 特征选择** 查阅文献发现有各种因子应用到其中, 基本面因子:PE,PB,ROE等 技术指标因子:RSI、KDJ、MA、MACD等 蜡烛图形态因子:三乌鸦、锤子线等 ####** 输出** 股价 股价涨跌分类 未来一段时间收益率 ####** 还有一类用法是利用非监督学习甚至深度学习找到特征** 比如找到大涨的股票,然后看大涨前一段时间的形态有没有相似的,利用非监督学习的方法。这是下面我想进行的第一步研究。 套利是看股价的相关性,比如A和B两个标的价差一向稳定在10块钱,某天价差突然跌到5块钱,统计套利就假设,这个价差会恢复到10块钱,可以就此设计交易策略。如果股价价差真的恢复了,那么就可以实现套利。但是显然,这样的**关系可能不是那么明显地存在于股票的价格中,可能存在于收益曲线中或者方差曲线中,甚至更高复杂度的统计量中**。**深度学习提供了将原数据投影到另一个特征空间中的方法,而且是高度非线性的。那么,原数据中没有体现出来的相关性,会不会在这种高度非线性的投影空间中体现出来呢?** [1]: https://image.joinquant.com/666f741954f67e64ef9e8a0f19fb9e37 [2]: https://image.joinquant.com/b6c19fe4b14e1258ac5b27e777a928cb [3]: https://image.joinquant.com/da7a694a246906c52aa90278bfbcb444
103
listen
分享到:
微信
微博
雪球
评论
kuhn
期待更深入的研究啊。。。。要不要随便选几个因子先研究一下某个股票的股价啊
2016-02-19
冰柠檬
嗯嗯,可以考虑一下。大神有什么因子的建议吗?
2016-02-20
kuhn
我有个想法,可不可以针对某个个股,影响因子首先要包括大盘指数或者板块指数,然后选取某个技术指标测一下看看预测股价效果如何,再选取基本面指标看看预测效果如何。。。。嘿嘿,好像有点麻烦
2016-02-20
冰柠檬
准备先用超买超卖类的指标看看预测效果。各类因子很多,比较难筛选,需要分析一下因子的有效性。。。哎,路途漫漫啊
2016-02-20
sharkblue
正在做这方面的学习,楼主开这个帖子真心是缘分。
2016-02-22
冰柠檬
多多交流讨论,不知大神有什么想法吗?
2016-02-22
sharkblue
单纯的OHLCV因子,实测的效果很差。我尝试加入了几条均线作为因子,结果有改善但还是不佳。之前看过一篇券商的研究报告,是用前30天的收盘价作为输入向量,估算31日的收盘区间,也只有大概60%多的胜率。 是否有办法把SVM的时序预测和别的策略组合的方式,实现更高的胜率。
2016-02-22
冰柠檬
不知可否共享一下券商的研究报告。 我觉得因子的选择最重要,还没有什么好的方式,只是在分析并实验。 一个结合方式是根据预测成功概率,结合仓位控制
2016-02-22
sharkblue
原文找不到了,大概的意思就是把前30天的收盘价,组成一个30维的向量作为输入,第31天的收盘价作为输出来训练SVM. 另外,首先要考虑SVM该如何对时间建模。我看到目前的一些SVM实现,输入向量都未包含时间变量(或时间相关的属性),那又如何来预测时间序列。
2016-02-23
剑齿虎
我个人的看法是市场在大部分时间都是随机的,在少数情况下是有规律的,机器学习通常会拟合所有时间段....所以效果不好.........
2016-06-11
Emacsen
我觉得时间序列还是走各种rnn比较好
2016-09-13
archwolf
时间序列越短,确定性越高,短线确定性高,这就是为什么小赵和孙哥能迅速做大的原因。用分钟的数据预测明天的股价可能更简单。
2017-05-06
stephen_mui
金融时间序列 和 价格一阶序列的相关性进行研究。金融时间序列可以采用指数平滑法 作为简化。 个人观点
2017-06-16
阿秀
你写的东西很好,最近好像不研究量化了啊?
2017-12-17
Andy龙太子
@archwolf小赵和孙哥是谁?做期货的?
2018-03-16
常山之蛇
请问一下这个代码是不是没全啊, 后面预测涨跌的代码在哪儿?我怎么没看到? 谢谢。
2019-10-26
2个布尔
高深,牛呀
2019-12-07
2个布尔
关注你了,似乎基础不错,期待精进。
2019-12-07
您尚未登录,请
登录
或者
注册
聚宽发表回复。
取 消
提 交