曹经伟 发布于2020-11-19
回复 29
浏览 3124
34
炒股有很多种方式,我们这里仅限于讨论如何用统计学(包括概率)来炒股。我们只谈原理和形象解释,不涉及复杂的公式,避开有争议的地方。同时,我们暂不涉及做空(融券),因为它风险高,难度大,以后再专门阐述。
从理论上说,90%以上的技术指标本质上都是简单的求平均值(如MA、BOLL、KDJ、RSI、ROC等)或标准差(如ATR、EA等),这其实是统计学中很小的一部分。如果只是单纯地使用技术指标,只不过用了统计学的皮毛而已。
股票的价格,随着时间的推移,形成了一条曲线,称之为时间序列,统计学里有一部分内容专门研究这种数据。
#### 趋势
股价不断上涨或不断下跌,称之为趋势,与之对应,股价上下波动,平均近似在一条水平线上,这时候,没有趋势。有趋势的时候,特别是上涨趋势,比较容易赚钱(正收益),俗称牛市,牛股。当股票处于下跌趋势的时候,导致持有者亏损,俗称熊市。牛熊交替,让股市充满变数(风险)。
当趋势出现之后,人眼和各种技术分析手段都能够判断出来,困难的是趋势何时结束,这属于预测,存在不确定性,因此要用到概率理论和统计方法,因为概率和统计比较擅长处理不确定性问题。
#### 经典的技术分析手段存在两大问题
1、延迟:趋势的起点出现之后,技术分析才能发现,上涨趋势结束之后是下跌,往往需要下跌一段时间之后,技术分析才能确认趋势结束。
2、受波动影响较大,股价的大幅波动,会被误判为趋势开始或结束。
所以,我们需要用统计学的方法,减少误判,抓稳上涨趋势,避开下跌趋势。
#### 动量
动量(momentum)是指正在上涨的股票,在接下来的日子里,仍然保持上涨的可能性,反之亦然。单从曲线上,很难区分出趋势和动量。动量代表着一种预测概率,意味着明天的涨跌。趋势则是描述过去的走势。当动量方向发生变化是,意味着之前趋势的结束。
#### 波动
我们以天为时间单位,日波动率即为日收益率的标准差,当股价大起大落时,它的波动率升高。通常股票从牛市转为熊市的时候,股价会大幅下跌,所以,从波动率的变化,可以判断风险的大小。2008经济危机之后,交易所开始提供恐慌指数,本质上也是一种波动率。
#### 随机与预测
某些时间段里,股价的变化,是随机的,这时候技术分析手段往往失灵,或者完全碰运气。有些时候,股价的走势具备了某种特征,变得可以预测。困难的地方是,预测的正确率,是一种概率,且不可能达到100%。
经典的技术分析,包括技术指标和模式识别。统计学可以看做是经典技术分析的升级,降低错误率,预测风险,让过去模糊的地方,变得清晰一些。但它仍然无法应对股市的复杂性,所以不是完美解决方案,仅仅是前进了一步而已。
简要来说,炒股就是抓住上涨趋势的起点、预判趋势的终点,避开熊市。只要做好这三点,肯定能赚钱,但非常难。
#### 难题一:做最易如何找到有上涨趋势的股票?
我们把市场里的股票的动量计算出来,进行排序,排在前面的股票,意味着过去上涨趋势强劲,“继续上冲”的可能性大。
#### 难题二:如何判断趋势结束了呢?
当波动率增大时,往往意味着旧趋势的结束,新趋势的开始。
####难题三:何时是熊市?
当大多数股票一起下跌时,意味着熊市开始了。技术分析也能够判断出熊市,但延迟较大。延迟意味着亏损,减少延迟,可以利用数学模型(例如GARCH)拟合时间序列,然后用概率分布的推理(忘记这些难懂的词汇吧),可以预测熊市是否来了。
####小结
总结一下,股价随机变化的时候,所有的技术分析和统计学都无能为力;当股价呈现出某些特征的时候,用统计学的方法,比经典技术分析手段,在准确性和延迟上有改进。
---
#### 人工智能本质就是计算机领域的统计学
华为创始人兼 CEO 任正非 2020年1 月 20 日在接受央视《面对面》采访时,谈及基础研究和基础学科的重要性时说,人工智能就是统计学,计算机与统计学就是人工智能。去年 8 月,诺贝尔经济学获奖者 Thomas J. Sargent 在世界科技创新论坛上也表示,人工智能其实就是统计学,只不过用了一个很华丽的辞藻。作为数理统计背景的人工智能从业者,非常欣慰世界级的企业家和专家学者为统计学在人工智能中“根正苗红”的地位摇旗呐喊。
我们每天都在主动或被动接受各种信息和知识,头条系个性化的精准推荐以及 Google 专业的搜索查询,这些看似不同的问题,背后都有数理统计的身影。推荐引擎的核心算法协同过滤是基于矩阵分解技术,搜索引擎的核心算法 PageRank,是图特征向量中心度的表达方式。在感知技术中,AI 在语音识别和图像识别上分别取得 95% 和 99% 的准确率,无论是统计语言模型还是深度网络模型,也主要依赖概率论,贝叶斯理论和最优化理论等数学统计方法作为基础工具。强人工智能阶段的本质就是基于数据的学习和推理,而统计学就是 learning system 里最必不可少的“轮子“。
统计学不仅是解决算法和模型问题的基础,统计思维对整个学习过程——包括人机协作数据获取,算法研发以及结果分析都有着巨大影响。经典的统计概念: 观测对象(Population)→业务目标(Question of Interest)→训练样本表征 (Representativeness of training data) →结果分析 (Scrutiny of result) ,这套数据分析和建模的思维过程也是 AI 产品和研究非常重要的思维框架。
```
> Population:观察对象所产生的条件和环境,是统计推断和学习的基础;
> Question of Interest : 建模目标和研究对象,需要依赖领域专家和业务知识确定分析和预测的目标;
> Representativeness of training data:是统计推断中最重要的部分,训练样本表征是否有充分的信息反映与建模目标之间(Question of Interest)的关系,训练样本的分布是否与观察对象(Population)的分布一致;
> Scrutiny of result:是对模型效果的检测,包括模型的稳定性,可复现性,算法可解释性,以及结果的业务解释性等。
```
这套 PQRS 框架是华人统计大牛 Yu Bin 教授(伯克利统计系系主任,美国科学院院士)在 2017 年底发表的论文 artificial intelligence and statistics 中提出的。这套理论也一直影响着工智能产品落地和研究中的理念,拒做“调包侠”,深耕业务场景。我们需要追求结果的解释性和业务的因果分析,既有用 AI 解决大数据的能力也有解决小数据的能力。因此统计思维决定了我们的产品和服务的“厚度”,让我们更懂客户需求。
由此可见,人工智能里的统计学,不仅是不需要重复构建的“轮子”, 更是一种结合人类知识和智慧的思维方式。统计思维框架提出了一个非常有效的概念,把人的知识融进 AI 黑魔法中,让 AI 产品在充满变数和挑战的环境下正确有效地执行,从而产生真正的价值。当然,人工智能也不仅仅是统计学,AI 在不同方向上结合了大量基础学科知识,如强化学习借鉴了大量的认知科学成果,遗传算法等大量仿生智能算法。引用我喜欢的一段话,“持开放的态度对待人工智能技术,人工智能的核心是创造智能而不是解释世界,为了造出智能,AI 人愿意拥抱一切学科,也拥抱一切泡沫”。
---
#### 统计学经典书籍
####一、统计学基础部分
1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社
据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。
2、《Mind on statistics(英文版)》 机械工业出版社
只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something
like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。
3、《Mathematical Statistics and Data Analysis(英文版.第二版)》 机械工业出版社
看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。
4、《Business Statistics a decision making approach(影印版)》 中国统计出版社
在实务中很实用的东西,虽然往往为数理统计的老师所不屑
5、《Understanding Statistics in the behavioral science(影印版)》 中国统计出版社
和上面那本是一个系列的。老外的书都挺有意思的
6、《探索性数据分析》中国统计出版社 和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。
####二、回归部分
1、《应用线性回归》 中国统计出版社
还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书。
2、《Regression Analysis by example (3rd Ed影印版)》
这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩。
3、《Logistics回归模型——方法与应用》 王济川 郭志刚 高等教育出版社 不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格。
####三、多元
1、《应用多元分析(第二版)》 王学民 上海财经大学出版社
现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。
2、《Analyzing Multivariate Data(英文版)》 Lattin等著 机械工业出版社 这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。
3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson & Wichem 著 中国统计出版社
个人认为是国内能买到的最好的多元统计书了。Amazon 上有人评论,评价很高的。不过据王学民老师说,这本书的证明还是有不太清楚,老外实务可以,证明实在不咋的,呵呵。
####四、时间序列
1、《商务和经济预测中的时间序列模型》 弗朗西斯著
Amazon 上五星推荐的书,讲了很多很新的东西也非常实用。我看完才知道,原来时间序列不知有AR(1) MA(1)啊,哈
2、《Forecasting and Time Series an applied approach(third edition)》 Bowerman & Connell 著
本书的主讲Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序
####五、抽样
1、《抽样技术》 科克伦著 张尧庭译
绝对是该领域最权威,最经典的书了。王学民老师说:这本书不是那么好懂的,数学系的人,就算看得懂每个公式,未必能懂它的意思(不是数学系的人,还是别看了吧)。
2、《Sampling: Design and Analysis(影印版)》 Lohr著 中国统计出版社
讲了很多很新的方法,无应答,非抽样误差,再抽样,都有讨论。也很不好懂,当时偶是和《Advance Microeconomic Theory》一起看的,后者被许多人认为是梦魇,但是和前者一比,好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊。
####六、软件及其他
1、《SAS软件与应用统计分析》 王吉利 张尧庭 主编
好书啊!!!!
2、《SAS V8基础教程》 汪嘉冈编 中国统计出版社
主要讲编程,没怎么讲统计。如果想加强SAS编程可以考虑。
3、《SPSS11统计分析教程(基础篇)(高级篇)》 张文彤 北京希望出版社
当初第一次看这本书,发现怎么几乎都看不懂,尤其是高级篇,现在终于搞清楚了:)
4、《金融市场的统计分析》 张尧庭著 广西师范大学出版社
张老师到底是大家,薄薄的一本书,言简意言简意赅,把主要的金融模型都讲清楚了。看完会发现,分析金融单单数学模型还是纸上谈兵,必须加上统计模型和统计方法才能真正应用。本书用的多元统计(代数知识)比较深。
---
####人工智能经典书籍
####一、人工智能科普类:人工智能科普、人工智能哲学
1、《智能的本质》斯坦福、伯克利客座教授30年AI研究巅峰之作
2、《科学+遇见人工智能》李开复、张亚勤、张首晟等20余位科学家与投资人共同解读AI革命,机器学习教父Tom Mitchell力荐
3、《人工智能时代》从人工智能的历史、现状、未来,工业机器人、商业机器人、家用机器人、机器翻译、机器学习等人工智能应用领域依次介绍了人工智能发展前景。
4、《人工智能简史》 跟着图灵、冯•诺依曼、香农、西蒙、纽维尔、麦卡锡、明斯基等人工智能的先驱们重走人工智能之路,站在前人的肩膀上,看人工智能的三生三世,鉴以往才能知未来。

5、《科技之巅》源自麻省理工学院的科技创新预言圣经 掌握未来数年全球科技发展趋势和商业化潜力。
6、《科技之巅2》全球多领域20位行业专家深度解读强化学习、基因疗法2.0、自动驾驶货车、量子计算等新科技新产业。
7、《数学之美(第2版)》浪潮之巅 文明之光 硅谷之谜 大学之路作者吴军博士作品 新版增加大数据和机器学习内容 文津图书奖获奖书 央视新闻推荐的学科敲门砖。
8、《技术的潜能》 美国知名战略咨询管理专家马库斯教授力作!为非技术人士了解技术影响力而写的一本简明读本!
9、《智能革命》作者为百度CEO李彦宏,该书将人工智能定义为堪比任何一次技术革命的伟大变革,明确提出,在技术与人的关系上,智能革命将不再是人去适应机器,而是机器去主动学习和适应人类。

####二、人工智能深度学习类:深度学习、Tensorflow
1、《深度学习》AI圣经,深度学习领域奠基性的经典畅销书 特斯拉CEO埃隆·马斯克等国内外众多专家推荐!
2、《深度学习精要(基于R语言)》基于R语言实战,使用无监督学习建立自动化的预测和分类模型
3、《TensorFlow技术解析与实战》包揽TensorFlow1.1的新特性 人脸识别 语音识别 图像和语音相结合等热点一应俱全 李航 余凯等人工智能领域专家倾力推荐!
4、《TensorFlow机器学习项目实战》第二代机器学习实战指南,提供深度学习神经网络等项目实战,有效改善项目速度和效率。

####三、人工智能机器学习类:Python、机器学习、数据科学。
1、《Python机器学习实践指南》 结合了机器学习和Python 语言两个热门的领域,通过利用两种核心的机器学习算法来用Python 做数据分析。
2、《Python机器学习——预测分析核心算法》 从算法和Python语言实现的角度,认识机器学习。
3、《机器学习实践应用》阿里机器学习专家力作,实战经验分享,基于阿里云机器学习平台,针对7个具体的业务场景,搭建了完整的解决方案。
4、《NLTK基础教程——用NLTK和Python库构建机器学习应用》绍如何通过NLTK库与一些Python库的结合从而实现复杂的NLP任务和机器学习应用。

5、《Microsoft Azure机器学习和预测分析》 了解新的微软Azure Machine Learning服务 掌握高效构建和部署预测模型的实用技能。
6、《机器学习与数据科学(基于R的统计学习方法)》 为数据科学家提供了一些在统计学习领域会用到的工具和技巧。
7、《机器学习Web应用》 eBay公司EU Analytics部门负责人Davide Cervellin作序推荐,全面Python机器学习的图书 学会在Web下构建机器学习系统的权威指南。
8、《实用机器学习》 使用R语言引导读者掌握机器学习实战 顺利针对新问题 新数据选择和使用机器学习算法。

####四、人工智能算法策略类:算法、神经网络、自然语言处理、推荐系统、系统算法、图像算法、贝叶斯、概率编程、数学算法等。
1、《神经网络算法与实现——基于Java语言》 完整地演示了使用Java开发神经网络的过程,既有非常基础的实例也有高级实例。
2、《趣学算法》 50 多个实例循展示算法的设计、实现、复杂性分析及优化过程 培养算法思维 带您感受算法之美。
3、《算法谜题》 Google、Facebook等一流IT公司算法面试必备,经典算法谜题合集。
4、《Python算法教程》 精通Python基础算法 畅销书Python基础教程作者力作。

5、《编程之法:面试和算法心得》程序员面试宝典 笔试金典 CSDN访问量过千万的博客结构之法算法之道博主July著作。
6、《趣题学算法》 一本有趣的、易学的、实用的,帮助读者快速入门应用的算法书。
7、《Java遗传算法编程》 遗传算法设计 机器学习人工智能 来自Java专家的声音 用遗传算法解决类似旅行商的经典问题。
8、《算法学习与应用从入门到精通》 320个实例、753分钟视频、5个综合案例、74个技术解惑,一本书的容量,讲解了入门类、范例类和项目实战类三类图书的内容。

####五、人工智能时间图像和视觉识别类:图像识别、语音识别、自然语言处理、matlab建模工程。
1、《OpenCV和Visual Studio图像识别应用开发》无人驾驶人脸识别基础技术 用OpenCV实现图像处理应用 计算机视觉编程实战手册。
2、《人脸识别原理及算法——动态人脸识别系统研究》 介绍了动态场景下的人脸识别方法,该方法综合应用了人脸定位、人脸识别、视频处理等算法。
3、《精通Python自然语言处理》 用Python开发令人惊讶的NLP项目 自然语言处理任务 掌握利用Python设计和构建给予NLP的应用的实践。
4、《Python自然语言处理》基于Python编程语言和NLTK,自然语言处理领域的一本实用入门指南。

5、《贝叶斯方法:概率编程与贝叶斯推断》 机器学习 人工智能 数据分析从业者的技能基础 国际杰出机器学习专家余凯博士 腾讯专家研究员岳亚丁博士推荐。
6、《贝叶斯思维:统计建模的Python学习法》Think Stats和Think Python图书作者重磅出击 数据分析师 数据工程师 数据科学家案头常备。
7、《概率编程实战》人工智能领域的先驱、美国加州大学伯克利分校教授Stuart Russell作序推荐!一本不可思议的Scala概率编程实战书籍!
8、《自己动手写神经网络》 机器学习与人工智能参考书 基于Java语言撰写。

评论
哇,很棒,最近也打算看看统计学书籍,多谢分享!
2020-11-19
个人觉得股价长期来说会反映公司的盈利能力,统计学+公司盈利能力的判断,会对胜率有所提升。
2020-11-19
这个真不一定,你一定要小心如何选样本...
2020-11-19
这些书都刷完,难度有点大啊。。
2020-11-22
第一本, **《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社**
全新的已经没有了,二手的都炒到300元以上了。
好在搜到了扫描的pdf版,就是看着累。
2020-11-24
@cd6003 扫描版pdf能分享么?
2020-11-24
@13386094266 不能发附件。要不你留个邮箱给我。
2020-11-24
@cd6003 麻烦加下qq 85502663,谢谢
2020-11-24
@13386094266 平时不上qq。所以发你qq邮箱了。
2020-11-25
@cd6003 已收到,非常感谢!
2020-11-25
@cd6003 16991945@qq.com 给我也来一份,谢谢
2020-11-26
@万江取水 同问。 是否可以对 20日 涨幅,做个平均, 然后取涨幅 的 速度?
2020-11-26