**0.发现数据有问题怎么办?**
先查看下面的解释,如果还没有解决您的问题,请在社区发帖,详细描述下:
- 具体是什么问题;
- 发下查询语句;
- 发下查询结果并标记下觉得有问题的地方;
- 发下对比截图;
- [发帖参考贴](https://www.joinquant.com/post/15582?tag=algorithm)
感谢您的反馈,我们一定会认真的核查并处理,详细的描述有助于我们快速帮您解决问题 /握手
社区发帖的目的是其他小伙伴有同样问题时,社区搜索下就找到答案啦!
**1. 财务数据**
聚宽的财务数据中利润表和现金流量表是按单季度统计的,要特别注意哦,估值表是按天更新的,资产负债表的数据是按报告期更新的。利润表和现金流量表中的指标都是流量性质的、可分割的,出于量化方面的因素,所以我们用的是单季度统计,但上市公司发布的财报中,利润表和现金流量表的统计周期分别是该年度的第一季度、前半年、前三个季度、全年,请大家注意差别;估值表中的指标随着每天的股价的波动而变化,所以我们每天根据该股票的收盘价计算其对应的如市值、市盈率等数据;资产负债表中的指标都是存量性质的数据,不具备分割性,所以其数据与披露的财务报表中的资产负债表中的数据一致。
如果大家对财务数据的正确性有疑问,我们的人员可能不能及时给您解答,请到 [巨潮资讯网][1]上面查看原始的公告信息,确认是我们提供的数据有问题,再发帖求助,谢谢~
Q:某公司公布相关财报后,聚宽什么时候将其更新到线上?
A:单季度财务数据目前每个交易日盘后更新,数据中的pubDate对应公告日期,一般在公告日期当晚可以拿到,最晚第二天凌晨。
报告期数据一般在公告日期当天就可以拿到。
Q:上市之前的财报为什么没有?
A:上市之前的财报,不受证监会的监督约束,无法保证数据正确,而且对股票市场的股价影响波动很小,所以聚宽只提供公司上市后发布的财务报表。
Q:为什么我获取到的财报的日期,和传入的date不一致?
A:因为很多公司的财报会拖延很长时间才发布,get_fundamentals(query_obj, date)查询指定日期date所能看到的最近(对市值表来说, 最近一天, 对其他表来说, 最近一个季度)的数据,我们这样做是防止未来函数。比如您传入的date是2016-04-20,获取到的是2015年第四季度的财报,因为该公司的2016年第一季度的财报在2016-04-30才公布。
Q:为什么上一年的财务指标和上一年的第四季度的财务指标相同?
A:财务指标表中没有统计周期跨度为一年的数据,所以获取某年的财务指标,返回的是该年的最后一个季度的财务指标。
相关帖子:https://www.joinquant.com/post/2681?replyId=16445#16445
Q:为什么我在别的网站上查的财务指标和聚宽提供的财务指标数据不一致?
A:一般财经网站上提供的财务指标数据都是根据财报公布日期统计的。上市公司公布财报分四种,一季度报、中期年度报、前三季度报、全年年报,统计的周期跨度分别为第一季度、前两个季度、前三个季度、全年,而聚宽考虑到量化分析,所以提供的财务指标数据全是单季度的。所以因为财报的统计周期不同,导致了一些指标上的不一致。如果大家想对比别的网站的单季度统计数值,可以到同花顺上查看,如 http://stockpage.10jqka.com.cn/000759/finance/#finance ,然后选择按单季度统计,如下图。
![1.png][2]
相关帖子:
https://www.joinquant.com/post/2746?replyId=16660#16660
https://www.joinquant.com/post/2654?replyId=16302#16302
Q:为什么按单季度统计后,净利润还是和同花顺的净利润不同?
A:同花顺的净利润其实是归属母公司股东的净利润,我们提供的净利润指标就是净利润。
Q:上市公司的财报如果后来有修改(修正),请问是怎么处理的?get_fundamentals是怎么处理有修改的财务数据。有的使用修复前的,有的使用修改后的?
A:(1)上市公司财报更新前和更新后的数据,为了避免未来函数(当前时间取到未来数据),理论上要保留同一报告期的所有版本,目前受数据源的限制,这块处理规则是按最新更新的(部分比较久远的数据可能会用第一个版本);
(2)公司新发布一期财报,一般同时会给出上一年度同期的调整财报,对于这种情况相隔时间较久的情况(半年以上),我们一般不再对老的财报进行更新;而有时候,公司会在短期内(半年内或者1个月内)对前段时间更新的财报进行修正, 这种情况我们也会采用修正后的财报;
(3)上面的规则主要是针对[单季度财务数据](https://www.joinquant.com/help/api/help?name=Stock#获取单季度年度财务数据)的,[报告期财务数据](https://www.joinquant.com/help/api/help?name=Stock#获取报告期财务数据)修正前后的数据都有的。
**finance接口可以拿到调整过的数据**
![tiaozheng.png][3]
![tiao.png][4]
**2.股票数据**
取股票数据的函数,一般都默认是前复权,如get_price,history, attribute_history。
Q:为什么我获取到的股票的历史价格和某网站上的历史价格不同?
A:因为两者的复权方式不同,比如您在聚宽上使用的是前复权,在别的网站上看到的是其他复权方式,这就导致了股票的历史价格不同。
相关帖子:https://www.joinquant.com/post/2052?replyId=14053#14053
Q:为什么我获取到的股票的历史成交量和通信达上的历史成交量不同?
A:首先有可能该股票之后发生了除权除息,导致复权因子发生了变化。只要复权因子发生了变化,我们的算法在前复权模式下,成交量也会乘以该复权因子的。而通信达上的历史成交量可能不考虑复权因子的变化。
相关帖子:https://www.joinquant.com/post/4533?replyId=25308#25308
Q:为什么采用同样的复权方式,某只股票的历史价格还是不同?
A:由于各数据提供商的复权因子的计算方式不同,我们经过权衡,选择和新浪一致,所以通过复权因子得到的历史价格,也会和不同的数据提供商有所差异。
相关帖子:https://www.joinquant.com/post/2740?tag=faq
Q:为什么获取的涨停价为无限大,跌停价为0?
A:这种情况,表明该股票在该日无涨跌停限制。无涨跌停限制的情况有很多,而且在不同的年份交易所的规定不同。比如增发股票、解除ST等情况。如果出现这种情况,您可以到巨潮网上查看具体的公告详情。如000863在2012-08-03无涨跌停限制,具体的公告见http://www.cninfo.com.cn/finalpage/2012-08-03/61363778.PDF
Q:分钟数据的成交量,为什么和别的数据提供平台差很多?
A:首先集合竞价数据的成交量,我们将其归类到09:25的分钟bar中了,但09:25的分钟数据,我们暂时在回测的功能中没有提供集合竞价,所以使用不了该数据。而很多别的数据提供商,如通信达,将集合竞价数据归类到09:30的分钟bar了。另外,交易所不提供分钟数据,只提供tick数据(不是分笔的),一个tick的bar的长度为3秒,然后数据提供商根据tick数据,自己制作分钟数据。由于不同的数据提供商的分钟数据生成算法不同,导致分钟数据的成交量不完全一致。
Q:分钟数据合成的最高价等数据和天数据不一致
这个是正常现象,但由于分钟数据和日数据都是是从快照数据合成的,而快照数据的快照截取时间,不同平台或许会有些许差别,从而出现分钟数据的最高价和最低价不完全一致。而对于日数据的最高价和最低价,是不存在这样的问题的
这里没有问题,不建议拿分钟行情和日行情进行最高价最低价,开盘价收盘价的比较,分钟行情都是根据tick自己生成的,譬如说这里,有可能tick时间切片的时候没有切到21.84这个快照那么根据当前tick现价合成的分钟最高价就不是21.84了,当时日最高价是21.84没错
分钟行情的最高价是按照这一分钟所有tick的现价合成的最高价。
Q:有些股票成交量和成交额都为0,或者成交量为0,成交额不为0
这些股票交易期间出现某一分钟成交量和成交额为0都是正常情况,以600115在2018-12-11这天13:04:00为例,就是正常的;
另外部分时间出现成交量为0,成交额不为0,是因为有成交量小于1手的碎股情况,这样统计为0手
Q:为什么别的行情软件上,上海医药601607的行情是从1994年开始的?
A:上海医药在2010年的时候,进行过股票代码更换,其之前的股票代码为600849,[更改名称的公告][5]。别的行情软件将其更改股票代码的之前的数据也拼接进去了。
Q:有关股票代码变更
(1)如果股票发生代码变更,变更前和后部分数据是独立的,需要根据对应的代码及时间查询;
(2)股票代码发生变更的情况:
000508->000931
600849->601607
601313->601360
000024->001979
原代码 原名称 原缩写 变更日期 新代码 新名称 新缩写 变更类型
000024.XSHE 招商地产 ZSDC 2015-12-30 001979.XSHE 招商蛇口 ZSSK 直接变更
000527.XSHE 美的电器 MDDQ 2013-9-18 000333.XSHE 美的集团 MDJT 直接变更
000562.XSHE 宏源证券 HYZQ 2015-1-26 000166.XSHE 申万宏源 SWHY 直接变更
600849.XSHG 上药转换 SYZH 2010-3-8 601607.XSHG 上海医药 SHYY 直接变更
601313.XSHG 江南嘉捷 JNJJ 2012-1-16 601360.XSHG 三六零 SLL 借壳上市
000916.XSHE 华北高速 HBGS 2017-12-25 001965.XSHE 招商公路 ZSGL 吸收重组
300186.XSHE 大华农 DHN 2015-11-2 300498.XSHE 温氏股份 WSGF 吸收重组
600001.XSHG 邯郸钢铁 HDGT 2009-12-29 000709.XSHE 河钢股份 HGGF 吸收重组
600205.XSHG S山东铝 SSDL 2007-4-30 601600.XSHG 中国铝业 ZGLY 吸收重组
600296.XSHG S兰铝 SLL 2007-4-30 601600.XSHG 中国铝业 ZGLY 吸收重组

(3)在报告期财务数据中,对于这种股票代码变更的情况,数据库表的结构以company_id为唯一键,这里在两个股票对应同一个company_id的情况股票code对应就以新的为准了,数据没有缺失.
这些数据比较特殊,有些是交易所让合并数据,有些是交易所建议当成2个股票。我们这边对于历史上17年以前的这种情况,基本上市作为独立的两只股票的,而17年以后,如601360和001872都是建议覆盖之前的。例如:
- 000022在 2018-12-25变更代码为001872,获取000022的财务数据请使用001872;
Q:有关tick数据--tick 时间戳重复
原始数据没有毫秒部分的数据,我们添加了毫秒部分,所以如果一秒钟出现多余2条数据,就会出现这种现象
一般来说是2条数据,刚好平分1秒钟里的0.5秒,但有时会接收到3条,就出现了重复的时间戳
处理的时候,如果有两个时间戳相同,我们会把第二个加上500毫秒

Q:分钟数据,有的股票均价(或者成交额/成交量)超出了最高价或最低价
数据没有问题,是这样的,我们依照行情软件的惯例,给出的分钟成交量单位是手(省略了碎股,一般小于1手),成交额单位是元,成交额是真实成交的数额,是没有省略碎股的交易额的,所以单纯以实际成交额 / 省略碎股的成交量, 这样算得的均价是略有偏差的。
**3.指数数据**
中证官网可以查看各个指数的 [编制方案](http://www.csindex.com.cn/zh-CN)
Q:为什么我在某指数的官网上看到该指数2004年就出现了,但是在聚宽上到2007年才有它的成分股数据呢?
A:您在某网站上看到的该指数的起始日期其实是该指数的基日,不是该指数的发布日期。
相关帖子:https://www.joinquant.com/post/2058?replyId=14050#14050
Q:为什么两岸三地(000999.XSHG)指数昨天的收盘价和今天的昨收价会有不同?
A:000999是两岸三地指数,包含大陆、香港、台湾,香港的交易时间到下午4点,但上交所的行情转发只到15:10左右,有些平台只更新到15:00,今天的昨收价确实应该收录的是昨天收盘价所对应时间点后的一段时间后的数据,跟往日不同的是,一般在3点10收盘价就比较稳定不再变动,发现问题的几个收盘价数据在3点10之后数据还是有些许变动,这个问题目前无解。
Q:为什么深成指指数的成交额与其他的软件相差那么大?
A:深成指的成分股数量为500,不是所有在深圳证券交易所上市的A股股票。其他的数据提供商,均将深证的所有A股的成交额之和作为深成指399001的当日成交额之和,而聚宽的深成值的成交额为其对应的成分股在当日的成交额之和。
Q: 为什么000001上证指数和000002A股指数的成分股完全相同?
A: 000001是上证指数,包含上交所注册的A股和B股,000002是A股指数,只包含上交所A股,理论上000002+所有上交所B股的数量应该等于000001的成分股数量,但目前我们未提供B股数据,所以成分股完全一致。[点击可以查看中证官网A股指数编制方案](http://www.csindex.com.cn/zh-CN/indices/index-detail/000002)
Q:创业板指的成交量与其它券商相差很大
这个问题比较特殊,在深交所的查询该指数的数据查到了两个不同的成交额和成交量数据,一个和用户提到的其他券商的数据相符(见附件《深交所官网399006日线图》),另一个和我们的数据相符(见附件《深交所官网历史行情图》)。
经过分析,发现和用户提到的其他券商的数据相符的还有另一个指数,即创业板综指(399102.XSHE),行情数据见附件《深交所官网399102日线图》,由此可见,我们的数据没有问题,即为399006.XSHE实际的成交量和成交额,而交易所不知是什么原因,用399102.XSHE的成交量和成交额替换掉了399006.XSHE的数据,导致在深交所官网查询数据发现日线图数据和历史行情数据不一致。
综上所述,我们的399006.XSHE显示的是该指数的真实的成交量和成交额数据,而用户提到的券商的成交量和成交额数据是和深交所官网日线图保持一致的399102.XSHE的数据,两个数据虽然不一样,但都是正确的。



**4.基金数据**
Q:有一些基金的数据没有,如161911?
A:某些基金确实还没有引入,我们也在寻找相关的数据源
**5.行业概念数据**
Q:为什么有些证监会行业概念的成分股为0?
A:成分股为0并不一定说明了我们提供的数据一定有错。比如E47从2012-10-27 到 2013-06-27 就没有任何成分股,您也可以到 http://www.csrc.gov.cn/pub/newsite/scb/ssgshyfljg/ 证监会官网上去确认一下。
Q:为什么有些股票不属于申万行业分类
可以参考下这个[社区贴](https://www.joinquant.com/view/community/detail/16586?type=2)
数据源为聚源,经查,除了000022和601313外的股票,在2012年至2013年期间均存在长期停牌的情况(如000693,002070,600399,600401,600423,600680),而聚源判断是否成分股的逻辑为非停牌,即可以正常交易情况下才算做成分股,因为在长期停牌的这段时间内这些股票不算在任意申万行业的成分股。
而对于000022和601313这两只股票,这两只股票均为换股合并之前的股票代码,而聚源在处理股票代码的时候,是用新代码直接覆盖原代码的,因此造成这个被换股的股票代码没有数据,这个会根据新代码的数据做适当处理后再写入到数据库中。
另外,300761,601865为2019年2月18、15日才上市的股票,聚源在判断是否成分股时不会在上市日期就将这些股票列为成分股,而是过一周多才会列为成分股。
600399,600423虽已与近期复牌,但是需要等一段时间才会重新被列为成分股中,因此目前还没有行业分类,在申万官网查询最新的行业成分中也没有将这两只股票列为成分。
Q:为什么有些申万行业代码没有成分股?
A:申万的行业代码在14年2月21有一次比较大改动,新增了11个行业代码:`['801710','801720','801730','801740','801750','801760','801770','801780','801790','801880','801890']`,弃用了6个行业代码:`['801060','801070','801090','801100','801190','801220']`
所以新增行业代码在2014-02-21之前没有成分股,弃用的行业代码在2014-02-21之后没有成分股。
其他代码具体查看[行业数据](https://www.joinquant.com/help/api/help?name=plateData#申万行业)页面
其他标的若有类似现象可以留言讨论,我们核查下答复您。
****
**6.资金流向数据**
Q:为什么600655在2016-11-04日的主力的占比与同花顺的主力占比相差那么大?
A:聚宽上的主力资金占比等于超大单占比和大单占比之和。同花顺上主力资金就是主力资金,没有超大单和大单的定义。而关于主力,不同的平台标准不同。
- **同花顺**的数据
![1.png][6]
- **东方财富**的数据
![2.png][7]
相关帖子:https://www.joinquant.com/post/3555?tag=new
Q:为什么有些股票的资金数据数据在某些交易日查不到?
A:这只股票在该交易日可能处于停牌或暂停上市状态,无法交易,没有资金流向数据。
**7.融资融券数据**
Q:为什么周六查询周五的融资融券数据还查不到?
A:我们提供的融资融券数据来自于上交所和深交所官网,其数据来自于每个交易日后各家券商向交易所汇报的数据。上交所的融资融券数据当日收盘后会更新,深交所的融资融券的数据会在下一个交易日的10点更新,这样一来深交所周五的融资融券数据在周一上午10点才能获取到。
**8.聚源数据**
Q:如何查询聚源数据
[查询聚源数据的简单例子](https://www.joinquant.com/view/community/detail/12996)
Q:LC_SpecialNotice表中收录的上市公司公告信息数据不全
A:LC_SpecialNotice表中收录的不是全部公告,只收录上市公司发布的特别提示公告,关于特别提示公告的分类标准详见LC_SpecialNotice表中提示信息类别NoticeType的字段备注。
Q:聚源数据中,中证指数行情(QT_CSIIndexQuote)中,指数市盈率和指数股息率没有写有什么区别

A: 指数市盈率(I)是按总股本计算的市盈率,指数市盈率(II)是按照中证指数调整后的股本计算的市盈率;
指数股息率(I)是按总股本计算的股息率,指数股息率(II)是按照中证指数调整后的股本计算的股息率。以上股本调整规则详见中证指数官网对各个指数的编制规则:http://www.csindex.com.cn/zh-CN;
**9.期货数据**
Q: 为什么某期货合约日行情数据的总成交量会小于中金所披露的持仓会员前20名的成交量?
A: 行情数据中的成交量是单边计算的,因为多空成交相同,而持仓机构的成交量指的是他自身的成交量,比如;某个会员机构多头成交2手,空头成交1手,它必须要与别的会员成交,只能记3手。
可以和交易所官网数据进行对比,比如中金所: http://www.cffex.com.cn/ccpm/
**10.期权数据**
Q: 为什么期权风险指标数据中商品期权只有delta数据,没有theta等数据?
A: 此数据来自交易所,上期所,郑商所及大商所都未披露此项数据,所以获取不到.ETF期权有完整的风险指标,上交所有披露。
**11.宏观数据**
Q:宏观数据有缺失?
A:有些数据本身统计局官网未公布,属于正常缺失,比如macro.MAC_AREA_CPI_MONTH表七月份的全国cpi数据,在统计局官网也是没有的,如果觉得有问题可以先和统计局官网数据进行对比: http://data.stats.gov.cn/easyquery.htm?cn=A01&zb=A010302&sj=201903
[1]: http://www.cninfo.com.cn/new/index
[2]: https://image.joinquant.com/acea19612851d31b57f3ecd283bbe6fd
[3]: https://image.joinquant.com/fc85f1ee1e007e3b501bb9d3f2c58ecf
[4]: https://image.joinquant.com/205e1d501f75067f5c945fbf8591560d
[5]: http://stock.stockstar.com/notice/JI2010022400000455.shtml
[6]: https://image.joinquant.com/1197e66faf73435d7fa1d1d730f1e8dc
[7]: https://image.joinquant.com/992ae6dcf9c47e348f91b2900e6cd081
@王朝阳 我刚才又看了另外一只股票验证一下,发现对不上。
000651.XSHE 系统打印出来的ROE是6.7834
在你告诉我的同花顺官网上面,按单季度统计,却是6.19,麻烦你再帮我核实一下:
![roe1.png][1]
[1]: https://joinquant-image.b0.upaiyun.com/114b903ac2b9e15e4d2d1c57f0aad8de
2016-09-08
@只求稳定 我查了国泰安的数据,格力电器的2016年第二季度的ROE为6.69%,那现在看来,应该是不同的数据提供商的算法不同。
2016-09-09
@王朝阳 今天研究了一天的ROE,发现计算方法各有不同,咱们网站计算公式是
归属于母公司股东的净利润*2/(期初归属于母公司股东的净资产+期末归属于母公司股东的净资产)
同花顺等大部分网站使用如下的计算公式,两种有差:
ROE = P/(E0 + NP÷2 + Ei×Mi÷M0 - Ej×Mj÷M0 ).其中:P为报告期利润;NP为报告期净利润;E0为期初净资产;Ei为报告期发行新股或债转股等新增净资产;Ej为报告期回购或现金分红等减少净资产;M0为报告期月份数;Mi为新增净资产下一月份起至报告期期末的月份数;Mj为减少净资产下一月份起至报告期期末的月份数.
2016-09-09
@只求稳定 太厉害了。看来以后有什么问题,还需向您请教请教。
2016-09-09
@王朝阳 请问一下回测中的公司财务数据是来源于哪个数据库?
2016-09-12
@王朝阳 中间组合环节会不会有什么差错的地方吧?有eps几条数据总觉得不大对,不知道怎么算出来的,能麻烦帮我看一下吗?净利润大于0,但eps小于0,按照公式不应该哦
,例如:201509季报:
code market_cap np_parent_company_owners eps
0 002441.XSHE 70.14 3.900046e+07 -0.0280
1 300260.XSHE 24.72 4.881663e+05 -0.0052
2 600227.XSHG 64.63 -3.041535e+06 0.0019
3 600446.XSHG 265.87 5.174688e+07 -0.1400
4 601155.XSHG 228.54 1.388075e+09 -0.4554
2016-09-12
@只求稳定 谢谢您的反馈。的确有这种数据错误的存在。我们先和别的数据源对比一下吧,将错误数据替换。
2016-09-12
@王朝阳 麻烦看看这个问题,order_target_value函数下单数不对
https://www.joinquant.com/post/3125?tag=faq
2016-10-07
@王海仙 聚宽上的财务数据是按季度统计的,不知道您指的是什么意思?
2016-11-03
一般用季度累计的很多,这个按单季自己算,不是很方便。其实单季和季度累计上市公司都公布了。
2016-11-03
@王海仙 出于量化的目的,把流量式的指标(利润表和现金流量表)按照季度统计了,其他的和上市公司公布的财报没有区别。
2016-11-03
说个题外话:
嗯嗯嗯...... 从这里就可以看得出, 证券行业尤其是公司数据与平台的混乱性, 根本就没有权威统一的方式吗? 各家用各家的, 最后的数据, 说没有猫腻, 没有漏洞, 我就呵呵..
言归正传:
目前除了股票的价格波动以外的其他数据, 都有偏差, 每个软件都有不同. 就说流通市值和总市值, 同花顺和大智慧的显示有些股票就不一样. 所以, 基本上, 这些数据只具备参考性(选股), 真正有决定性作用的还是价格(买卖).
2016-11-03
@dongeyoung
各家的数据都有漏洞,特别是财务数据这块,因为涉及到有些公司发布财报后,后期数据有进行了调整,今年发布财报,把去年同期发布的财报数据给调整了(为了让自己公司的报表好看些:>)。另外就是时间比较早的数据,特别是05~06年的一些数据,有些数据服务商找不到相关的数据,竟然自己做假数据,比如某家行业标杆的数据提供商提供的申万指数历史成分数据。
流通市值和总市值为什么不同的平台提供的不准?
因为有些公司在港股上市了,又在A股上市,甚至在B股也有流通,这样总市值=A股总股本 x A股当天价+港股总股本 x 港股当天价 x 港币兑人民币汇率+B股总股本 x B股当天价 x 美元兑人民币汇率。
不同的平台计算总市值方式不同,有的是(A股总股本+港股总股本+B股总股本)x A股当天价,有的是A股总股本 x A股当天价
为了保证数据的高质量,我们买了不同平台的数据,进行比对、清洗,确保数据质量靠谱,但并不是绝对没有问题,如果您在本平台上发现有数据有错误的地方,还望告知我们~
2016-11-04
2014年7月数据 平台收盘价普遍高于行情软件的价格
2016-11-05