@陈轩
代码有两个问题:
第一个:
#训练集(包括验证集)
X_trainval = df_train[g.__factorList]
X_trainval = X_trainval.fillna(0)
#定义机器学习训练集输出
y_trainval = df_train[['log_mcap']]
y_trainval = y_trainval.fillna(0)
X_trainval = df_train[g.__factorList]
X_trainval中有[['log_mcap']],y_trainval也有[['log_mcap']],自变量和因变都有市值。
第二个:行业中性化代码有问题,不知道是否故意留下的,O(∩_∩)O
df_train = neutralize(df_train,g.__industry_set)
df = neutralize(df,g.__industry_set)
2019-04-24