基于Fama-French多因子模型与模糊认知图的因果序列图神经网络在股票预测中的应用研究

《IEEE Transactions on Fuzzy Systems》:CausalSeqGNN: A Fama-French Inspired Fuzzy Cognitive Map Combined With Graph Neural Network for Stock Prediction

【字体: 时间:2025年12月03日 来源:IEEE Transactions on Fuzzy Systems 11.9

编辑推荐:

  本文针对股票预测中传统模型难以捕捉复杂时空动态和股票间方向性因果关系的难题,提出了一种名为CausalSeqGNN的创新框架。该研究结合模糊认知图(FCM)与图神经网络(GNN),通过引入模糊状态向量立体化表征股票多因子特征,并采用遗传算法学习股票间非对称因果关系矩阵。研究设计了双阶段交替学习架构,融合八日价格序列与新闻情感得分,实现了对美中市场数据集的卓越预测性能(MSE提升2%-3%,夏普比率达0.235)。这项研究为实时量化交易提供了突破性解决方案,重新定义了股票预测的精度与可扩展性边界。

  
在全球资本市场规模突破100万亿美元的背景下,股票预测已成为量化金融领域亟待攻克的难题。传统模型往往难以捕捉金融市场中复杂的时空动态特性——既需要分析股票自身的时间序列规律,又要理解股票之间错综复杂的相互影响关系。尽管深度学习技术已在股票预测领域取得显著进展,但现有方法大多聚焦于单只股票的价格轨迹,忽视了股票间存在的方向性因果关系。这种因果关系在动量溢出效应中表现得尤为明显,例如特斯拉股价波动会对苹果产生显著影响,而反向影响则相对较弱。
现有图神经网络方法如GraphCNNpred和TRAN通常依赖于对称的相关性矩阵构建股票关系图,这种处理方式无法准确描述现实市场中普遍存在的非对称因果关系。同时,经典的Fama-French多因子模型虽然通过市场风险、公司规模、账面市值比等因素解释股票收益,但其线性假设限制了其对非线性市场动态和方向性股票交互的建模能力。
针对这些挑战,西安电子科技大学人工智能学院的研究团队在《IEEE Transactions on Fuzzy Systems》上发表了题为"CausalSeqGNN: A Fama-French Inspired Fuzzy Cognitive Map Combined With Graph Neural Network for Stock Prediction"的研究论文。该研究创新性地将模糊认知图与图神经网络相结合,提出了一个全新的股票价格z-score预测框架。
研究方法上,作者团队主要采用了以下几个关键技术:首先,设计了一种新型模糊认知图结构,每个概念节点使用模糊状态向量(而非单一状态值)来立体化表征影响股票的多个因素,包括公司规模、账面市值比和市场风险等Fama-French强调的因子;其次,采用带有特殊目标函数的遗传算法学习新型FCM,获取股票间非对称因果关系矩阵;第三,构建了双阶段交替学习架构,其中双层注意力机制融合八日价格序列与每日更新的新闻情感得分,因果矩阵则按季度更新以匹配财务报告周期;最后,通过多任务损失函数平衡回归精度和排序效用,优化模型预测性能。
研究结果部分,通过系统的实验验证了模型的有效性:
模型性能比较表明,CausalSeqGNN在ACL18、CMIN-US和CMIN-CN三个真实世界数据集上均显著优于现有基线模型。在股价z-score预测任务中,MSE和MAE指标分别提升2%-3%;在股票排序任务中,MRR指标提升5%-10%。特别是在COVID-19波动期间,模型仍保持稳健性能,证明了其应对不同市场条件的能力。
消融研究结果揭示了各组件的重要性。移除情感分析导致MRR从0.071降至0.062;移除因果矩阵使MRR降低3%;同时移除两者时性能大幅下降,验证了情感融合和因果建模的协同效应。注意力-GAT的层序安排(先时序注意力后图注意力)被证明优于反向顺序,因为时序注意力能先捕获股票内部动态,为GAT提供更丰富的节点特征。
敏感性分析确定了八日历史窗口为最优设置,在CMIN-US数据集上达到MSE 3.35e-4、MAE 4.18e-3和MRR 0.067的最佳性能。较小窗口(2-4天)缺乏足够历史上下文,而12天窗口引入冗余信息。
交易模拟结果验证了实际应用价值。基于CausalSeqGNN预测的策略实现了0.235的夏普比率和0.00358的CEQ回报,较MagicNet和GraphCNNpred提升8%-10%,较始终做多策略提升106%的夏普比率。
研究结论与讨论部分强调,CausalSeqGNN通过整合时序动态、截面因果关系和情感分析,实现了股票预测领域的重大突破。FCM与遗传算法的结合提供了比传统转移熵方法更稳健可解释的因果矩阵,而双阶段学习架构成功平衡了模型稳定性与实时适应性。该框架在美中市场均表现出优越性能,为实时交易策略提供了变革性工具。
值得注意的是,研究也存在一定局限性:模型专注于次日股价z-score预测,适用于日频交易但不支持高频期货交易;因果矩阵基于Fama-French因子和情感数据,未考虑宏观经济政策、国际关系、公共事件和资源价格等影响期货市场的关键外部因素。未来研究方向包括使用强化学习优化高频交易策略、简化模型组件提升计算效率,以及扩展输入数据纳入更多外部因素指标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号