我院范小云教授、王道平副教授、王业东博士以及研究生郭文璇、胡煊翊合作的论文“不同来源金融文本信息含量的异质性分析——基于混合式文本情绪测度方法”在国内权威期刊《管理世界》2022年第10期发表。
情绪对宏观经济和金融市场具有重要的预测能力。随着大数据和人工智能技术的发展,互联网文本成为获取公众情绪的重要来源。度量情绪常用的文本可分为正式文本和非正式文本。正式文本包括新闻报刊、公司年报和政府工作报告等,非正式文本主要来源于推特、论坛等社交平台。两类文本的发表主体、内容和形式明显不同,因此在反映经济状况的有效性上可能存在差异。目前国内基于文本尤其是新闻文本的研究尚处于起步阶段,鲜有文献探究不同中文金融文本的信息含量。
该文选择报刊新闻作为正式文本,选择社交媒体发帖作为非正式文本,检验了不同来源的文本情绪对宏观经济和股票市场的预测能力。该文数据来源于2011~2019年中国32家知名报刊发布的175万条新闻和投资者在东方财富网股吧发表的近2500万条帖子。论文在评估不同情绪测度方法准确性的基础上,开发了面向中文金融文本的词典。为了解决词典法忽略上下文语义特征的问题,词典的构建采用了更为灵活的“N-gram”思路。新闻词典包含积极词汇1277个,消极词汇2152个,股吧词典包含积极词汇1489个,消极词汇2296个。该文进一步融合词典法和机器学习法提出了一种利用自然语言理解技术测度金融文本情绪的新方法。与仅基于词典法或机器学习的方法相比,混合式方法可以提高情绪测度的准确率。
论文检验了金融文本情绪对宏观经济和股票市场的预测能力。该文按照主题将新闻分为证券、经济、泛经济和综合4类,发现新闻情绪能够显著预测宏观经济指标,证券类和经济类新闻对股票市场也具有一定的预测能力。中文新闻情绪能够显著影响消费、产出、通货膨胀、利率和股票收益,对于分析宏观经济走势、引导股市健康发展具有重要的参考价值。该文对股吧的信息含量进行了检验与进一步探究。股吧情绪能显著预测股票市场的收益率、交易量和波动性,但对宏观经济预测效果甚微。在中国股票市场,股吧情绪在经济下行期间以及节假日或周末后首个交易日对股票收益率具有更好的预测能力。个股股吧包含的信息具有异质性,小盘股、成长型股票、非国有企业股票、低机构投资者持股比例股票的收益率对股吧情绪的反应更强烈、且持续性更强。
该文的结果表明,基于中文金融文本的情绪分析方法在捕捉有经济意义的软信息方面具有较好的效果。新闻文本对于消费、产出、利率、通货膨胀等宏观经济指标均具有显著预测能力。这一方面能为监管部门预测宏观经济走势提供借鉴,另一方面也为逆周期调节提供了手段。通过官方媒体传达政策目标,有助于实现经济健康平稳运行。而东方财富网作为大量投资者的聚集处,为获取投资者情绪提供了便捷的手段。监管部门可将股吧情绪作为股票价格波动的信号,在舆情监测的基础上采取合理措施避免股市大幅波动,防范和化解系统性金融风险。
论文简介:
范小云、王业东、王道平、郭文璇、胡煊翊:不同来源金融文本信息含量的异质性分析——基于混合式文本情绪测度方法,《管理世界》2022年第10期,78-95页。
摘要:
情绪对宏观经济和金融市场具有重要的预测能力。本文评估了不同文本情绪分析方法的准确性,开发了一种新的中文金融文本情绪词典,并融合机器学习算法提出了一种混合式情绪测度方法。本文数据来源于2011~2019年中国32家知名报刊发布的175万条新闻和投资者在东方财富网股吧发表的近2500万条帖子。与仅基于词典法或机器学习的方法相比,混合式方法可以提高情绪测度的准确率。本文实证结果表明,新闻情绪对宏观经济指标预测效果较好,证券类和经济类新闻对股票市场也具有一定的预测能力。股吧情绪则能显著预测股票市场的收益率、交易量和波动性,但对宏观经济影响甚微。进一步分析表明,不同经济周期、交易日以及不同类型股票的文本情绪对股票收益率的预测效果也具有异质性。
关键词:金融文本 文本分析 投资者情绪 大数据 机器学习