《世界经济》第4期篇首文章发表了我院范小云教授与王道平副教授合作的论文“基于新闻大数据与机器学习的中国银行业系统性风险研究”,这是我院数字金融研究团队又一重要成果。
近年来,随着金融科技的发展,大数据与机器学习方法已成为金融问题研究的重要手段。新闻和社交媒体数据等开放的非结构化大数据,可从不同视角洞察市场状态,提供更全面丰富的信息,提高评估和预测准确性,这已成为金融监管的一个重要视角。
该文将大数据、文本挖掘和机器学习方法应用到系统性风险研究中,基于新闻文本大数据利用共现分析法度量了银行网络关联度,将银行共现新闻的情绪指数作为系统性风险指标,创新性地提出采用机器学习中的隐马尔可夫模型监测银行系统性风险。
该文创新之处主要有以下方面:首先,该文填补了国内系统性风险研究在应用另类大数据方面的空白,丰富了测度和预测系统性金融风险的手段和途径。该文数据来源涵盖了国内33家知名综合和财经类报纸,基本囊括了国内所有报道银行业事件的报纸。其次,该文从情绪“软”渠道角度利用文本情绪分析法,从共现新闻中构建测度银行关联强度的指标,共现新闻情绪体现了关联银行的共同情绪变化,能更好地反映风险传染状况。最后,该文提出了一种新颖的风险度量与监测方法。该方法基于银行在新闻报道中的共现次数测度中国银行关联性,首次对共现新闻进行情感分析,作为测度系统性风险水平的指标,并首次采用机器学习中的HMM识别中国银行业的系统性风险状态,定量预测中国银行业未来的系统性风险水平。
该研究有着较强的政策意义。在监管中国银行系统性风险传染时,应充分借助新数据和新技术,结合动态和实时监管发现新风险源。充分利用新闻和社交媒体等开放的大数据,可从不同视角洞察市场状态,掌握更丰富的信息,提高风险评估和预测准确性,因此应将大数据研究发展为金融监管的一个重要视角。该文研究成果有助于充分利用大数据所包含的信息提前发现危机事件征兆,重点监管关联度高的银行和系统重要银行,从而防范和化解系统性金融风险。
论文简介:
范小云、王业东、王道平*:基于新闻大数据与机器学习的中国银行业系统性风险研究,《世界经济》2022年第4期,3-30页
内容提要:
本文基于新闻大数据和机器学习方法研究了中国银行业系统性风险度量方法和预警机制。我们对2000-2019年中国33家知名报纸发布的334万余条新闻,采用文本共现挖掘方法测度中国银行间网络关联,并基于银行共现新闻情绪衡量系统性风险水平。结果发现:在2008年全球金融危机前后,中国银行间关联由“大而少”向“小而多”转变;在全球金融危机和“钱荒”期间,系统性风险明显上升,银行系统重要性普遍提高,银行间关联明显增强。本文还采用机器学习方法中的隐马尔可夫模型识别和预测系统性风险,发现该方法能较好地预警中国银行业的系统性风险。