数字时代的中央银行:让数据成为焦点

数字时代的中央银行:让数据成为焦点

2023-May
编者按:2023年5月,国际货币金融机构官方论坛(OMFIF)发布《数字时代的中央银行:让数据成为焦点》报告(以下简称《报告》)。《报告》指出技术发展正在改变中央银行收集和处理数据的方式。经历2008年金融危机和新冠疫情后,各国中央银行大数据用例数量逐渐增加,用途包括经济预测、金融犯罪监测、金融稳定评估和储备金监测等,但数据治理的问题也相伴而生。为了应对这一问题,多国中央银行开始联合开发数据治理框架,并尝试使用数据目录、虚拟化、数据湖和数据仓库等技术方法来存储和处理数据。《报告》研究了各国中央银行对于大数据、非常规数据源的会用以及新兴数据治理策略相关的风险与权衡,探讨了中央银行对使用云服务的开放程度、公共云的优势,以及对数据主权确认困难的担忧,并提出了中央银行为应对这一挑战所采取的策略。前沿研究院现对《报告》主要内容进行摘编,供参考。

一、中央银行所使用的非常规数据源

(一)电信与移动数据。历史上,中央银行一直依靠消费者和家庭调查来衡量通胀预期和反馈。这使他们能够衡量实施宽松型或紧缩型货币政策的预期以及具体情况。但在新冠疫情期间,中央银行开始以来高频的电信与移动数据。这类数据可以近乎实时地更新,具有一定的持续性和公开度,并且能反映城市尤其是二线城市的发展。 
(二)非结构化数据。中央银行正越来越多的从社交媒体和互联网中获取消费者反馈,并且已经有通过推特数据衡量通胀预期与基于调查的国家通胀预期显示出一定相关性的研究。一些中央银行正在制作一个情绪指数来更好地利用从新闻媒体获取的文本数据,且证明比社交媒体资料更可靠。
(三)微观交易级数据。逐笔贷款和逐笔交易分析可以提供更细化的金融稳定数据,以帮助在风险扩散之前识别风险。而在发展中经济体中,一些中央银行正在使用信贷、银行、个人支付交易数据评估金融普惠的解决方案。但对许多中央银行和在其管辖范围内运作的机构来说,这种水平的数据收集和分析仍处于发展阶段。

二、数据治理架构

(一)数据目录,指中央银行可以访问的每个数据集的列表。这是数据治理战略的基础,其包含丰富的元数据,以确保用户可以看到尽可能多的信息。这些元数据包括数据库中的数据类型的信息,如主题、来源、更新频率、管理访问的隐私规则以及数据支持的工具。一个数据目录描述了一个组织所拥有的数据,但也存在如何存储的问题。
(二)数据虚拟化,指数据驻留在不同的系统中,但可以通过覆盖在系统上的逻辑层进行访问。这允许用户在自我服务的基础上访问所有数据,并且提供了一种访问中央银行数据的手段,而不需要将数据集中到一个地方。它提供了更好的可视性和数据访问,使分析人员能够更有效地利用它们。但是一个缺点是数据需要从存储位置发送到虚拟化平台。这可能会导致延迟,因为虚拟化平台不能提高存储系统的数据传输速度,还必须有足够的网络速度和一个有效的传输协议。
(三)数据湖,指一个非结构化的原始数据存储库。这也是目前大多数国家中央银行都在使用或准备使用的数据存储系统。在数据湖中,数据可以保留在存储系统中且可存储任何格式或介质的数据,并没有预先定义的模式,这也代表着数据无需转移就可以进行分析。这代表了效率的大幅节省和性能的提高。虽然其通常比虚拟化平台更昂贵,但与其他更复杂的数据架构相比,它的成本低廉且部署迅速。这种灵活性允许大量的工具和数据用例,包括机器学习。然而一个缺点是如果没有一个严格执行的治理系统,其会变得杂乱无章。
(四)数据仓库,指包含经过清理和标准化的结构化数据,可供快速分析。与数据湖不同,数据仓库中的数据是以符合原子性、一致性、隔离性和耐久性的格式存储的,这使得更新和删除的过程比数据湖更简单。建立一个数据仓库的成本更高,需要更多的时间来创建和管理。它需要更多的初始工作来处理数据和预先定义模式,但数据可以很容易地在整个机构内使用。数据仓库对风险建模很有帮助,在更一致的基础上建立和推进模型,并且可以快速、方便地访问不同来源的数据。
(五)数据集市,指数据仓库的一种类型,收集、组织和处理数据,并储存关于某一特定领域或主题的数据。对于中央银行来说,这可能意味着监督数据的收集。通常可以比数据仓库更低成本地建立,更快速地部署,而且维护成本低。数据集市为用户提供了快速访问的能力,但与数据仓库相比它的数据集更小,变化更少。

三、中央银行所面临的数据治理挑战

(一)云迁移的挑战与机遇。与商业银行相比,中央银行并不愿意迁移至公共云服务。尽管有机会使用现代、高效的数据分析和信息共享工具,但中央银行仍然担心采用云将要求他们将数据控制权交给服务提供商——通常是总部设在国外的服务提供商。中央银行更愿意使用云来获取公开可用的数据,但对于非公开可用的数据,则保留在本地,以确保遵守数据保护规则。也有中央银行在研究私有云方案。私有云能为中央银行提供了使用虚拟化来汇集和有效分配计算资源的能力。通过把数据存储在云端,而不是在企业内部的服务器中,一些中央银行可以更方便地与数据分析相关服务提供商进行合作,包括欺诈行为预防和检测恶意交易。私有云的规模和专业性意味着其有更多的资源用于确保客户的数据安全,防止网络攻击。但由于购买和安装新的硬件和软件,以及管理它们所需的资源(通常是专门的人员),使得私有云的成本比公共云更高,这也是中央银行对于使用私有云的主要考虑因素。
(二)数据主权确认困难。数据主权是中央银行在使用云服务时所面临的难题。许多云服务由美国公司提供。而许多中央银行并不愿意让位于美国的云提供商托管其数据。一些中央银行正在着手研究将数据以加密形式存储在云中,一旦云供应商被要求发布数据,则只能发布加密数据,以确保敏感信息得到保护。混合云也可以为中央银行提供一种解决方案,其目的是使客户能够从云中提供的效率和现代工具中受益,同时不影响存储敏感数据的安全标准。确保企业内部环境与公共云环境相互兼容是保证数据顺利传输的关键。同时也需要在建立和维护私有云架构以及复杂的基础设施建设方面进行大量投资,以保证私有云和公共云各自系统的完整性和统一性。
(三)缺乏数据专业人才。当前,数据收集与分析工作的复杂性已成为整个经济体所面临的问题。全社会对数据专业人员的需求量大。中央银行缺乏具备管理和分析数据的专业人才。与企业等私营部门相比,中央银行等公共部门所提供的薪资与灵活性缺乏竞争力。为解决这一问题,一些中央银行会招聘专业技能较为初级的数据分析师,一些则选择外包给第三方公司,或者与高校合作,并提供奖学金资助。