金融机构外部数据概述

金融机构外部数据概述

外部数据的概念

  • 金融机构外部数据指为实现金融机构特定业务目标,通过采购、合作、自主采集等方式,从金融机构外部引入的数据。
  • 金融机构外部数据管理指金融机构通过构建组织架构、明确各部门职责要求、建立和实施系统化制度、流程和工具等方式,针对外部数据进行引入、应用、共享和退出的全流程管理,确保外部数据的合法引入、合规使用、充分共享和正常退出,并在经营管理中最大化发挥外部数据价值的动态过程。

为什么要引入外部数据

  1. 自身获取数据的局限性:长期以来,各企业、机构在自身经营发展过程中,不断积累内部业务数据,尤以银行等金融机构为甚,内部积累了海量的业务数据,逐渐搭建起企业级数据库,并构建融入了客户识别、风险预警和预控等智能分析事件库和规则库的风控体系。但这些银行自身获取的数据却存在诸多问题,如数据来源单一片面,无法全面分析预测风险;业务数据碎片化、数据呈现非结构化,无法深度挖掘数据价值等。
  2. 引入外部数据的必要性:鉴于内部数据所存在的诸多问题,引入外部数据对相关业界实现如下诉求尤为必要:
    2.1. 全面识别客户风险的诉求:外部大数据为识别客户风险,尤其是信用风险提供了全新的思路,比如使用客户的行为数据、舆情数据,可以更加及时、准确地发现客户的潜在风险,比起传统的下户调查、分析财务数据的方法更加有效。银行引入外部海量数据,以数据为驱动,通过数据的挖掘找到客户特征,分析潜在风险,发掘价值。利用大数据的效率效能、跨渠道整合,来支持实时快捷的智能化风控。
    2.2. 成本控制的诉求:银行等金融机构、相关行业组织要实现自主采集、分析、挖掘外部数据,需要大量的人工、技术投入,因此向优质数据供应商直接采购外部数据成为主流选择。数据供应商所提供的数据来源相对广泛,且数据更新速度快,并借助自身技术进行数据的结构化分析,提供更加可用的外部数据。

外部数据的管理原则

  • 外部数据管理的主要原则包括合法合规性、持续稳定性、共享连通性、本源权威性、渠道多样性和成本合理性。
  1. 合法合规性是外部数据管理的基本原则,指所有外部数据的获取、使用必须合法合规,符合国家相关法律法规、政府相关部门规章、监管要求以及相关国家标准和行业标准。涉及个人用户的外部数据需在获取与使用前取得其充分授权,并遵循合法、正当、最小必要原则,不得过度处理数据。
  2. 持续稳定性指外部数据的引入需要确保数据源具备稳定的数据接口,数据源可保证一致的数据质量,使数据具有高可用性与可持续性。
  3. 共享连通性指外部数据为避免重复引入,在接入各业务系统前统一通过外部数据管理系统接入,以确保数据在无合作协议限制前提下可实现金融机构全域范围内的共享,实现内部数据的集成整合。
  4. 本源权威性指应首先考虑从数据权威部门引入一手外部数据源,并在引入前进行数据验证与测试以确保数据可用,价值有效释放。
  5. 渠道多样性指在满足业务需求的前提下,可通过多种形式获取外部数据,包括公共公开的数据、共享银政的数据、银企合作的数据、对接子公司的数据以及外部采购的数据等。
  6. 成本合理性指外部数据引入应充分考虑成本效益及投入产出合理性,实行成本计量及费用分摊机制,以便更加合理地对外部数据进行集约化管理,更加准确地计量经营绩效。
  7. 以上为外部数据管理一些常见原则,各金融机构可以根据自身业务和管理需要,有选择地制定外部数据管理原则。

外部数据的分类

  • 数据分类是管理体系合理规划、数据安全合理管控的基础,是迈向数据精细化管理的重要一步。对数据进行分类不仅是加强数据交换共享、提升数据资源价值的前提条件,也是数据安全保护的必要条件。对于复杂难懂、体量庞大的外部数据而言,如何实现有效的分类管理尤其重要。合理的外部数据分类一方面帮助金融机构细化外部数据管理的程度,从引入、使用、共享到退出环节明确数据源垂直管理,优化平台工具的建设;另一方面,分类以及在此基础上的分级帮助金融机构厘清数据保护重点,对不同级别的数据实施不同的保护,保障重要敏感数据的安全,有助于防控数据风险、保障数据交易、释放数据价值。
  • 当前,部分银行机构从自身业务实践出发,根据不同的实现目的和需求从各角度进行了分类,下表是其中较为成熟的分类体系代表,分别从数据种类、数据主体、数据服务方式三个维度对常见外部数据进行分类。

按数据种类分类

数据种类 类别描述
核验类 核验类数据指根据客户提供的原始信息进行一致性和准确性校验的数据,主要包括学籍学历核验、发票核验、驾驶证核验等数据。
评分类 评分类数据指对客户敏感信息进行统计分析形成的区间化、分级化的评分结果,包括收入水平评分、工作稳定性评分,反欺诈评分等数据。
标签类 标签类数据指对客户敏感信息进行统计分析形成的模糊化的客户标签,包括客户房产标签、借贷意向标签等数据。
黑名单类 黑名单数据指被惩治或有违反嫌疑而被列入黑名单机构的注意者秘密名单的数据,通常是自然人和法人因违反道德底线事实、违反社会责任底线事实、失信事实等原因而被列入相关权威机构的黑名单库中,包括逾期黑名单、公安黑名单、司法涉诉与行政处罚黑名单等数据。
金融市场类 金融市场类数据指金融市场行情、行业指数等数据,包括股票、基金、期货、债券等金融产品的指数和价格数据。
价格评估类 价格评估类数据指通过商品计价原则、标准和市场供求情况,评估得出的商品价格数据,包括车辆价值评估、房产价值评估等。
其他类 以上分类之外的数据,包含公开的工商数据、万得终端、资讯报告、法律法规与司法案例数据、天气数据等。

按数据主体分类

数据主体 类别描述
个人数据 个人数据指与个人核验类相关数据,如个人核身;个人车产;个人征信;个人房产;个人风控;个人健康;个人司法类等相关数据。
企业数据 企业数据指与企业经营运营相关性数据,如企业工商、企业征信、企业风险、企业资讯等相关数据。
其他数据 其他数据指以上分类之外的数据,如舆情数据、天气数据、位置数据、地图数据等。

按数据服务方式分类

服务方式 类别描述
接口类 接口类数据指供应商通过互联网传输协议,如HTTPS 等传输协议提供的接口数据服务。
批量文件类 批量文件类数据指供应商通过服务器,如SFTP等服务器提供的文件类数据服务。
终端账号及报告类 终端账号及报告类数据指供应商通过数据库网站服务、研究报告等形式提供的数据服务。
其它类 其他类数据指与供应商通过联合建模、隐私计算等新技术形式实现的数据服务。

外部数据的评价标准

  • 金融机构在评估外部数据时通常会考虑以下几个关键因素来判断其优劣
评价角度 解释
数据质量 包括数据的准确性、完整性、一致性和及时性。高质量的数据对于金融分析和决策至关重要
数据来源的可靠性 确保数据来源于信誉良好的组织或平台,并具有有效的数据治理和隐私保护措施
数据适用性 数据是否与金融机构的业务领域和需求紧密相关,能否有效支持特定的金融产品和服务
法律和合规性 数据是否符合相关的法律法规要求,特别是在金融监管和数据保护方面的规定
数据的可信度 是否存在第三方认证或数据审计报告,以增强数据的可信度和权威性
数据的可扩展性和更新频率 数据是否易于扩展以适应未来的增长需求,以及更新的频率是否能够跟上市场变化的速度
成本效益分析 获取和维护外部数据的成本是否合理,相对于其潜在的价值和收益
技术兼容性 数据是否与金融机构现有的信息系统和技术架构兼容
风险管理 数据可能带来的潜在风险,如隐私泄露、数据欺诈等,以及是否有相应的风险策略

参考:
金融机构外部数据管理实践白皮书
金融机构外部数据的概念和分类