特许全球金融科技师

李峰:2022年数据与分析技术趋势

日期:2022-07-08

前  沿

2022年1月20日,位于英国伦敦的咨询公司SDG发布了《2022年度数据与分析技术趋势报告》(以下简称“SDG报告”),报告预测并分析了2022年影响商业生态的十大数据及分析技术趋势。上海交通大学上海高级金融学院会计学教授、中国金融研究院副院长、中国金融研究院-信也科技联合研究实验室主任李峰与上海交通大学中国金融研究院-信也科技联合研究实验室研究分析师王焱联合撰文对SDG报告进行综述性介绍,并结合我国金融科技政策和生态环境进行简要点评。

数据与分析技术正在以惊人的速度发展:从技术大众化到围绕云的开发创新,再到新AI技术等等。SDG报告指出企业在2022年需要关注的十大关键趋势,并将这些趋势分为:已经对市场产生影响的趋势(既定趋势)、正在崛起的技术趋势(上升趋势),以及正在慢慢发生作用的趋势(未来趋势)。

一、十大趋势

(一)既定趋势

这些趋势是必不可少,且企业需立即采取行动的。

1)云计算及下一代数据仓库技术:数据网格(Data Mesh)、数据经纬(Data Fabric)和公共基础性仓库架构 2.0(Data Vault 2.0)

云计算让企业更便捷地使用具有深度、可拓展、可变革结构的数据架构和模型。云通过支持数据网格(Data Mesh)、公共基础性仓库架构 2.0(Data Vault 2.0)、数据经纬(Data Fabric)以及云原生的技术与实践,开启了下一代的数据仓库模式。

数据网格是一种管理数据的整套方案,它能够支持分布式领域驱动设计、将数据视为产品,并且支持自主的数据基础架构设计以及集中生态治理。数据网格允许数据产品跨域连接,并在不依赖存储的情况下进行信息交换。

数据经纬是一种允许在私有、公有、本地部署或多云系统等分布式环境进行数据访问与分享的架构。这种可拓展的数据与连接架构避免了数据孤岛,使调用、选择、整合等过程自动化,可持续从不同系统中识别、连接数据,挖掘独特且有业务价值的数据关系。这些信息使决策更有效,通过快速访问与针对传统数据管理的洞察提供价值。

公共基础性仓库架构2.0则是一种源于云与数据运维的下一代数据仓库模型,是一种可协同配置和管理技术、流程与数据的敏捷型架构。

以上这些趋势都有一个共同点:基于云的巨大潜力为组织对创新和灵活性的持续性需求提供解决方案。

2)数据运维再升级:AI主导、拓展超自动化与元数据湖

数据运维是一种受“开发运维一体化“(DevOps)启发的技术框架,旨在为数据、模型和相关设施建立可预期的交付与变更管理。通过技术在最优安全性与质量情况下赋能数据与元数据的自动交付,在动态环境中提升数据的使用与价值。数据运维激发了数据驱动公司在治理、灵活性、可拓展性、效率和自动化方面的巨大需求。

由于AI和机器学习所创造的高自动化环境,数据运维再升级的趋势正在持续演进,组织因此可快速识别、审查和自动化数据管理流程。

这些流程直接影响了数据质量,使公司可快速分析和完善数据——数据可观察性;更敏捷地监控数据管道——数据编目;使功能更具战略远景,例如谱系与目录。在DevOps(开发运维一体化)中,智能自动化降低了人工运维成本,且增加了团队间的跨职能协作。

除此之外,在数据运维和垂直化数据治理设计中,元数据湖关联性得到加强。该平台使元数据用作企业整体数据管理环境成为可能。

3)范式转移:从以产品为中心到完全以客户为中心&全渠道工具

为满足甚至超越客户需求,企业必须将客户置为购物体验的中心。过时的多渠道策略已被全渠道工具所替代,尤其是超连接工具(云、5G、IOT)。简言之,数字渠道与物理渠道以及围绕二者的障碍将会完全消失。业务的焦点不再集中于产品或门店,而是为客户在任何地方提供独特一致的购物体验。

通过从不同渠道收集数据,我们可以挖掘客户购物全流程的相关信息,用于分析每个触点对客户的影响、优化流程,并根据反馈来优化服务与产品。由于数据分析及智慧流程自动化的出现,公司得以提供高定制化的产品。这些手段促进了对实时、前瞻性AI模型的数据喂养,进而降低延迟时间、上新时间以及相关成本。

4)D.A.T.A(Date as A Transformational Asset):数据作为转型资产

数据本身并没有价值,它只是一种商业优势,是一种可货币化、差异化的资产。D.A.T.A应该被理解为公司的数据集、算法、实践、直接影响以及可用信息,利用这些信息与派生价值的公司将从竞争对手中脱颖而出。

从算法的内在关联到最佳实践等,计算数据的价值与范围将能够直接影响公司股价与吸引力。机不可失:以大幅押注研发的公司和初创公司为例,我们可以看到市场规则已经改变,现在已经需要通过理解与利用所有的转型力量来充分发挥数据的竞争优势。

(二)上升趋势

这些趋势有着重大影响:

5)由网络安全分析、区块链、隐私增强计算所驱动的可信环境

网络安全策略保护了传统边界:运算、共享、传输与分析在企业中变得越来常见。这种网络安全保护手段基于身份识别,并运用数据收集与分析(网络安全分析)能力来快速进行威胁侦测与人工安全任务。网络安全环境也由去中心化与信息加密区块链技术进行支持,该技术价值巨大,尤其是在身份识别、基础设施保护、数据流追溯等环节。

隐私增强计算(PEC,一系列在运算、共享、传输、分析场景下保护数据的技术)也扮演着重要角色。PEC使用越来越广泛,尤其是在反欺诈领域。根据Gartner公司所述,“到2025年,50%的大型机构都会采用这种技术来增加运行在不可信环境或多数据源分析场景下数据的隐私性。”

6)二力相撞:自助服务2.0&与自动机器学习

公司正在押注自助服务2.0与自动机器学习来提升洞察提取能力。这些技术通过直达终端客户、数据访问大众化、聚焦洞察力的生成加速了公司对相关解决方案的采用。

一方面,自助服务2.0整合且放大了AI驱动模型的分析能力;另一方面,自动机器学习以可视化报告形式呈现了其先进算法。这些技术促进了对每个领域360 º触达,实现对所有客户的全方位分析。

在这种冲击下,我们看到了包括自助服务和自动机器学习组合在内的公司兼并行为。公司正在通过为非数据科学家提供预测能力来弥补高级分析技术与商业智能的鸿沟。

7)承担责任与私人AI势在必行

由量子计算与AI引发的混乱带来了数据道德管理的责任。在数据隐私保护(由《通用数据保护条例》推动)成功之后,关于监管数据的使用、且要保证影响公民日常生活的数据开发符合道德规范,将变得更加紧迫。公司与机构需阐明他们的“AI向善”策略来最小化技术负债,并致力于健全算法的透明性与公平性。

这方面,私人AI的概念正在崛起。在公共管理机构或其他数据分享复杂的组织中,基于加密技术的AI策略正在建立,能尽可能减少数据曝光。

8)另一件大事:量子AI获助推

越来越多的公司正在研究量子AI,他们希望成为下一次革命的领导者。我们正在经历量子计算与先进分析技术的交汇期,必须意识到这一新趋势的益处。

量子AI利用传统计算机达不到的量子计算的优越算力,可进行超大数据集计算,更敏捷地处理复杂问题,改进商业模型与洞察力,该技术从学界到业界的跃迁可带来诸多益处。如今,许多公司已开始受益于封装知识,而在这之前只能由人工在智能与敏捷决策框架下进行执行。我们正处在技术重塑市场与业界未来趋势的转折点。

(三)未来趋势

以下这些趋势正在浮出水面:

9)元宇宙生态:开启扩展现实

元宇宙不仅是科技界的流行语,它还将是助力开拓扩展现实的一整个生态系统。在扩展现实的大伞下,所有沉浸技术都在融合现实世界与虚拟世界,包括增加现实(AR)、虚拟现实(VR)、混合现实(MR)。

围绕元宇宙的产品与服务激发了诸如眼镜与隐形眼镜的创新,带动了扩展现实的发展,并将会在公司和个人用户中变得愈发常见。元宇宙的崛起将会直接影响扩展现实设备的创新与成熟,这些设备拥有更低成本,并会加速整个技术周期的发展。根据彭博社预测,元宇宙市场规模在2024年将会达到8000亿美元,在2030年将会达到2.5万亿美元。扩展现实是一系列为用户提供虚拟与物理环境沉浸式交互体验的技术源。

10)生成式AI:向自动生成内容的飞跃

AI通常用于训练基于已知结论的算法,但是它是否可以自我生成新内容?答案是肯定的,这依赖于生成式AI技术,它是AI生态中最具前景的发展方向。在未来几年,生成式AI可以让计算机根据输入信息自动识别底层模式,并产生新的原创性内容。

换句话说,生成式AI是通过学习诸如业务数据、文本、音频、图形等内容的数字表现,来生成与训练数据相似的原创、逼真的内容。这将使生成式AI驱动公司在软件开发领域的快速创新,比如新药物、天气分析与欺诈识别。

二、点评与展望

结合SDG报告与我国的金融科技政策和生态环境,我们认为,2022年及未来几年我国数据与分析技术将会呈现如下趋势:

(一)区块链和隐私增强计算提供可信环境,助力金融业数据生态建设

传统金融机构的安全策略与业务发展一直存在矛盾。尤其是关于数据的安全利用,既要通过数据建模来精准洞察业务需求,提升服务能力;但同时又要保护用户隐私,警惕用户信息泄露风险。2021年,各国持续加强数据安全立法相关工作,我国陆续出台了《数据安全法》《个人信息保护法》《征信业务管理办法》等一系列数据法规。

鉴于金融机构对数据的互联互通需求迫切,隐私计算技术将有极大的应用场景。隐私计算能够在保障数据安全的前提下,推动各平台多源数据共享,有效提升模型精度,助力金融业数据流通。将主要应用于信贷风控、精准营销、反欺诈、移动支付人脸识别等场景。

同时,区块链的公开、不可篡改、可追溯的技术特点为我国供应链金融体系生态发展提供了安全保障。目前,区块链技术主要应用于围绕核心企业的供应链2.0模式,解决协作问题、信任问题、数字化信用凭证问题和自动履约问题。未来,通过结合物联网、大数据等技术,构建基于区块链的协作网络和资产网络,区块链技术有望从根本上改变供应链金融的业务模式,推动供应链金融向去核心企业的3.0模式迈进。

(二)数据作为转型资产,成为企业核心竞争优势

数据可以被认为是企业的一种商业优势和差异化的盈利性资产。这与2021年12月12日国务院印发的《“十四五”数字经济发展规划》中强调数据要素的重要性不谋而合。

《规划》指出:数据要素是数字经济深化发展的核心引擎;到2025年数据要素市场体系初步建立。《规划》还提出了要充分发挥数据要素作用;加快数据要素市场化流通;鼓励企业、研究机构等主体基于区块链等数字技术探索相关应用。

公司的数据集、算法、实践、直接影响以及可用信息将作为可转变的数据资产,通过各类技术手段,比如AI、大数据挖掘等,能更有效地利用这些信息与派生价值的公司将脱颖而出。

(三)元宇宙生态系统助力实现扩展现实,VR/AR/MR促进金融场景智慧互联

2021年,随着科技巨头Facebook改名“Metaverse”, “元宇宙”概念大火。根据彭博社预测,元宇宙市场规模在2024年将会达到8000亿美元,在2030年将会达到2.5万亿美元。而扩展现实是一系列为用户提供虚拟与物理环境沉浸式交互体验的技术源,被视为元宇宙与现实世界的硬件接口。在元宇宙的助推下,VR/AR/MR产业将迎来新一轮发展机遇。

在国务院印发的《“十四五”数字经济发展规划》中,已经将“增强现实/虚拟现实”列入我国数字经济重点产业之一。而在中国人民银行印发的《金融科技发展规划(2022-2025年)》中,则提出了金融服务智慧再造,搭建多元融通的服务渠道。依托5G高带宽、低延时特性将增强现实(AR)、混合现实(MR)等视觉技术和银行场景深度融合,推动实体网点向多模态、沉浸式、交互型智慧网点升级。

(四)云、边、端协同,边缘计算助力绿色金融

边缘计算被视为云计算的延伸,与云计算相辅相成、协同发展。边缘计算的数据处理和分析实时性强,可以为用户提供实时性更高的服务。同时由于边缘计算只负责自己范围内的任务,数据处理基于本地,数据传输安全性高。边缘计算也不需要使用太多的带宽,网络带宽的负荷降低,智能设备的能源消耗也进一步降低。

对于金融领域的很多实时性高、安全性强的场景,边缘计算能够为其发展带来更多的可能性。中国人民银行印发的《金融科技发展规划(2022-2025年)》也响应了这一点,《规划》提出了布局先进高效的算力体系,围绕高频业务场景开发部署智能边缘节点,打造技术先进、规模适度的边缘计算能力。

突破现有的算力约束、算法瓶颈,提升金融服务并发处理能力和智能运算效率。随着边缘被赋予越来越多的数据存储和计算资源,未来边缘计算或将成为主流部署。

(本文作者:李峰 | 上海交通大学上海高级金融学院会计学教授、中国金融研究院副院长、中国金融研究院-信也科技联合研究实验室主任;王焱 | 上海交通大学中国金融研究院-信也科技联合研究实验室研究分析师)