第四节 大数据与互联网金融的关系

一、互联网金融催生大数据分析需求

(一)大数据依存于互联网金融环境

互联网金融产生大数据,而互联网金融的发展又高度依赖大数据的发展,两者相互促进、共同发展。大数据具有显著的数量巨大、结构复杂、处理要求高、时效性强等特点。同时,大数据的无缝化、全覆盖特点又使得数据量和异构化趋势进一步加剧。这些特点带来以下两种趋势变化。

(1)互联网金融越来越复杂的业务模式和业务逻辑,产生了越来越巨量的数据,这些数据在未来将发挥更重要的作用。在过去传统的金融领域中,一些数据的价值可能被忽略,如客户的行为数据等。但是在互联网金融大数据的背景下,客户的行为数据将被视为珍宝。

(2)大数据对互联网金融环境的依存度也越来越高,因为脱离这个环境,很多数据就会变得无效。用计算机的行话来说,互联网金融的上下文铸就了大数据的高有效性。

另外,互联网金融领域的大数据在处理上也要有新思路、新方法和新手段。

(1)多样化、异构化的数据整合处理显得越来越重要。很多大数据分析需要整合处理视频、音频、文本、图像、半结构化等数据,才能得出最后的结论,单单从建模角度考虑,就需要实现混合模式识别等复杂技术。

(2)大数据的分析结果会被实时应用到互联网金融业务环境中,对数据流的单遍描述、实时处理、并发处理等技术都会被综合利用,大数据分析技术需要进一步提升。

由此可见,大数据与互联网金融环境的紧密依存关系,会带来较大的工作量和难度,但也使得大数据的分析处理更加必要,获得了更大的发展。

(二)移动环境下大数据的特点和处理

移动计算和移动数据处理,是诞生于20世纪90年代的新型数据处理技术。而移动环境下的大数据处理有两个特点。

(1)移动环境下,大数据收集和处理方式相对简单,这是因为数据的类型和数据量相对要小一点儿。但是,随着产业科技的升级,对于数据处理的实时性要求逐步提高,带宽优化等方面都需要比有线环境更为复杂的处理手段。

(2)移动端的大数据处理,往往会整合多样化、异构化、不同应用环境中的大数据,进行统一处理。在处理过程中,有时还需要保持移动数据处理的相对独立性。

可以预见,移动环境是未来大数据发展的最重要的阶段,单个移动设备的大数据处理或许挑战不大,但是众多移动设备的大数据处理,就会在整体上对处理的时效性提出挑战。

二、大数据为互联网金融提供技术支持

(一)大数据促进互联网金融业务的扩展

互联网金融业务与传统金融业务相比,有它的特殊性,其客户群体来源于网络,相关业务采用远程方式办理,一般是7/24小时的服务,这些服务要求重视客户体验,并且能够快捷方便地办理。这一切,都可借助大数据分析予以支撑。

正是由于业务办理的网络化、远程化,远程结点之间信任程度将影响业务办理。大数据技术的一些手段,如区块链技术等,正是解决远程结点之间信任关系的良好工具,需要在实践中加以应用。同时,征信大数据分析手段也是重要的信用基础。

风控大数据的积累和应用,是另一个重要话题,如果说互联网金融环境存在不确定的话,那么基于大数据分析的风险控制技术就是获得某种确定性的重要手段。

(二)大数据自身创造价值

最近,国内外大数据领域动作频繁,大数据交易所成立、大数据的交易日趋活跃。这说明了一个道理,大数据本身是有价值的。数据是信息的记录载体,就知识产权而言,大数据本身或许是有隐私权的,但是在大数据基础之上的分析结果往往是具有交易价值的。大数据自身的价值如图3-8所示。

图3-8 大数据自身的价值

三、互联网金融时代大数据面临的挑战

互联网金融时代孕育了大数据的繁荣景象,同时,多元化的数据类型和巨量的数量体量也给数据处理带来了新的挑战。

(1)海量数据的集聚,如流数据、并发数据、快速变化和采集的数据等,使得巨量数据成为大数据处理的第一道关口。硬件成本的快速扩张、并发处理的瞬间增长、流数据的持续单遍扫描处理等都成为大数据分析处理的必备条件。

(2)数据类型的多样性和数据的异构性,成为大数据处理的另一个挑战,建模的复杂性也成为一大难题,需要配套多样化的处理手段,其中的许多处理手段尚在研究和实验室阶段,这为大数据处理的应用带来不小的困扰。例如,基于特征的视频处理、音频处理技术仍在发展中。大数据处理模式如图3-9所示。

图3-9 大数据处理模式

(3)大数据的处理要求会提高,如要求高速处理、实时处理、分布式处理等。随着处理要求的提高,对于硬件配置、算法设计、信息安全也提出了一定的挑战。

(4)大数据的准确性处理将会成为一大难题。由于处在快速变化的互联网金融环境下,数据的有效性问题、数据的清理问题、数据噪声的去除等问题都会被提出来,成为一大挑战。

(5)移动环境的大数据处理虽然相对简单,但是处理要求会异于有线环境下的数据处理。移动环境下的数据组织与数据广播本身就是学术界一直在研究的问题,距离应用还有一段距离。

(6)社会结构或者社会分工所导致的数据条块分割难以共享,将会成为大数据处理的人为障碍,也是大数据分析处理的一大挑战。