该电话销售活动除了不能达到预期的目标之外,还将产生其他的负面影响。例如,由于存在数据重复的问题,同一个客户很可能反复被相同的销售内容所烦扰,而希望得到销售信息的客户却因为数据缺失而没有被通知到,这些情况都将导致客户对企业能力产生怀疑。另外,还有一些类似的情况经常发生。例如,客户收到一份本不属于自己的账单却要求自己付款,或者客户被通知其不良的信用记录被送至征信机构,但账单上所显示的逾期金额为零等。发送一次错误数据给客户,可能会导致客户失去对企业长久以来的信任,企业因此而失去花费很大成本才维持的客户关系。
缺乏与实践“沟通”的变量
原始数据的另外一个缺陷是,缺少一些能与营销实践直接“沟通”的变量。比如,某企业新推出的信用卡产品定位在高端市场,目标人群是“高端人群”;然而在原始数据库中不可能有这个变量,因为“高端”是一个抽象概念,每个消费者都有不同的理解,所以只能是营销实践者根据需要来定义。这样的抽象变量还很多,比如“客户人生阶段”、“风险喜好”、“消费习惯”、“客户关系”等,而且它们往往都是制订营销方案过程中必需的资料。因此,原始数据库经常因为缺少这些变量而无法直接为实践所用。
何谓信息
信息是可以直接用于营销实践的消费者资料。它与数据最大的区别就是,信息是加工过的数据;它源于数据,但又高于数据。前面我们提到过,有两个原因阻碍了前线的业务人员直接将数据应用于营销实践:原始数据中存在的质量问题,以及数据与营销实践有时难以直接“沟通”。针对这两个问题,原始数据在数据工程阶段分别被转变成一级信息和二级信息,以适应实际应用的需要。首先,原始数据经过数据精练,即数据格式化、分类、归类等一系列步骤,可以变成一级信息。一级信息解决了原始数据中存在的质量问题,因此与原始数据相比,具有“准、全、精”的特点,能够更好地帮助市场营销人员制定出正确的策略。另外,将描述消费者不同方面的几个一级信息进行融合,可以得到一些与营销实践紧密相连的抽象变量,比如“社会阶层”、“风险喜好”、“家庭网络”等,我们称其为二级信息。与一级信息不同的是,二级信息是在数据工程阶段所建立的新的变量,可以看做是搭建在营销实践与原始数据变量之间的桥梁,是能与实际应用直接“对话”的“语言”。图2.3以图例形式说明了信息的分类。
从数据到信息:数据工程
从以上讨论中可以看出,虽然大量的原始数据为科学管理模式提供了前提,但真正实现却需要首先将原始数据转化为企业可以加以分析、利用的有价值的信息。数据工程即是实现从数据到信息的转化。
数据工程的流程
具体来说,数据工程包括以下几个步骤:
数据采集
数据工程的第一步是数据采集,即获取消费者数据。如前所述,数据包括外部数据和内部数据两种,但以内部数据为主要构成。内部数据的获取涉及每个信用卡业务环节,包括申请数据库、卡片数据库、账户数据库、交易数据库、授权数据库以及催收数据库等。此外,按性质来分,内部数据还可以分为静态数据和动态数据。接下来,这些数据被传递到数据仓库,等待下一步的处理。
数据仓库
数据仓库包括两个步骤:数据存储和数据提取。通过各种途径采集的数据,需要存储在一个统一的中央数据库中,便于以后的数据整理及分析工作。而如何从庞大的数据库中有效率地、准确地找到所需的数据资料,则是数据提取阶段面临的主要问题。
数据精练
数据精练是数据工程中最重要的部分,它主要解决前面所提到的数据质量问题,实现从数据到一级信息的转变。具体包括以下几个步骤:
·数据统一化:解决数据信息格式不统一的问题。由于客户的书写习惯不同,许多文字信息都会出现格式不统一的情况。如果不将其进行格式统一,两个信息就会被系统识别成两个不同的地址。
·数据分类:对每项数据进行有市场意义的分类,以方便将来市场工程进行市场细分。比如:收入分为较低、中等、较高;职业分为行政人员、教师、经理等。
·数据遗补:利用数据挖掘填补缺失的数据信息,解决数据缺失的问题。
数据融合
数据融合主要解决原始数据的第二个问题,即如何补充建立一些与市场营销直接相关的抽象变量。这些抽象变量我们称其为二级信息,比如“风险喜好”、“数据网络”等。拿“数据网络”信息来说,就是通过不同客户之间的一些一级信息匹配形成客户关系网络信息。
二级信息的获得主要是通过建立模型,将描述消费者不同方面的几个一级信息进行融合,得到这些与营销实践紧密相关的抽象变量。与一级变量不同的是,二级信息是在数据工程阶段所建立的新的变量,可以看做是搭建在营销实践与原始数据变量之间的桥梁,是能与实际应用直接“对话”的“语言”。
数据报告
数据工程的最后阶段,就是从客户、商户、银行的角度对银行管理的最新情况,以定期报告的形式反映给管理层以备制定策略之用。这些数据报告一般包括:
·客户管理报告:各市场细分客户的背景及其行为分析报告
·商户分析报告:分析每个商户近期表现及其与银行的合作状况
·银行管理报告:分析不同部门员工、分支行的绩效情况
以上就是数据工程所包含的步骤,图2.4进一步说明了这个流程。每个流程都有特定的实施目的,最终完成原始数据到有价值的、可读信息的转化。同时,需要注意到,前面所提到的数据质量问题并非一个静止的概念,在数据工程的每个过程中都可能产生相应的数据质量问题,要时刻注意和解决这些问题,最大限度地减少误差和错误的产生。数据资源就是数据采集和传递的过程,它是企业获得客户原始数据的过程;在数据仓库阶段,企业将原始数据存储至数据系统,就像是一个将货物装箱打包的过程;最后,在数据精练阶段,原始数据经过一系列包括数据统一化、数据分类、数据融合、数据检查在内的步骤,实现从数据到信息的转化。最后的客户信息总结阶段则是数据工程的总结,供管理层参考之用。
实际操作
数据工程涉及了企业内部许多部门,因此在实际操作中需要各部门相互配合而完成。从系统方面来说,各个数据库之间要相互协调,做到数据库系统之间尽量统一;从人员方面来说,数据工程涉及市场人员、管理人员、信息技术人员,需要分工合作;从企业管理组织方面来说,企业需要从每个部门中指定人员组成专门的部门,负责数据工程的每一个步骤,比如数据仓库小组、数据精练小组等。
在整个数据工程过程中,解决数据质量问题是其中最关键的一个步骤。因为随着时间的推移,企业数据不断增多,数据质量问题也会越来越严重。面对这样的现状,企业必须做出合理的应对,我们借用《数据挖掘导论》【Redman,2001】一书中的一个恰如其分的类比来说明关于数据质量问题的几种可能的解决方法。在这个类比中,我们可以将数据库比作一个湖泊,湖泊中的水相当于数据,注入湖泊的溪流则好比产生数据的信息链,湖泊上游的工厂则相当于数据库的污染源,而饮用湖水的人则相当于数据的使用者。
面对一个受到污染的湖泊,人们通常会采用以下四种方法:
【1】忽略水污染,仅对饮用了受污染的水而生病的人进行治疗。
【2】对湖水进行过滤,移走污染源,再将过滤后的水重新注入湖中。
【3】每天仅对一部分水进行过滤,例如,在入水口将新流入的水进行过滤,或者对即将饮用的水进行过滤。
【4】明确污染来源,移走或消除污染源。
类似的,对于一个质量“受污染”的数据库,一般也有相似的四种处理方法:
【1】忽略数据错误,仅对由于数据错误而产生的影响进行处理,包括修正错误的决定,安抚愤怒的客户及暂时缓解组织内部的不信任等。
【2】用各种手段进行数据库清理,包括调查客户、数据库之间的比较,并探究其间的差异、对数据进行自动测试以确定数据是否符合商业规则。
【3】每天对数据进行部分的处理,包括对新进的数据进行清理,或者对将被使用的数据进行事先清理。
【4】确定错误数据是由于信息链中哪个环节造成的,从而治理这一数据来源,防止生成新的错误数据。
对于一个企业来讲,一般会选择这些方法当中比较通用的方法。第一种方法显然是很少被人们选用的,如果一个企业能够意识到数据质量的重要性,就不会选择第一种方法。余下的三种方法,则各有优劣。第二种方法是最常用的一种,目前市面上有很多自动差错的软件,并且很多企业的IT部门可以比较熟练地使用这些软件,纠正错误可能要困难些,但是也可以选择由一些成本较低的外包公司来完成,虽然数据精练不是一件很简单的事情,但是通过足够长的时间的努力,这项工作还是可以很好地完成的。第三种方法是对一部分数据进行修正,这种方法对于那些只使用最新数据的企业也许比较适用,但对于大多数企业来讲,这种数据精练的方法还是不够深入和彻底。第四种方法则注重对未来错误的防范,这种方法明显具有长期的效益。经验告诉我们,很多错误都是由于很简单的原因造成的,因此改正起来相对也比较容易。
综上所述,第二种方法是比较常用的方法,第四种方法将会产生长期的效益。因此,大多数企业可以将这两种方法结合起来,解决当前已经发生或未来可能发生的数据质量问题。
本章小结
信息时代的飞速发展为企业内部积累了大量的数据,但是由于这些数据存在着不同程度的数据质量问题,并且缺少一些与营销实践密切相关的变量,因此需要将其转化为直接可利用的一级信息和二级信息。这个转化过程,我们称之为数据工程,并且可以细分为数据采集、数据仓库、数据精练、数据融合、数据报告五个部分。如果把数据比作面粉,信息就是可以直接消化的点心。如果把数据比作矿土,信息就是炼出来的矿产,而数据工程就是加工厂,它通过中间一系列的加工过程将数据转化成信息。在下面几个章节中,将按照数据工程的流程,并结合实际的项目经验,详细阐述如何在信用卡业务中通过数据工程实现从数据到信息的转变。
在本章中我们还看到,从数据到信息的转化过程中,其中一个重要因素就是数据质量的好坏。现在越来越多的企业意识到科学管理的重要性,因此纷纷引进先进的管理系统和管理方法来帮助企业进行内部管理,这些系统的建立和方法的引入并不难,但往往实施效果不尽如人意,最根本的原因就是企业内部缺乏成功运用这些系统和方法的先决条件,即高质量的数据基础。因此,我们要摒弃以前“数据库营销就是企业系统信息化”的传统观念;建立各种操作平台固然重要,但是如果不进行数据工程,所谓的数据分析只能是“垃圾进,垃圾出”,所得的营销策略也会阻碍企业目标的实现,丧失企业在激烈的市场竞争中的生存能力。