大数据案例精析
上QQ阅读APP看书,第一时间看更新

4 建设目标

东方航空大数据项目的发展目标包括业务目标和技术目标两个方面。

4.1 业务目标

东方航空建设实时处理大数据平台,希望能达到以下业务目标:学习国内外先进的大数据项目成功经验,聚焦客户和产品中心,以“东方万里行会员”常旅客信息为基础,结合内部其他应用系统和新兴大数据,围绕客户和产品信息建立大数据分析体系,充分挖掘信息的价值,并应用于东方航空的应用和服务场景,切实辅助其他应用以提升业务处理能力,从而为会员用户提供更好的服务体验并实现会员收入提升。例如,为客服人员提供全方位的客户视图和推荐建议,为贵宾厅提供个性化服务建议,为领导者提供实时分析或趋势预测报告,支撑领导者进行重大决策等。

4.2 技术目标

构建统一的实时处理大数据平台,总体的技术目标包括:

(1)要与其他的系统紧密配合,实现数据融合,有利于对东方航空整个企业的所有数据进行统一管理和分析;

(2)提供数据应用,有利于为企业全数据提供统一展现和服务能力;

(3)为实时处理大数据平台提供数据分析模型和实时/联合数据访问支撑,为数据仓库提供数据卸载和高耗时数据处理能力卸载,从而降低在数据仓库等高价值系统上的成本,让数据仓库更好地为数据集市服务,从而实现整体成本的降低;

(4)进行大数据平台基础设施建设,为数据建模开发、界面展现及数据留存方面提供技术支撑。

在明确总体目标的基础上,东方航空还对实时处理大数据平台提出了以下具体的目标:

(1)DPI报文采集识别。

采用DPI(Deep Packet Inspect,深度报文识别)技术可以对互联网上用户使用互联网业务产生的各种流量数据,从底层传输协议到上层应用报文进行精确的识别和分类,从而将其中能体现用户的身份信息、访问内容等有价值的字段、数据片等信息提取出来,并且提取字段还可以根据用户的需求进行定制。

(2)数据挖掘分析。

通过分析用户上网报文,可以识别具体的客户端类型,可以分析和提取重要的航空客户端、OTA(Online Travel Agency,在线旅行社)商旅客户端的用户账户、手机信息、IP地址,可以分析用户手机的所在地、漫游的地市等信息,可以识别用户的订票行为,并确定是否是具备挖掘潜力的高价值用户。

(3)数据整合。

建立以运营商传输层全量镜像数据为基础,整合大数据联盟成员用户标识之间的直接或间接的关系映射,通过用户在互联网上的访问行为,提取用户账号信息、喜欢搜索的关键词、喜欢访问的站点类型等信息,对未知用户、潜在用户和存量用户分别建立画像。这些丰满、立体、动态的用户画像能够全面反映用户的行为习惯、需求和关注点。与此同时,为各种分析、推广场景提供技术手段和依据。通过对采集汇聚的源数据进行聚类、脱敏、加权、偏移、算法、筛选等加工,将数据标签化,保证无关方无法逆推倒至源数据;并利用实测/效果累计等方法,进行公允评价。