概念篇你了解旅游大数据吗?
大数据
概念
大数据的基本规则是,Bigger than Bigger(没有最大,只有更大)。
什么是大数据?
大数据就是数量极其庞大的数据资料,无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量复杂的数据集合。
大数据有多大?
1ZB = 1024 EB = 1024^2 PB = 1024^3 TB = 1024^4 GB。
如果你有一台1TB硬盘容量的电脑,那1ZB就是约等于10亿台电脑的容量,远远超出了我们一般的想象。
一天之内互联网上会产生多少大数据?
- 互联网一天产生的内容=刻满1.68亿张碟
- 2940亿封邮件=美国两年纸质信件的数量
- 200万个帖子=《时代》杂志770年文字量
- Facebook上2.5亿张图片=80座埃菲尔铁塔高
特征
Volume —— 数据量大
大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
Velocity —— 速度快时效高
要求秒级范围内给出处理结果。如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
Variety —— 类型繁多
种类和来源多样化。包括结构化、半结构化和非结构化数据,如网络日志、音频、视频、图片、地理位置信息等。
Fluctuation —— 周期性波动
伴随快速性,数据流呈现出波动的特征,不稳定的数据流会随着日、季节、特定事件的触发出现周期性峰值。
Value —— 价值密度低
浪里淘沙却又弥足珍贵。以视频数据为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
Online —— 数据在线
数据是随时能调用和计算的,这是大数据区别于传统数据最大的特征。如对于打车工具,客户的数据和出租司机数据都是实时在线的,这样的数据才有意义。
处理流程
-
Ⅰ 采集
利用多个数据库来接收多个来源的数据,可进行简单的查询和处理。
-
Ⅱ 导入 / 预处理
将巨量数据导入到集中分布式大型数据库中,并做简单的预处理。
-
Ⅲ 分析挖掘
对海量数据进行分析、分类汇总,满足常见及定制化分析需求。
-
Ⅳ 数据展示
利用图形图像处理、计算机视觉以及用户界面,对数据加以可视化解释。
应用
2015《大数据应用案例排行榜TOP100》各行业占比图
大数据应用至各行各业
根据2015年互联网周刊发布的《大数据应用案例排行榜TOP100》分析得出:大数据应用行业包括零售(24%)、金融(17%)、城市(14%)、医疗(8%)、体育(6%)、教育(4%)、电信(4%)及其它领域(航空制造业、娱乐影视业、旅游业、农业等)。
大数据重点应用在体验性服务业
由于大数据中较大部分是人们在使用网络信息技术设备时自然生成并记录下来的数据,是人们内心真实需求及其性质特征的有意识或无意识自然表露,因此,大数据对以体验为主的各种服务型产业(如图所示)的作用比主要用标准化、工厂化的物质产品生产产业更有价值,用来了解、分析、掌握个性化旅游消费需求更是非常有效。
- 零售
- 传媒
- 心理咨询
- 餐饮
- 医疗
- 通讯
应用场景之一:互联网行业
百度利用大数据预测未来
应用场景之二:零售业
“啤酒+尿布”组合,促进沃尔玛收益成倍增长。
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,年轻男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段,没想到这个举措居然使尿布和啤酒的销量都大幅增加了。
“孕妇客群预测”,有效甄别潜在客群并精准营销。
美国第二大超市塔吉特百货(Target)根据顾客数据建立模型,选出了25种典型孕妇类商品的消费数据构建了“怀孕预测指数”,确定哪部分顾客群属于孕妇类顾客群体,市场营销部门对于这部分顾客定向发布孕妇优惠广告。根据这个“大数据”模型,在2002年到2010年间,Target的销售额从440亿美元增长到了670亿美元。
应用场景之三:交通运输业
百度迁徙地图
2014年百度春节迁徙地图上线。这是基于定位服务的人口迁徙大数据项目,该项目通过分析手机网民的定位信息,经过大数据计算后得出国内各大城市的春运8天内人口迁徙轨迹及特征。
了解中国产业结构变化和人群生态变化的最简单途径
也许可以帮助铁道部思考下一步的高铁线路怎么铺设;也许可以帮助在火车上卖WIFI的小哥选择最热线路……
- 2015年2月19日早上8:00
全国迁徙图 - 2015年2月19日早上8:00
十大迁入城市迁徙图 - 2015年2月19日早上8:00
十大迁入城市的第一名:重庆
旅游大数据
类型
20%为结构化大数据
是指按照特定格式整理的数据,能被核心系统进行储存管理,简单而言,就是数据库。
就旅游大数据而言,结构化旅游大数据包括旅游企业ERP、财务系统等。
80%为非结构化大数据
是指其他所有格式的数据,如办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等。
具体到旅游大数据中,包括社交网络中的旅游数据、景区景点的监控视频、旅游音频、旅游视频、游客点评等。
- 数字
- 音频
- 文字
- 视频
- 网络日志
- 地理位置信息
来源
行业外数据与行业内数据相结合
搜素引擎数据
百度、谷歌等用户搜索记录、应用APP数据等
百度搜索数据:年度千万游客旅游搜索数据+95%中国网民广义搜索数据+50万开发者的百度LBS数据,数据量总数达1000PB(千万亿级),形成中国最大的消费者行为数据库;
谷歌搜索数据:单日9100万搜索请求数据+50%的互联网搜索量数据+不计其数的用户属性虚拟资料,年度数据总量达100TB(万亿级),形成全球最大的互联网数据库。
通信运营商数据
移动、联通、电信等通信运营商的用户信息、上网记录、通话、地理位置等数据
运营商拥有的数据数量都在10PB以上;年度用户数据增长约数十PB。
线上旅游服务商数据
OTA、大型旅游企业及社区类、点评类、攻略类等线上服务平台的旅游数据
携程数据:单日3.6TB入库数据+31%在线旅游市场份额+1.4亿的用户携程攻略社区数据;
到到网数据: 3.4亿月访问量数据+2亿条旅游点评和评论数据+单日120GB日志数据,年度数据总量达100TB(万亿级)。
智慧旅游数据
智慧城市的旅游信息数据库、行业经济数据、气象数据、人文数据等;
智慧景区的票务数据、监控数据、一卡通数据等;
智慧酒店的在线预订和入住数据、顾客信息及行为偏好数据。
相关概念
旅游大数据与智慧旅游
大数据让旅游更“智慧”
智慧旅游是指利用云计算、物联网等新技术,通过互联网、终端上网设备,主动感知旅游信息,让游客及时了解信息,安排旅游计划。
智慧旅游产业链
- 用户搜索与预定旅行旅游业最前端
- 吃住行等服务供给基本旅游服务
- 旅行过程的智能指南增值服务
- 后续服务与用户分享用户反馈与社交
旅游大数据“智慧”旅游管理
- 目的地旗舰店全媒体信息平台
- 旅游大数据管理系统
- 旅游目的地内容管理平台
- 旅游舆情监控平台
- 移动执法管理平台
- 旅游客流监控平台
旅游大数据“智慧”旅游服务
- 社会化旅游服务体系
- APP解决方案
- 景区智能硬件设备
- 旅游全景导航
- 地图应用
- 翻译应用
旅游大数据“智慧”旅游营销
- 在线旅游营销
- 游客行为分析
- 营销数据统计分析
- 客源地分析
- 电子商务
- 客户关系管理
智慧旅游主要媒介:
- 触摸屏
- 社交网络
- 一卡通
- 移动端
- PC 端
智慧旅游使大数据更“大”
公众WIFI是高性价比的游客信息采集渠道
- 获取游客的手机号码数据
- 获取游客微调研问卷数据
- 了解游客具体位置数据
旅游一卡通是最佳游客行为数据采集措施
- 获取旅游消费清单数据
- 采集游客旅游消费轨迹数据
旅游手机应用是高性价比的游客行为采集渠道
- 游客信息关注行为数据
- 采集游客旅行轨迹数据
- 获取游客满意度调研与反馈数据
旅游咨讯网是采集潜在消费者信息的渠道
- 采集消费者旅游信息关注数据
- 采集的旅游网络营销效果评估数据
- 获取智慧化的旅游信息服务数据
旅游呼叫中心是采集高价值游客信息的渠道
- 采集游客需求数据
- 采集旅游 CRM 维护平台
- 采集旅游新产品市场数据