大数据知识初探
由于某种原因,让我不得不研究一下大数据,有些像临阵磨枪,只希望能起到不快也光的效果吧。说来也惭愧,我还算是一个搞代码的程序员,但却从来没有在如此炙手可热的领域内研究一番。虽说术业有专攻,但也不能只在一个领域内闭门造车啊,深度和广度都要发展。
本次学习的目录:
- 运营商与互联网大数据;
- 运营商大数据实例;
- 联通大数据介绍;
- 移动案例及待研究对象
一、
什么是大数据?大数据有什么特性?
“大数据”四大特性:高容量、高增长率,高维度,高性价比。
数据之间总会有某种的相关性,因此你的数据量越大,你的发掘就会有价值。因为他遵从一定的大数据定理,有规律的随机事件大量地出现的条件下,就会出现必然的结果。就比如抛硬币,你的抛的次数越多,每面的概率越接近1/3,因此研究大数据,能发现出某种必然的信息。
对于一个企业来讲,大数据技术能够让公司及时发掘潜在的信息,抓住先机,提高公司的竞争力。健康医疗,购物,房地产,金融,政治,电信等行业都能应用上。
- 奥巴马在总统竞选中使用大数据分析来收集选民的数据,让他可以专注于最有可能投他的选民 。
- 电信可根据大数据分析用户流失的原因,从此提高用户体验。
运营商数据和互联网数据的对比
虽然都称得上是大数据,但运营商和互联网大数据还有很大的不同,可以说运营商数据有着其他互联网大数据无可比拟的优势。
- 数据的全面性。运营商是所有通信的管道,几乎所有数据你都要走我们通道,因此我们拥有着所有的用户行为数据。任何人或企业的语音或数据业务都是流淌在运营商的管道里。而互联网它是存在固有的缺陷。比如BAT,每个公司都有自己的大数据,但大数据之间是隔离的,谁也不知道谁的数据。
- 唯一的ID。现在号码全部实名制,每个人具有唯一的ID,不管你在京东叫蓝天,还是在淘宝叫白云,在运营商都是一个人,一个唯一的ID,我们也就保持了单个人的数据的完整性。
二、运营商大数据
大数据其中最重要的特性就是具有多维度,我们可以通过多维度去研究大数据,挖掘价值信息。
- 位置。通过用户位置信息,了解用户的出行特征,为用户提供出行便利;
- 通信。通过用户的通信使用情况,比如本地,漫游,长途,了解用户通话行为特征;
- 上网。上什么网址,下载什么应用,访问什么内容,得到上网喜好,分析用户行为。
- 社交。基于通信交往圈的大小,主被叫,时间序列,得到用户的社交特征。
- 终端。识别记录手机终端型号,了解用户手机使用特征,发展趋势,用户换机周期等。
- 。。。。。。。
四、移动案例
1.国庆出行分析
分析出京游分布,入京游分布等等多维度信息。
2.时间序列预测话务量,随机森林模型探索网络指标与用户满意度的关系。
--------EOF---------
微信分享/微信扫码阅读
微信分享/微信扫码阅读