大数据知识初探

        由于某种原因,让我不得不研究一下大数据,有些像临阵磨枪,只希望能起到不快也光的效果吧。说来也惭愧,我还算是一个搞代码的程序员,但却从来没有在如此炙手可热的领域内研究一番。虽说术业有专攻,但也不能只在一个领域内闭门造车啊,深度和广度都要发展。

        本次学习的目录:

  1. 运营商与互联网大数据;
  2. 运营商大数据实例;
  3. 联通大数据介绍;
  4. 移动案例及待研究对象

 

一、

什么是大数据?大数据有什么特性?

“大数据”四大特性:高容量、高增长率,高维度,高性价比。

 数据之间总会有某种的相关性,因此你的数据量越大,你的发掘就会有价值。因为他遵从一定的大数据定理,有规律的随机事件大量地出现的条件下,就会出现必然的结果。就比如抛硬币,你的抛的次数越多,每面的概率越接近1/3,因此研究大数据,能发现出某种必然的信息。

对于一个企业来讲,大数据技术能够让公司及时发掘潜在的信息,抓住先机,提高公司的竞争力。健康医疗,购物,房地产,金融,政治,电信等行业都能应用上。

  • 奥巴马在总统竞选中使用大数据分析来收集选民的数据,让他可以专注于最有可能投他的选民
  • 电信可根据大数据分析用户流失的原因,从此提高用户体验。

 

运营商数据和互联网数据的对比

虽然都称得上是大数据,但运营商和互联网大数据还有很大的不同,可以说运营商数据有着其他互联网大数据无可比拟的优势。

  1. 数据的全面性。运营商是所有通信的管道,几乎所有数据你都要走我们通道,因此我们拥有着所有的用户行为数据。任何人或企业的语音或数据业务都是流淌在运营商的管道里。而互联网它是存在固有的缺陷。比如BAT,每个公司都有自己的大数据,但大数据之间是隔离的,谁也不知道谁的数据。
  2. 唯一的ID。现在号码全部实名制,每个人具有唯一的ID,不管你在京东叫蓝天,还是在淘宝叫白云,在运营商都是一个人,一个唯一的ID,我们也就保持了单个人的数据的完整性。

二、运营商大数据

大数据其中最重要的特性就是具有多维度,我们可以通过多维度去研究大数据,挖掘价值信息。

  1. 位置。通过用户位置信息,了解用户的出行特征,为用户提供出行便利;
  2. 通信。通过用户的通信使用情况,比如本地,漫游,长途,了解用户通话行为特征;
  3. 上网。上什么网址,下载什么应用,访问什么内容,得到上网喜好,分析用户行为。
  4. 社交。基于通信交往圈的大小,主被叫,时间序列,得到用户的社交特征。
  5. 终端。识别记录手机终端型号,了解用户手机使用特征,发展趋势,用户换机周期等。
  6. 。。。。。。。

 

 

四、移动案例

  1.国庆出行分析

   分析出京游分布,入京游分布等等多维度信息。

2.时间序列预测话务量,随机森林模型探索网络指标与用户满意度的关系。

 

--------EOF---------
微信分享/微信扫码阅读