论核心网数据挖掘的移动通信用户行为分析及应用

(整期优先)网络出版时间:2020-12-09
/ 2

论核心网数据挖掘的移动通信用户行为分析及应用

李建 丁嘉林

广州杰赛科技股份有限公司, 广州 510310


摘要:在互联网时代,强调语音通信质量的用户需求在不断创新,对数据服务的需求也在不断增长。希望语类型可以在任何地方保持通话顺畅,并且用户需求变得越来越多样化。用户行为调查旨在获取有关用户的基本数据,分析并避免在使用数字设备业务的决策,并将这些决策应用于运营商的业务策略,结合实际情况保证决策支持。

关键词:核心网数据挖掘;移动通信用户;行为分析

科学技术的发展促进了移动通信行业的快速发展,运营商网络建设规模逐步提高,移动通信用户数量逐渐增加。在网络的运营和维护中,企业正在积累大量的数据信息,这些数据信息记录了用户的行为信息,并增加了数据库中有用信息的证据,这是当前移动通信行业中亟待解决的紧急问题,对国家的发展起着重要作用。

  1. 移动通信用户行为分析方法

从移动通信角度分析用户行为时,必须确定和分析数据源,并且不能凭空创建数据。必须建立在数据源上并具有强大的数据支持,以便分析结果具有说服力。当使用移动通信设备拨打电话时,通常是一个听到声音而另一个听不到声音,这种情况会严重影响用户的感知并导致呼叫失败。从信令过程分析用户行为时,会建立呼叫,但不会建立网络与用户之间的信令交互,因此无法查明单路径的原因,并且无法收集和收集数据。对于常规信令数据,没有用户平面数据,因此必须将定位和用户行为结合起来。大多数移动通信用户选择挂断并再次拨打一个电话。此行为是异常的用户行为。由于一个呼叫的持续时间长而两个呼叫的持续时间短,因此该方法不适用于分析此类行为,并且用户的行为会有所不同。

  1. 移动通信用户行为分析流程

  1. 数据采集

数据收集是数据挖掘的基本任务。移动通信的数据源有很多类型,主要包括以下几种,第一种,客户数据。客户数据挖掘负责人分为业务维度和终端维度。第二种,计费数据。计费数据主要是指与消耗有关的数据,例如在移动互联网通信期间的时间戳和用户的运输费用。第三种,账户数据。帐户数据主要是指与用户帐户关联的数据,例如用户编号和使用的软件包。第四种,业务数据。业务数据主要包括移动通信网络数据和其他与业务相关的数据。网络数据包括诸如移动用户识别码、服务小区I和基站功率之类的信息。业务数据还包括异常呼叫和异常设备警报等信息。由于收集的数据源种类繁多且格式不一致,因此必须在数据挖掘之前对数据进行预处理。

  1. 数据预处理

数据预处理方法包括数据清理、数据合并、数据转换和协议。数据清理负责检测和解决三种类型的问题。一种是一个用户仍然有电话和交通记录。可以通过语义网中定义的单个操作约束来检测此类问题。第二个是冗余的用户行为记录,例如具有完全相同内容的用户行为数据的重复传输,其中为系统中包含的每个记录计算并存储了数字签名。当新的用户行为记录到达时,可以通过比较数字签名来发现并消除潜在的冗余。第三,通过分析用户行为的语义模型,用户行为记录之间的冲突关系(例如,同时出现在两个不同位置的用户)可以检测到这些冲突,并且符合预测的解决规则。

  1. 常用挖掘算法

分类是确定对象所属的预定义目标类别。例如,对在集成营销中表现相似的用户进行分类。需要检查的分类算法包括KNN,支持向量机和Basian理论。进行分类时,主要用户聚集具有相似行为或特征的用户,发现潜在的用户群,并对各种用户做出响应。该集团采用更具针对性和人性化的服务来提高营销准确性。与分类不同,聚类是一种不受监视的算法,要分割的类别事先未知。常见的聚类算法是Kmes、分层聚类等。相关规则挖掘,相关分析包括时序手指挖掘方法。关联规则挖掘的目的是发现隐藏在大型数据集中的复杂项目集,例如发现高度相关的用户行为。时间序列模式挖掘的目的是增强一系列事件(例如用户发现)的相关性和顺序。

  1. 移动用心用户行为的数值模型及其应用

  1. 用户行为建模需要建立在拟合分析的基础上

数值结果的进一步研究和分析是数据挖掘中的重要任务。通过分析过程,可以发现数据存在的规律,获得相关规律的经验公式,并阐明系统参数与输入和输出参数之间的关系。明确样本点与样本点变量值之间的关系,并在分析过程中获取数据样本连接函数线,此过程称为拟合。所获得的拟合曲线的参数值以准确度为特征,可以清晰反映语音音量的定量关系。

  1. 用户群分布趋势

对用户组分布趋势的研究应基于所有用户组质心的权重相同。通过研究和分析,用户流量消耗尚未养成良好的习惯,移动互联网普及率较低,中型流量用户群体的用户数量最多,流量基准也高低。可以看到该用户组的使用率较低,有必要将语音和数据两种服务有机地结合起来,以总交易量为基础,弄清语音和数据服务的比例,并明确两者之间的转换关系。等效价值曲线应用于量化用户水平,合并用户交易量以确定用户价值水平以及分析用户的总体价值贡献。当用户的价值贡献更快增加时,代表了用户增长会更好。

  1. 用户行为数值模型

用户曲线流量拦截是区分用户组的重要指标。如果用户的基准流量很低,则意味着存在发展空间。当今市场上的大多数运营商套餐主要针对套餐中的产品采用定价方法和超额计费。包括不同的价格和不同类型的包装,客户选择的软件包主要与他们的使用需求有关。在所有传统移动设备中,语音通话消耗最多。随着多媒体产业的逐步发展和完善,用户消费的主要内容是流量。显示用户消费行为的前卫性质,并且用户流量的比例相应增加。

结语:伴随科学技术的发展,电信行业的用户数量趋于迅速增长,数据信息的传输速度不断提高,用户的行为日益丰富。在互联网时代,强调语音通信质量的用户需求在不断创新,对数据服务的需求也在不断增长,人们希望可以在任何地方都保持畅通无阻的通话,并且用户需求也变得越来越多样化。因此,应加强数据资源挖掘,优化数据资源流程,使用聚类分析方法进行数据预处理,基于拟合分析建立用户行为建模以及合理化用户群分布趋势,分析并明确用户的各项行为。

参考文献:

[1]牟磊. 移动通信核心网数据的用户行为分析[D].北京邮电大学,2018.

[2]马磊.基于核心网数据挖掘的移动通信用户行为分析及应用[J].信息系统工程,2017(03):23.

[3]熊伟. 基于核心网数据挖掘的移动通信用户行为分析及应用[D].北京邮电大学,2014.