一、移动互联网形势下的客户分类技术
(一)应用分类技术
电信运营商可根据客户对APP(应用)的下载量,选择建立标准应用库,通常分为四个步骤:一是电信运营商与相关主流互联网厂商紧密合作,从而爬取及分享互联网应用的介绍、下载地址、标签等数据信息;二是对于那些没有统一地址的手机应用,可以根据服务器的分布,对其进行地域验证;三是建立标准应用库与信息点分类标准之间的映射关系;四是构建电信运营商自有基地业务(如电信八大基地业务涵盖音乐、视讯、物联网、协同通信、应用商店、游戏、动漫、阅读)与标准应用库之间的映射关系。根据上述四步骤建立标准应用库之后,再进行应用解析,包括对客户使用的解析与对客户下载的解析。客户使用的解析主要包括私有协议与公有协议两种情况,可将其分别解析为交互方式-视频类与社交-交友类两种解析方式。客户下载解析主要是通过域名与URL,解析为家庭-购物类。
(二)Web内容分词技术
Web内容分词技术,是指从海量的Web页面描述数据中发现数据信息,从中抽取知识,并对其进行分词处理的一种技术。从我国目前所用的汉语自动分词技术来看,其主要可分为基于理解的分词技术、基于统计的分词技术以及基于字符串匹配的分词技术三种。基于理解的分词技术主要是利用计算机模拟人对句子的理解,以此来达到识别词的目的,该技术在分词的同时,还可以对词的语义、句法等进行深入分析,并利用语义与句法信息,对歧义进行处理。基于统计的分词技术是指对语料中相邻共现的各个字的组合频度进行统计分析,以此来计算它们的互现信息,达到Web内容分词处理的作用。基于字符串匹配的分词技术主要是依据相应的策略,将需要分析的汉字串与机器词典中的词条进行匹配操作,以便能在词典中找到相对应的字符串,达到成功匹配的目的。
(三)URL特征分类技术
规则URL分类。规则URL分类技术主要是利用多级域名或目录,对网站的内容URL进行编码操作,从而建立热门网站频道与URL分类的相关映射关系,并采用爬虫技术,对所收集的热门网站URL进行分类处理。无规则URL分类。无规则URL分析技术主要是指应用同一格式编码,利用上网日志来获取客户访问的无规则URL,然后再应用网络爬虫技术,爬取URL对应的网页内容,最后通过分词技术将相关的内容拆分成单个词,通过文本分类算法、关键词匹配等技术,来识别URL分类通过URL特征分类技术,可以对客户上网行为进行如下分类:一级分类,生活服务、休闲娱乐、文化教育等;二级分类,商业经济、交通旅游、软件下载等;三级分类,导航地图、游戏平台、广告营销等;四级分类,交友综合、原创、办公应用等。
二、客户分类挖掘算法及分类过程
(一)客户分类挖掘算法分析
基于移动互联网的客户分类常用的挖掘算法主要有四种:一是时间序列算法。在电信行业,可通过时间序列算法,对客户的上网行为信息进行科学、合理地预测,同时利用周期性分析、趋势分析等有效的分析策略,为电信客户提供并推荐最合适、最实用的产品套餐,并以此来提升客户的上网流量。二是关联规则算法。关联规则算法是指对客户上网行为之间的关联规则展开分析,帮助电信运营商针对电信客户的个性化需求提供最合理、最实用的服务,通过该算法,可分析客户购买的电信产品之间的关系性,进而利用捆绑销售、交叉销售等方式增加销售额。三是聚类算法。聚类算法是将看似无序的对象进行归类、分组,最终达到理解研究对象的目的。在移动互联网背景下,对客户行为进行分析时,网站的信息分类、用户社交圈、网页的点击行为关联性等问题,均可利用聚类算法进行解决,电信运营商常用该算法进行客户群体细分、客户特征识别。四是决策树算法。该算法属于电信行业应用较广的归纳推理算法之一,利用该算法可快速创建挖掘模型,通过易于解释的模型,达到对客户流失、广告定位、风险管理等行为特点的分析。
(二)客户分类过程分析
首先,利用客户的移动互联网行为数据,找出客户访问内容、网站、上网时段、使用的客户端等信息,经过分析获取客户的上网行为偏好。其次,定时对客户的上网行为规律信息以及上网偏好信息进行汇聚、归纳,总结出客户对各类兴趣需求点按日计算的访问量统计值。最后,根据客户的移动互联网消费行为、网络行为、生命周期等客户特点,对客户的终端偏好、数据业务偏好、产品偏好等偏好进行分类分析,进而获得客户的特征数据。
三、结束语
上述针对移动互联网形势下客户特点的分类技术分析,为电信运营商的客户服务提供科学、实用的参考依据。但是在移动互联网时代安徽职称,仅仅依据客户特点进行分类还不够,后续还需要进一步的在客户行为轨迹上的开展深入研究。
作者:林峰 单位:天翼爱动漫文化传媒有限公司