期刊专题 | 加入收藏 | 设为首页 12年实力经营,12年信誉保证!论文发表行业第一!就在400期刊网!

全国免费客服电话:
当前位置:首页 > 免费论文 > 管理论文 > 市场营销 >

个性化新闻建模研究

1用户兴趣模型的表示

本文采用基于本体的加权关键词兴趣表示方法。用户兴趣模型是新闻领域本体的部分映射,由其中部分兴趣类别和特征词组成。用户兴趣的层次结构如图2所示。该方法通过不同组合的概念节点及其权值构成用户个体兴趣本体来表示用户的兴趣概念。通过调整各个节点的权值或增加相应的主题节点适应用户兴趣的变化。

2用户兴趣模型的更新

用户兴趣分为长期兴趣和短期兴趣,兴趣是不断发生变化的。长期兴趣反映出用户长期的偏好特征,短期兴趣随着时间的推移发生改变。一般情况下,每个用户都会对某种类型的新闻内容有稳定的兴趣。比如某用户喜欢足球新闻,且喜欢科技类新闻等类别,这属于长期兴趣,不易改变。除长期兴趣外,用户可能在某个特定时期临时关注某些信息,这属于短期兴趣。比如某用户某段时间想购买电脑,所以对关于电脑的信息特别关注,但购买之后关于这方面的信息就不再关注了。还有些短期兴趣是周期性的,比如每到五一假期,很多人对旅游产生兴趣。识别用户的短期兴趣,只能通过统计用户使用系统的记录,但是用户的短期兴趣持续时间短,很难与用户偶然性的浏览相区分。本文所建立的用户模型将用户的长期兴趣和短期兴趣相结合,能同时反映出用户的长期兴趣和短期兴趣的变化,所以使推荐更加准确有效。本文用户兴趣模型采用基于本体的加权关键词兴趣表示方法,它随着用户兴趣的变化也进行相应的更新。从存储的容量和运行的效率考虑,需淘汰用户次要的和过时的兴趣特征。本文用户兴趣模型主要通过调整用户兴趣的特征词及其权重,来体现用户兴趣的变更。用户兴趣模型的更新方法:当系统发现用户一个兴趣特征时,查询该用户现有的兴趣特征。如果此兴趣特征已经包含在兴趣模型中,则对该特征词的权重和时间进行修改。如果发现此兴趣特征不在用户兴趣模型中,且用户兴趣模型有剩余的存储空间,则直接在用户兴趣模型中生成一个新的兴趣特征。如果用户兴趣模型的存储空间已满,则需淘汰权重低的兴趣特征后,添加新的兴趣特征【10】。特征词权重的更新方法如式(4)所示,不是将TF/IDF值直接累加,而是将原模型中的所有特征词的权重乘以一个衰减系数。新的特征词的权重也不是直接归并进去,归并的时候需要乘以用户对该篇新闻的兴趣度,兴趣度在用户兴趣收集时已计算。

3相似度计算

前文提到新闻页面的表示方法采用向量空间模型的方式。首先需要对新闻页面内容进行分词,特征词提取以及对文本特征进行表示,然后计算特征值的权重。特征词按照其TF/IDF值降序排列,因为权值高的特征词能够更好的反映该新闻文本的的内容,而权值低的词与新闻本身的内容关系较弱。所以只需要使用最能够代表新闻特征的前N个特征词及其权值参与计算即可。在进行新闻页面的匹配时,从用户兴趣模型除根节点外的第一层开始计算,取相似度最高的兴趣子类作为该页面的类别。同时该结点与新闻页面的余弦相似度计算的值作为该页面与用户的兴趣相似度,作为该页面是否符合用户的兴趣的衡量标准。本文来自于《情报情报科学杂志简介详见

4结语

本文研究了基于领域本体构建用户兴趣模型。在模型中设置三层用户兴趣类别,子层与父层是从属关系,子层兴趣度的衰减能够影响父层的兴趣度。根据用户行为,分析用户对新闻页面的偏好程度,反映到用户兴趣模型中,能够及时反映出用户兴趣的变化。该模型提高医学论文例文了人性化程度,能够更好的为个性化新闻服务提供基础。

作者:宫玲玲 乔鸿 单位:山东师范大学


    更多市场营销论文详细信息: 个性化新闻建模研究
    http://www.400qikan.com/mflunwen/gllw/scyx/194632.html

    相关专题:网站文章采集器 愿你与这世界温暖相拥


    上一篇:远程控制视角下的农业环境监测
    下一篇:没有了

    认准400期刊网 可信 保障 安全 快速 客户见证 退款保证


    品牌介绍