为方便算法模型描述,将上述向量进行形式化:
企业招聘信息向量集记为:E:{e1,e2,e3,…,em}
个人求职信息向量集记为:P:{p1,p2,p3,…,pn}
企业招聘信息向量记为:
e1(e11,e12,e13,…,e1k),…,em(em1,em2,em3,…emk)个人求职信息向量记为:
p1(p11,p12,p13,…,p1k),…,pn(pn1,pn2,pn3,…pnk)
3.3 量化规则
3.3.1 企业招聘在向企业单位推荐人才时,以企业招聘信息向量为标准向量,其各个分量的值设为1,对于筛选出来的符合要求的求职信息向量集,其每个向量的分量取值范围为[0,1]。
3.3.2 个人求职
在向求职者推荐工作岗位时,以个人求职信息向量为标准向量,其各个分量的值设为1,对于筛选出来的符合要求的企业单位招聘信息向量集,其每个向量的每个分量取值范围为[0,1]。
3.4 向量相似度计算
向量相似度计算采用夹角余弦公式表示,计算公式如下:
3.5 向量分量权重设置
式(1)中向量各分量的权重是相等的,考虑到实际情况中各个因素所起的作用有大有小,在计算向量相似度时给各分量设置权重值,对影响大的分量调高权重值,反之降低权重值。
为便于计算,对式(1)的分子即式(2)进行加权计算,式(2)改进后如式(4)所示。
系统初始运行时各权重值预先设定为经验值,系统稳定运行一段时间后,可以通过统计用户历史数据来调整各分量的权重值(系统给出建议由用户手工调整),各参数也可根据工种设定不同的权重值。
4 实验结果分析
4.1 实验数据
为了验证该推荐算法的效果和实用价值,需要选取一组实验数据来进行实验验证,由于该领域还没有一个统一和权威的数据库,所以本文自定义数据库,该实验数据集中有10万条招聘信息和20万条求职信息,同时在本实验中,被用作用户偏好特征项的简历字段项为“工种”、“性别”、“学历”、“薪酬”、“职称”、“住宿要求”、“年龄”、“工作地点”。
4.2 推荐算法验证
基于内容过滤的推荐算法能够有效地向招聘求职双方推荐各自感兴趣的对象,实现实时推荐。为了测试该算法的匹配精度及实时推荐效率,从数据库中随意抽取5名求职者和5个工作岗位作为试验样本,通过匹配算法求得匹配度分别如表1、表2所示。
推荐的成功率,增加用户对系统的信任程度。
图1则展示了随着数据量的增加,系统在向求职用户和招聘单位进行实时推荐时所用的时间会逐渐地增加,但时间消耗最终还是控制在用户可以接受的范围以内。因此,本文的算法在时间效率上也是可行的。
5 结语
本文算法可以保证将匹配度最高的用户优先推荐,将双向推荐算法与传统的关键字检索相结合,可望提高招聘网站的服务能力,满足用户的需求,发挥网络招聘高效、快捷的作用,该成果已经应用于江门市人才招聘网站系统中。
参考文献:
[1] RESNICK P IAKOVOU N,SUSHAK M E GROUPLENS.An open architecture for collaborative filtering of netnews[C].proc 1994 Computer Supported Cooperative Work Conf,Chapel Hill,1994:175-186.[2] 曹 毅,贺卫红.基于内容过滤的电子商务推荐系统研究[J].计算机技术与发展,2009,19(6):182-185.
[3] 张维瑞.网络招聘信息个性化推荐技术研究[D]. 大连:大连海事大学, 2010.
[4] BUCKLEY C S,ALTON G,ALLAN J E.Automatic query expansion using SMART[R]. 1995.
[5] SALTON G, BUCKLEY C.Improving retrieval performance by relevance feedback[J]. Journal of the American Society for Information Science,1990,41(4):288-297
[6] 陈晓,王建民.面向网络招聘的个性化简历推荐算法研究[J].计算机科学,2008 , 35 (10):79-82.
[7] LINDEN G, SMITH B, YORK J.Amazon.com recommendations: Item-to-Item collaborative filtering[J]. IEEE Internet Computing,2003,7(1):76-80.
[8] 宋晴晴,胡正华.网络招聘中基于本体的双向个性化推荐框架[J].情报探索,2009(1):81-84.