本文作者:陈笑筑;王东;陈笑蓉;成功正常投稿发表论文到《商场现代化》2009年19期,引用请注明来源400期刊网!
【摘要】:针对Html网页结构的特点,网页的不同标记信息所辖的特征项包含不同的类别信息,通过抽取网页不同标记信息内的特征项并赋予不同权重来表明其重要程度。实验证明该方法比单独依赖网页内容信息的分类在效果上有所提高。
【论文正文预览】:一、引言随着互联网技术的不断发展,web网已经成为一个巨大的信息源,成为人们获取信息的重要来源。由于Web网页中蕴藏的信息资源内容广泛,形式各异,有效组织和管理这些资源尤为重要,通过网页的自动分类可以更好地对其进行组织和管理,加快信息检索的速度。然而,web页面中存在
【文章分类号】:TP393.092
【稿件关键词】:网页分类特征项权重计算
【参考文献】:
- 郭晓;蒋宗礼;;基于网页结构与链接关系的中文文本分类方法[J];现代电子技术;2010年22期
- 初建崇;刘培玉;王卫玲;;Web文档中词语权重计算方法的改进[J];计算机工程与应用;2007年19期
- 何中市;刘里;;基于上下文关系的文本分类特征描述方法[J];计算机科学;2007年05期
- 胡健,陆一鸣,马范援;基于HTML文档结构的向量空间模型的改进[J];情报学报;2005年04期
- 呼声波;刘希玉;;网页分类中特征提取方法的比较与改进[J];山东师范大学学报(自然科学版);2008年03期
- 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
- 邢玲;马建国;李幼平;刘志文;;一种基于UCL的中文网页信息过滤方法[J];电子学报;2006年10期
- 袁野;封化民;;基于Vague集的Web内容安全文本分类[J];广西师范大学学报(自然科学版);2010年01期
- 陈振亚;陈光辉;徐建民;;一种基于本体的文本特征选取方法[J];广西师范大学学报(自然科学版);2011年01期
- 宋志辉;;一种改进的特征选择方法[J];贵州教育学院学报;2009年06期
- 桑书娟;王敏;;一种结合文档频率和互信息的特征项提取方法[J];电脑知识与技术;2012年11期
- 陈国松;黄大荣;;基于信息熵的TFIDF文本分类特征选择算法研究[J];湖北民族学院学报(自然科学版);2008年04期
- 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期
- 张玉芳;杨芬;熊忠阳;陈小莉;;基于上下文的领域本体概念和关系的提取[J];计算机应用研究;2010年01期
- 倪洁琼;吴耿锋;郑宇;;基于关系权重的文本表示法[J];计算机应用与软件;2009年05期
- 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
- 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
- 王金宝;基于增量学习和阀值优化的自适应信息过滤[D];大连理工大学;2006年
- 李树成;WEB主题检索系统的性能优化设计[D];河北大学;2006年
- 朱玉丽;基于网格技术的主题爬虫算法优化的研究与实现[D];沈阳工业大学;2007年
- 冯静;基于向量空间模型的中文网页自动分类技术研究[D];中国石油大学;2008年
- 原媛;基于感情色彩词的非法信息过滤防火墙的设计[D];山西大学;2008年
- 罗颖;基于用户词典的搜索个性化研究[D];重庆大学;2009年
- 朱丽娜;中文网页分类特征提取方法研究[D];中国石油大学;2009年
- 王平;基于自组织特征映射的检索结果聚类研究[D];哈尔滨工业大学;2009年
- 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
- 李三义;基于模型匹配的Deep Web数据库分类[D];吉林大学;2010年
- 台德艺;谢飞;胡学钢;;基于位置权重的文本分类[J];安徽水利水电职业技术学院学报;2008年01期
- 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
- 范聪贤;刘秋菊;徐汀荣;;应用Web结构挖掘的PageRank算法的改进研究[J];计算机工程与应用;2010年09期
- 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期
- 刘海峰;王倩;王元元;;基于Web的文本检索位置加权模型研究[J];情报科学;2007年03期
- 常庆;周明全;耿国华;;基于PageRank和HITS的Web搜索[J];计算机技术与发展;2008年07期
- 陈素萍;谢丽聪;;一种文本特征选择方法的研究[J];计算机技术与发展;2009年02期
- 姜鹤;陈丽亚;;SVM文本分类中一种新的特征提取方法[J];计算机技术与发展;2010年03期
- 刘艳民;;中文网页分类方法的研究[J];微电子学与计算机;2009年09期
- 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
- 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
- 陈治平,林亚平,童调生;基于N层向量空间模型的信息检索算法[J];计算机研究与发展;2002年10期
- 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
- 鲁松,白硕;自然语言处理中词语上下文有效范围的定量描述[J];计算机学报;2001年07期
- 刘开瑛,薛翠芳,郑家恒,周晓强;中文文本中抽取特征信息的区域与技术[J];中文信息学报;1998年02期
- 李凡,鲁明羽,陆玉昌;关于文本特征抽取新方法的研究[J];清华大学学报(自然科学版);2001年07期
- 任纪生;王作英;;基于特征有序对量化表示的文本分类方法[J];清华大学学报(自然科学版);2006年04期
- 李桂芳;刘培玉;;一种基于改进遗传算法的文本特征选择方法[J];山东师范大学学报(自然科学版);2007年02期
- 刘芳,卢正鼎;有效地检索HTML文档[J];小型微型计算机系统;2000年09期
- 庞宁;杨尔弘;;网页文本分类中的特征选择研究[J];太原科技大学学报;2007年04期
- 江祥奎,原思聪;中文网页分类中的网页特征提取方法[J];电脑开发与应用;2005年10期
- 蔡银珊;黄英铭;;基于改进的TF-IDF特征权重算法的网页自动分类[J];绵阳师范学院学报;2010年08期
- 齐宏卓;;浅谈网页模糊归类的应用[J];价值工程;2010年27期
- 李明杰;;特征抽取方法在网页分类中的应用[J];常熟理工学院学报;2005年04期
- 程传鹏;李钜;;中文网页分类中特征提取的研究[J];中原工学院学报;2005年06期
- 焦莉娟;冯丽萍;;Web页面分类中特征提取方法的改进[J];科技广场;2009年09期
- 朱秀华;;BP神经网络在网页自动分类中的应用[J];现代情报;2009年05期
- 孙玲芳;黎维良;;基于定题爬虫的网页分类的多级判定算法[J];科学技术与工程;2009年18期
- 时雷;虎晓红;席磊;;基于集成学习的网页分类算法[J];郑州大学学报(理学版);2009年03期
- 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
- 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
- 董静;林鸿飞;杨志豪;;中文网页形式自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
- 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
- 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
- 王健;安波;林鸿飞;;基于修正网络的蛋白质络合物预测[A];第五届全国信息检索学术会议论文集[C];2009年
- 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
- 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
- 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
- 秦兵;郑实福;刘挺;张刚;李生;;基于改进的贝叶斯模型的中文网页分类器[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
- 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
- 边歆;越主动越安全[N];网络世界;2006年
- 通讯员 彭云 袁龙刚;袁仁国荣膺改革开放30年酒界领军人物[N];经理日报;2009年
- 记者 万宁;业绩增长仍是主流[N];中国证券报;2005年
- 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
- 王玉春 赵洪新;齐市检察院网络建设步伐快[N];黑龙江经济报;2008年
- 长软国际科技(北京)有限公司 华桦 刘会治 ;量化个人信用程度[N];中国计算机报;2005年
- 本报记者 汪涛 ;证监会再下严令 迫货币市场基金软着陆[N];21世纪经济报道;2005年
- 李倩;多种价格国债招标方式有望推出[N];金融时报;2004年
- 本报记者 张泰欣;并购贷款操作指引或首季公布[N];中国证券报;2009年
- 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
- 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
- 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
- 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
- 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
- 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
- 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
- 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
- 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
- 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
- 刘兰哲;企业搜索引擎中网页分类技术的研究与实现[D];东北大学;2008年
- 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
- 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
- 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年
- 羊晶璟;基于Web的个性化搜索引擎的研究与设计[D];江苏大学;2008年
- 杨玉珍;基于统计与规则的特征权重计算方法研究与应用[D];山东师范大学;2011年
- 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
- 黄臻臻;基于体裁的中文网页分类[D];华侨大学;2007年
- 朱建建;非负矩阵分解及其在模糊网页分类中的应用[D];安徽大学;2012年
- 赵翔;基于Web挖掘的中医知识发现研究[D];北京交通大学;2010年
【稿件标题】:【a标签在当前页面打开】基于页面标签的网页分类研究
【作者单位】:贵州财经学院信息学院;贵州大学计算机科学与技术学院;
【发表期刊期数】:《
商场现代化》2009年19期
【期刊简介】:《商场现代化》杂志由中国商业联合会主管、中商科学技术信息研究所主办。主要探讨国内外现代商业管理经验和介绍现代科技在商业营销管理中的应用,并且刊发精选的国内外现代商业流通领域理论研究成果与现代贸易经济理论的科研论文。其严格化,标准化及权威性在......更多
商场现代化杂志社(
http://www.400qikan.com/qk/945/)投稿信息
【版权所有人】:陈笑筑;王东;陈笑蓉;
更多
粮食经济论文论文详细信息:
【a标签在当前页面打开】基于页面标签的网页分类研究
http://www.400qikan.com/lunwen/jingji/lsjjlw/101408.html
相关专题:a标签target属性 a标签当前页面打开 a标签刷新当前页面 a标签关闭当前页面 a标签跳转到当前页面 a标签跳转当前页面 a标签 当前页面 a标签打开新页面 a标签重新打开页面 a标签在当前页面打开 偷偷拿掉套套番号 货币乘数 《商场现代化》相关期刊
推荐期刊:
电气试验黑龙江医药内蒙古电大学刊宁波农业科技贺州学院学报微电子学与计算机中国公路学报中国图书馆学报现代装饰中国人权评论
上一篇:
【国际化经营战略】新形势下中国计算机产业国际化战略研究
下一篇:
[公允价值披露内容包括论文]完善公允价值应用的对策探析