本文作者:赵红宇;成功正常投稿发表论文到《商场现代化》2008年26期,引用请注明来源400期刊网!
【摘要】:本文描述了一种新的基于关键词组合模式的文本向量空间表示模型,相对于只使用文本中词语的频率的文本向量空间模型,这种新的模型在可以计算的前提下,使用了词语之间的相对位置信息,从而可以解决部分词语向量空间模型表示的不足。本文讨论了使用这种模型的自动文本分类系统,包括分类系统的结构、特征提取、文本相似度计算公式,并给出了评估方法。
【论文正文预览】:近年来,以文本格式存储的海量信息出现在Internet、数字化图书馆及公司的Intranet上,如何从这些浩瀚的文本中发现有价值的信息是信息处理领域的重要目标,而文本自动分类系统能够在给定的分类模型下,根据文本的内容自动对文本分门别类,从而更好地帮助人们组织及挖掘文本信息,
【文章分类号】:TP391.1
【稿件关键词】:关键词组合向量空间自动分类分类算法
【参考文献】:
- 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
- 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
- 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
- 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
- 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
- 李志明;李善平;杨朝晖;林欣;;基于本体分割的本体映射算法[J];模式识别与人工智能;2011年02期
- 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
- 李旻松;段琢华;;基于支持向量机的隐含语意特征选择方法[J];计算机应用;2011年09期
- 魏晶晶;杨定达;廖祥文;;基于网页内容相似度改进算法的主题网络爬虫[J];计算机与现代化;2011年09期
- 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期
- 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
- 高勇;荀恩东;宋柔;;构造自然语言问答系统平台[A];第二届全国学生计算语言学研讨会论文集[C];2004年
- 喻飞;夏晓燕;吴蓉晖;徐成;;基于向量空间模型的信息安全审计系统[A];第二十六届中国控制会议论文集[C];2007年
- 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
- 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
- 原福永;杨治秋;王海霞;;一种基于向量空间模型的文档聚类算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
- 林游龙;余智华;程学旗;刘悦;;虚点:一种减少特征值鸿沟的方法[A];第六届全国信息检索学术会议论文集[C];2010年
- 曹晶;孙铁利;杨柳;;基于概念向量空间模型的信息检索方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
- 林鸿飞;宋丹;杨志豪;;基于语义框架的话题跟踪方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
- 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
- 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
- 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
- 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
- 徐婕;基于对等网络的资源搜索策略的研究[D];华中科技大学;2007年
- 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
- 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
- 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
- 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
- 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
- 荆永君;教育资源分布式配送与调度算法研究[D];东北师范大学;2008年
- 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
- 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
- 张波;个性化Web搜索系统研究[D];燕山大学;2006年
- 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
- 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
- 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
- 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
- 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
- 赵文鹏;基于自组织特征映射的海洋文献聚类分析的研究与实现[D];中国海洋大学;2009年
- 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
- 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
【稿件标题】:【词向量 文本分类】基于关键词组合向量模型的文本自动分类研究
【作者单位】:西南科技大学经济管理学院;
【发表期刊期数】:《
商场现代化》2008年26期
【期刊简介】:《商场现代化》杂志由中国商业联合会主管、中商科学技术信息研究所主办。主要探讨国内外现代商业管理经验和介绍现代科技在商业营销管理中的应用,并且刊发精选的国内外现代商业流通领域理论研究成果与现代贸易经济理论的科研论文。其严格化,标准化及权威性在......更多
商场现代化杂志社(
http://www.400qikan.com/qk/945/)投稿信息
【版权所有人】:赵红宇;
更多
视觉艺术论文论文详细信息:
【词向量 文本分类】基于关键词组合向量模型的文本自动分类研究
http://www.400qikan.com/lunwen/yishu/sjyslw/121654.html
相关专题: 《商场现代化》相关期刊
推荐期刊:
中国市场探矿工程空运商务龙门阵西南交通大学学报江苏统计当代会计评论信息空间科技和产业系统工程理论与实践
上一篇:
吕锡文对待下属|企业领导者该如何对待下属的过失
下一篇:
【中马钦州产业园区】钦州在环北经济圈中的产业结构优劣势比较分析