科研成果
  概况介绍  
  获奖  
  论文  
  学术报告  
  专著  
  专利  
您现在的位置:首页 > 科研成果 > 论文
论文题目  基于文章标题的汉语自动文本分类研究 
论文题目(英文) The Chinese Text Automatic Categorization Research Based on The Article Title Information 
作者  
发表年度 2008 
34 
20 
页码 13-14,17 
期刊名称 计算机工程 
摘要 文本分类是文本挖掘的一个重要组成部分,是信息搜索领域的一项重要研究课题。该文提出一种基于文章标题信息的汉语自动文本分类方法,在 HNC理论的领域概念框架下,通过标题信息所蕴涵的领域信息词语激活对应的 HNC领域,实现文本的自动分类。实验证明,该方法与采用SVM算法进行文本分类的方法比较,测试速度和分类平均准确率明显提高。
关键词:文本分类;HNC理论;领域  
摘要_英文 The text categorization is an important part of the text excavation, and it becomes the research topic in the information searching field.The paper proposes a method of the automatic text categorization which uses the article title information. The method based on the domain concept frame of the Hierarchical Network of Concepts(HNC) theory uses the domain concept of the title information to activate the corresponding HNC domain, and realizes the text automatic categorization. The experiment proves that the method may effectively enhance the efficiency and the accurate rate of the text automatic categorization.
【Key words】text categorization; Hierarchical Network of Concepts(HNC) theory; domain