科研成果
  概况介绍  
  获奖  
  论文  
  学术报告  
  专著  
  专利  
您现在的位置:首页 > 科研成果 > 论文
论文题目  基于向量空间模型的自动文本分类研究 
论文题目(英文)  
作者 张运良 
发表年度 2007 
22 
33 
页码 45-47 
期刊名称 计算机工程 
摘要     向量空间模型是自动文本分类中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项通常只能提供较少的局部语义信息.为实现基于内容的文本分类,该文用HNC理论中的句类作为特征项,通过混合句类分解等技术对句类向量空间降维,使用tfc算法对特征项进行权重计算,用KNN算法进行分类.该分类器的平均准确率和召回率都是可接受的,对类别的抽象程度无要求,即抽象度较高和较低的类别可以同时分类.通过使用更好的机器学习算法和其他的HNC语言理解技术,性能可以进一步提高. 
摘要_英文