|
|
|
| 论文题目 |
基于向量空间模型的自动文本分类研究 |
| 论文题目(英文) |
|
| 作者 |
张运良 |
| 发表年度 |
2007 |
| 卷 |
22 |
| 期 |
33 |
| 页码 |
45-47 |
| 期刊名称 |
计算机工程 |
| 摘要 |
向量空间模型是自动文本分类中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项通常只能提供较少的局部语义信息.为实现基于内容的文本分类,该文用HNC理论中的句类作为特征项,通过混合句类分解等技术对句类向量空间降维,使用tfc算法对特征项进行权重计算,用KNN算法进行分类.该分类器的平均准确率和召回率都是可接受的,对类别的抽象程度无要求,即抽象度较高和较低的类别可以同时分类.通过使用更好的机器学习算法和其他的HNC语言理解技术,性能可以进一步提高. |
| 摘要_英文 |
|
|
|
|