您当前的位置:成果库 > 基于特征选择的网页文本分类方法
基本信息
- 成果类型 高等院校
- 委托机构 西安理工大学
- 成果持有方 西安理工大学
- 行业领域 其他电子信息
- 项目名称 基于特征选择的网页文本分类方法
- 知识产权 发明专利
- 项目简介 基于特征选择的网页文本分类方法,首先,把由大量的网页构成的数据集分为训练集和测试集两部分;然后,根据网页标签域中的信息表达网页内容的能力赋予标签不同的权重,并计算训练集中每个网页内特征词的权重(归一化后的词频与反文档频率之积);在所得权重的基础上结合类内分布率和类间偏差,计算训练集中每个网页的特征向量,继而计算训练集中每个类的特征向量;最后,计算测试集中每个网页内特征词的词频,以及待分类网页与训练集中每一个类之间的相似度,采用相似度最大的类作为待分类网页的所属类,得到分类结果。
交易信息
- 意向交易额 面议
- 挂牌时间 2021/10/15
- 委托机构 西安理工大学
- 联系人姓名 王小刚
- 联系人电话 15802954800
- 联系人邮箱 745490733@qq.com
- 分享至: