申请入驻
会员登录
首页
专家库
成果简介
采编系统
官方活动
综合
综合
专家
记者
成果
新闻
观点
活动
检索
第一学习
智库首页
>
智库成果
>
期刊论文
基于特征选择和点互信息剪枝的产品属性提取方法
高磊
戴新宇
黄书剑
陈家骏
· 2015
分享
收藏
阅读量:110
情感分析
产品属性提取
l1-norm正则化
点互信息剪枝
期刊名称:
模式识别与人工智能 2015 年 02 期
摘要:
产品属性的自动抽取是情感分析中的重要研究内容.文中提出一种基于特征选择和词频及点互信息剪枝的产品属性提取方法.首先引入在分类任务中常用的l1-norm正则化(Lasso)方法,将产品属性抽取问题转换为分类中的特征选择问题,利用Lasso生成稀疏模型的特性,将模型中少量的特征作为产品特征属性候选集.然后根据候选特征属性集中的特征属性在文本中出现的频率进行排序并剪枝.最后经过进一步合并和点互信息剪枝处理,得到最终的产品属性集.在中文产品评论集上的实验证实文中方法的有效性.
相关专家
相关课题