基于特征自动选择方法的汉语隐喻计算

曾华琳周昌乐陈毅东史晓东 · 2016

阅读量：99

汉语隐喻计算

隐喻识别

机器学习

自动特征选择

期刊名称：

厦门大学学报(自然科学版) 2016 年 03 期

摘要：

汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种最优特征模板自动抽取的隐喻识别算法,讨论了3种不同层次的特征模板,既包含了经典的简单特征,又将跨多个词的远距离上下文信息,以及描述语义信息的词语相似性引入特征模板进行考察.实验结果表明,该算法提高了隐喻识别准确率,是一种对于汉语隐喻计算行之有效的机器学习方法.