申请入驻
会员登录
首页
专家库
成果简介
采编系统
官方活动
综合
综合
专家
记者
成果
新闻
观点
活动
检索
第一学习
智库首页
>
智库成果
>
期刊论文
基于锚点句对的汉维句子对齐方法
塞麦提·麦麦提敏
侯敏
吐尔根·伊布拉音
· 2015
分享
收藏
阅读量:87
平行语料库
句子对齐
锚点
基于长度的方法
基于词汇的方法
期刊名称:
计算机工程 2015 年 第41卷 卷 第4期 期
摘要:
为提高汉维句子对齐方法的准确率,提出一种分段句子对齐方法。采用词汇信息和长度信息相结合的策略,识别出能作为锚点的一对句子(锚点句对),并将其作为分割标志对全文进行分段,在各片段内使用基于长度的方法实现全部句子的对齐,采用词汇、数字、标点符号和长度信息提高方法的领域移植性,使用分段方法避免复杂的计算过程,从而解决错误蔓延问题。实验结果表明,该方法的准确率达到95.2%,比基于长度的句子对齐方法提高了2.7%。
查看原文
相关专家
相关课题