申请入驻
会员登录
首页
专家库
成果简介
采编系统
官方活动
综合
综合
专家
记者
成果
新闻
观点
活动
检索
第一学习
智库首页
>
智库成果
>
期刊论文
计算机辅助新词新语词典的编纂
陈玉泉
顾顺莲
陆汝占
· 2000
分享
收藏
阅读量:19
汉语新现词语
数据挖掘
新词新语词典
期刊名称:
上海交通大学学报 2000 年 07 期
摘要:
在参照众多语言学家关于新词新语的定义及其界定的基础上 ,定义了适合计算机处理的新词新语的扩充集——新现词语 ,给出了从大规模现代汉语语料库中基于数据挖掘技术的新现词语发现 ,并利用该技术辅助新词新语词典的编纂 .新现词语发现先将非结构化数据准结构化 ,再利用数据变换函数将其转换为结构化数据 ,最后再用结构化数据挖掘技术进行数据挖掘 .利用上述方法 ,对 1 991年人民日报的部分语料 (约 4 0 0万字 )进行了初步测试 ,取得了良好的效果
相关专家
相关课题