一种基于图书的概念-描述词知识网络的构建方法
鲁伟明 龚军 庄越挺 吴飞 魏宝刚 · 2016
收藏
阅读量:286
专利权人:
浙江大学
申请人:
浙江大学
通讯地址:
浙江大学
专利类型:
发明专利
专利号:
CN105808768A
摘要:
本发明公开了一种基于图书的概念#描述词知识网络的构建方法。基于图书构建概念#描述词知识网络本质上是一种知识图谱构建技术。本发明首先从数字图书中抽取得到目录项,在此基础上利用分词工具和正则表达式对目录进行预处理。然后训练语言模型将各个词、词相应的特征以及词对应的标注用词嵌入进行表达,进而用词嵌入匹配算法抽取得到目录短语。随后训练分类器将目录短语分类成概念和描述词,通过概念和描述的映射构建得到概念#描述词知识网络。本发明从图书中构建概念#描述词知识网络,有效的完成了对图书知识的抽取和分解。
相关专家
相关课题