一种基于Bi#LSTM、CNN和CRF的文本命名实体识别方法
汤斯亮 吴飞 张宁 戴洪良 庄越挺 张寅 · 2017
收藏
阅读量:286
专利权人:
浙江大学
申请人:
浙江大学
通讯地址:
浙江大学
专利类型:
发明专利
专利号:
CN106569998A
摘要:
本发明公开了一种基于Bi#LSTM、CNN和CRF的文本命名实体识别方法。该方法包括如下步骤:(1)利用卷积神经网络对文本单词字符层面的信息进行编码转换成字符向量;(2)将字符向量与词向量进行组合并作为输入传到双向LSTM神经网络来对每个单词的上下文信息进行建模;(3)在LSTM神经网络的输出端,利用连续的条件随机场来对整个句子进行标签解码,并标注句子中的实体。本发明是一个端到端的模型,不需要未标注语料集中除预训练好的词向量之外的数据预处理,因此本发明能在不同的语言和领域的语句标注中有广泛应用。
相关专家
相关课题