一种基于Bi#LSTM、CNN和CRF的文本命名实体识别方法
汤斯亮
吴飞
张宁
戴洪良
庄越挺
张寅
· 2017
摘要:
本发明公开了一种基于Bi#LSTM、CNN和CRF的文本命名实体识别方法。该方法包括如下步骤:(1)利用卷积神经网络对文本单词字符层面的信息进行编码转换成字符向量;(2)将字符向量与词向量进行组合并作为输入传到双向LSTM神经网络来对每个单词的上下文信息进行建模;(3)在LSTM神经网络的输出端,利用连续的条件随机场来对整个句子进行标签解码,并标注句子中的实体。本发明是一个端到端的模型,不需要未标注语料集中除预训练好的词向量之外的数据预处理,因此本发明能在不同的语言和领域的语句标注中有广泛应用。