一种数字图书的版面分析方法
鲁伟明 刘佳卉 庄越挺 吴飞 魏宝刚 · 2016
收藏
阅读量:293
专利权人:
浙江大学
申请人:
浙江大学
通讯地址:
浙江大学
专利类型:
发明专利
专利号:
CN106096592A
摘要:
本发明公开了一种数字图书的版面分析方法。基于区域分割的版面分析方法本质上是一种以JEPG或TIF格式存储图书的图像分割与区域分类。本发明首先利用形态学运算并结合Gabor线性滤波器的方法提取图片边缘以及过分割区域的基础合并,实现图书区域的分割,然后对分割的图像块进行区域填充及排序,重新构建阅读顺序,最后对图像区域进行特征提取,训练分类器得到各区域属性,实现图书的区域分离,提高OCR引擎的识别正确性以及图书查询的准确率。
相关专家
相关课题