基于Tesseract_OCR文字识别的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：lei7863

【摘要】

：

光学字符识别(optical character recognition, OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。文字信息提取模块包括图像预处理、文字信息区域的截取和修正

【作者】

：

曾悦马明栋

【机构】

：

南京邮电大学通信与信息工程学院,江苏南京 210003;南京邮电大学地理与生物信息学院,江苏南京 210003

【出处】

：

计算机技术与发展

【发表日期】

：

2021年11期

【关键词】

：

光学字符识别文字识别 Tesseract框架微软基础类库 C++

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于Tesseract_OCR文字识别的研究

其他学术论文