OCR的识别率不高能调么?如果能怎么弄啊?

题目

OCR的识别率不高能调么?如果能怎么弄啊?

参考答案和解析
ocR的识别率是不能调的,只能找本厂家更高版本的OCR
随着数字化时代的飞速发展,如今随机附带OCR识别软件的扫描仪也是越来越多了,当然这绝大多数都是基础版。由于存在此类OCR软件识别率太低,后期纠正处理过程过于麻烦的想法,很多用户都将其闲置一旁。但事实上,用户只需注意一些使用技巧,此类OCR软件的识别率完全可达实用化水平。

  原稿的质量直接影响到扫描出来的图像质量,更会直接影响最后OCR的正确率,因此我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。

  扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。

  而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。根据笔者的经验,普通五号印刷体采用250~300dpi比较合适;若字号比较大(四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔划较多的识别文本,应适当提高扫描的分辨率。这里额外再提供一个公式供大家参考:文件长度(字节)=(水平尺寸×垂直尺寸×扫描分辨率)/8。

  扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,因为没此步骤的话识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽然可以很好地解决这一问题,但有时却常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可以通过将自动分析与手工分析结合,将不恰当的版面分析删除。现在大多数OCR都提供了简体、繁体、英文的识别方式,也应注意选择。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。

  另外提醒用户的是,应充分使用OCR识别软件的用户自学习功能。OCR识别软件内一般都含有用户自学习功能,如果个别字在扫描比较清楚的情况下,软件识别得不正确,就可以把这个字加到用户自定义库中,这样就可以逐渐地提高识别的正确性。要想获得较高的扫描识别率,用户应当不断进行尝试,找出一个适合OCR识别软件的扫描分辨率及扫描亮度以供参考。

如何才能更加有效的提高OCR识别率?
        
        随着数字化时代的飞速发展,如今随机附带OCR识别软件的扫描仪也是越来越多了,当然这绝大多数都是基础版。由于存在此类OCR软件识别率太低,后期纠正处理过程过于麻烦的想法,很多用户都将其闲置一旁。但事实上,用户只需注意一些使用技巧,此类OCR软件的识别率完全可达实用化水平。
        原稿的质量直接影响到扫描出来的图像质量,更会直接影响最后OCR的正确率,因此我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。
        扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。
        而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。根据笔者的经验,普通五号印刷体采用250~300dpi比较合适;若字号比较大(四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔划较多的识别文本,应适当提高扫描的分辨率。这里额外再提供一个公式供大家参考:文件长度(字节)=(水平尺寸×垂直尺寸×扫描分辨率)/8。
        扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,因为没此步骤的话识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽然可以很好地解决这一问题,但有时却常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可以通过将自动分析与手工分析结合,将不恰当的版面分析删除。现在大多数OCR都提供了简体、繁体、英文的识别方式,也应注意选择。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。
        另外提醒用户的是,应充分使用OCR识别软件的用户自学习功能。OCR识别软件内一般都含有用户自学习功能,如果个别字在扫描比较清楚的情况下,软件识别得不正确,就可以把这个字加到用户自定义库中,这样就可以逐渐地提高识别的正确性。要想获得较高的扫描识别率,用户应当不断进行尝试,找出一个适合OCR识别软件的扫描分辨率及扫描亮度以供参考。
 
能怎么弄啊
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

这玩应也分专业么??都考什么啊 所有考试都一样还是。。


不分,大多数就是考行测 申论两科

第2题:

 省直公务员工商系统有通知什么时候领准考证的了么?是看公告?还是打电话啊?


你好,不知道你说的是哪个省份的

第3题:

事业编和公务员最本质滴区别是么事啊~~~


公务员编制是从事政府相关工作岗位的编制,晋升路线是行政级别,如科员、副主任科员、主任科员、副调研员...如果被提拔那就是行政职位,如科长、局长、处长等等; 

事业编制,是从事专业技术岗位或者工勤等岗位,无论是事业单位还是行政单位,这些岗位的工作人员都是事业编制,晋升的路线,如果是政府里的专业技术岗位大概是助理工程师、工程师等等专业不同职称也有所不同,工勤岗位主要是指工人,如司机,职称主要有初级工、中级工等等。 

待遇同一级别的应该差距不大,之于学校里的老师或者其他事业单位收入问题,主要看这个单位是否有钱

第4题:

意外停电还能导致分区表错误?那怎么弄啊,硬盘还有重要文件的?急急急急!


1.如果正在大数据的读写,很有可能。
如果待机,虽然也可能,但概率小一些
2.用 NORTON 的磁盘医生修复 在你进行误删除硬盘分区魔术师 PM 试试 以后,只要你没有向删除文件的分区写入文件,就还有机会将误删除的文件恢复。不过不敢 保证全部恢复。现在恢复数据的软件较多,比如:EasyRecovery Pro、FinalDataEnterprise20 等,这里我推荐使用 EasyRecovery Pro 这款软件。同时我将介绍在 WINDOWS 和 DOS 两种 情况下的数据恢复步骤。希望对你有所帮助。
试下。
在DOS下输出入命令
Fdisk /mbr
意外停电导致分区表错误
问:在使用Fdisk给硬盘分区时,突然意外停电了,来电后再启动计算机重新运行Fdisk时,却发现Fdisk已经无法识别原来的硬盘,这种情况该如何处理?用DM可以快速修复吗?
答:在对硬盘分区进行操作的时候,如果遇到意外原因突然死机或断电,这时再使用原先的工具就可能无法识别当前硬盘的分区表,必须更换另外一款分区表软件进行修复。像这种使用Fdisk分区时意外死机的情况,再使用Fdisk就无法顺利进行,此时可以使用PartitionMagic之类的第三方分区软件解决。另外需要注意的是,DM虽然可以对硬盘进行快速的分区格式化,但由于分区表对于系统的正常稳定运行影响非常大,一般情况下最好不要采用这类快速分区格式化软件,否则在将来使用过程中有可能出现各种意想不到的麻烦。
试下。
在DOS下输出入命令
Fdisk /mbr

第5题:

Windows经常进入安全模式怎么弄?


此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于非PC133内存运行于133外频。可以尝试在CMOS内设置降低内存读取速度或者使用主板的内存异步功能将内存频率调低来解决问题。如果不行,那就只有更换内存条了。另外,如果系统进行了超频,也可能产生这种问题,对于这种情况,只需将系统恢复到正常的工作频率即可。
此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于高频率的内存用于某些不支持此频率内存条的主板上,可以尝试在CMOS设置内降低内存读取速度看能否解决问题,如若不行,那就只有更换内存条了
Windows经常进入安全模式
问:Windows经常自动进入安全模式,这是什么原因?
答:此类故障一般是由于主板与内存条不兼容或内存条质量不佳引起,常见于非PC133内存运行于133外频。可以尝试在CMOS内设置降低内存读取速度或者使用主板的内存异步功能将内存频率调低来解决问题。如果不行,那就只有更换内存条了。另外,如果系统进行了超频,也可能产生这种问题,对于这种情况,只需将系统恢复到正常的工作频率即可。
不常进入,如果常进入的话,那是系统出现了故障

第6题:

是先考试还是先出台职位招聘信息啊。。。考分出来才能报职位部门么?


先报职位 

第7题:

病毒防护导致不能安装操作系统怎么弄?


病毒软件一般都是运行在特定操作系统上的,你说的不能安装我猜应该是在系统运行时安装其他操作系统的方法,你可以试一下通过系统盘引导的方式安装。
用光盘 重装系统
这种情况并不是安装光盘有问题,而是因为在主板BIOS中将病毒防护功能打开了,而病毒防护一发现安装操作系统时要向硬盘引导区中写文件,就会立即拒绝,从而导致无法安装Windows XP。这种现象处理起来很简单,只要在重启计算机后进入BIOS,将Advanced BIOS Features Setup Option界面中的Virus Waring(病毒警告)选项设置成Disabled,保存退出并重新启动计算机,就可以顺利安装Windows XP了。
  这种情况并不是安装光盘有问题,而是因为在主板BIOS中将病毒防护功能打开了,而病毒防护一发现安装操作系统时要向硬盘引导区中写文件,就会立即拒绝,从而导致无法安装Windows XP。这种现象处理起来很简单,只要在重启计算机后进入BIOS,将Advanced BIOS Features Setup Option界面中的Virus Waring(病毒警告)选项设置成Disabled,保存退出并重新启动计算机,就可以顺利安装Windows XP了。
这种情况并不是安装光盘有问题,而是因为在主板BIOS中将病毒防护功能打开了,而病毒防护一发现安装操作系统时要向硬盘引导区中写文件,就会立即拒绝,从而导致无法安装Windows XP。这种现象处理起来很简单,只要在重启计算机后进入BIOS,将Advanced BIOS Features Setup Option界面中的Virus Waring(病毒警告)选项设置成Disabled,保存退出并重新启动计算机,就可以顺利安装Windows XP了。

第8题:

我是河南的,现在大二了,上的是艺术专业但是想报考教师资格证,想问一下各位教师资格认证考试是怎么回事,需要怎么弄啊,我不太清楚,是不是报名考教师资格证以前必须通过认证考试.怎么考,到哪个部门报名啊,还有就是什么时候考哇?


河南省非师范生参加教师资格理论考试常见问题解答

  1.河南教师资格理论考试每年几月份报名?
  答:各地市报名时间不同,一般是6-9月份之间,详细可以关注我们空间,或者当地教育局网站更新信息。(各地教育局网站本空间有相关的贴子)
  2.河南教师资格理论考试每年几月份考试?
  答:教师资格理论考试是河南省统考,一般情况每年的10月份。
  3.河南教师资格理论考试都考些什么?
  答:河南的考试是一张卷子,内容涵盖教育学、教育心理学等七本书的重难点,题型分为(单选、多选、判断、简答、案例分析、论述),不而是很多省份的教育学、教育心理学分开考试。(相关可以看看我教育中心资料:历年真题解析、有详细的答案解析哦)
  4.河南教师资格证理论考试难不难,总分多少分?
  答:满分150分,90分及格。由于都是记忆性的考试内容,只要掌握书上的划题重点,过关是比较容易的。
  5.我要考初中的教师资格证?为什么给我的资料是中学的?
  答:河南省教师资格理论考试,初中、高中、中专的教材大纲通用,简单点说就是一个题库,有100道题,而初、高中、中专各抽出30道题用于各自考试,其中初、高中、中专各有有10道题是相互交叉考试的,所以说我们的资料中学通用,小学的专用(小学的考试更加接近于中学的,大别不是特别大),大学的专用。

 

第9题:

为什么Fdisk不能识别大硬盘?怎么弄啊?


这种情况是由于所使用的Fdisk不能识    别大容量硬盘所致。Windows 98中的Fdisk只能正确识别80GB以下的硬盘,所以对于80GB以上的大硬盘,就需要使用高版本的Fdisk来分区,如Windows Me中的Fdisk;或使用其他一些分区软件如PartitionMagic(分区魔术师)等来分区。另外,也可以将该硬盘挂接在其他安装有Windows 2000/XP/2003操作系统的计算机上,系统会正确识别并可以使用Windows自带的分区功能来分区。如果没有Windows 2000/XP/2003操作系统,也可以使用Windows 2000/XP/2003安装光盘,在启动时带光驱启动,进入Windows安装界面,使用系统自动的分区功能也可正确识别硬盘并分区,而且操作起来十分简单。
这种情况是由于所使用的Fdisk不能识别大容量硬盘所致。

    Windows 98中的Fdisk只能正确识别80GB以下的硬盘,所以对于80GB以上的大硬盘,就需要使用高版本的Fdisk来分区,如Windows Me中的Fdisk;或使用其他一些分区软件如PartitionMagic(分区魔术师)等来分区。另外,也可以将该硬盘挂接在其他安装有Windows 2000/XP/2003操作系统的计算机上,系统会正确识别并可以使用Windows自带的分区功能来分区。如果没有Windows 2000/XP/2003操作系统,也可以使用Windows 2000/XP/2003安装光盘,在启动时带光驱启动,进入Windows安装界面,使用系统自动的分区功能也可正确识别硬盘并分区,而且操作起来十分简单。
FDISK 是无法识别大的硬盘
Fdisk不能识别大硬盘
问:新买了一个容量为80GB的硬盘,在DOS下使用Fdisk给它分区时,显示硬盘容量仅为16GB,这是什么原因,如何解决并继续分区呢?
答:这种情况是由于所使用的Fdisk不能识    别大容量硬盘所致。Windows98中的Fdisk只能正确识别80GB以下的硬盘,所以对于80GB以上的大硬盘,就需要使用高版本的Fdisk来分区,如WindowsMe中的Fdisk;或使用其他一些分区软件如PartitionMagic(分区魔术师)等来分区。另外,也可以将该硬盘挂接在其他安装有Windows2000/XP/2003操作系统的计算机上,系统会正确识别并可以使用Windows自带的分区功能来分区。如果没有Windows2000/XP/2003操作系统,也可以使用Windows2000/XP/2003安装光盘,在启动时带光驱启动,进入Windows安装界面,使用系统自动的分区功能也可正确识别硬盘并分区,而且操作起来十分简单。
Windows 98中的Fdisk只能正确识别80GB以下的硬盘,所以对于80GB以上的大硬盘,就需要使用高版本的Fdisk来分区,如Windows Me中的Fdisk;或使用其他一些分区软件如PartitionMagic(分区魔术师)等来分区。另外,也可以将该硬盘挂接在其他安装有Windows 2000/XP/2003操作系统的计算机上,系统会正确识别并可以使用Windows自带的分区功能来分区。如果没有Windows 2000/XP/2003操作系统,也可以使用Windows 2000/XP/2003安装光盘,在启动时带光驱启动,进入Windows安装界面,使用系统自动的分区功能也可正确识别硬盘并分区,而且操作起来十分简单。

第10题:

开机时提示Boot.ini文件出错怎么办啊?丢文件了么?