清華紫光ocr文字識別軟件支持Windows環(huán)境下的GB、BIG5、JIS和Shift-JIS等多種內(nèi)碼。在清華紫光ocr文字識別軟件印刷體漢字識別中還加入了MMX優(yōu)化技術(shù),使識別速度得到了很大提高。
清華紫光ocr文字識別軟件-測試過程:
我們用清華紫光ocr文字識別軟件識別一頁A4大小的印刷體中英文混排的純文本文件,只用了幾秒鐘。而且識別率非常高,只有極個別的字出現(xiàn)了差錯。在這個版本中新增了表格識別功能。選擇了識別表格的選項后,它會自動將表格的框線先識別出來,再對表格中的文字進行識別。文字全部識別出來之后會將文字按原樣恢復(fù)到表格中。在這項測試中識別率也很不錯。但是在測試中我們的工程師發(fā)現(xiàn),當文字與表格的框線距離較近時,它的識別效果就沒有那么理想了。
清華紫光ocr文字識別軟件功能特點:
版面自動分析:對圖文混排的文件具有版面自動分析功能,它自動對掃描的版面進行分析,把應(yīng)識別的文字區(qū)域劃分出來,之后進行識別
識別率高、速度快:對于被劃分區(qū)域內(nèi)的文字有很高的識別率,而且速度同樣很快
導(dǎo)出功能:可以將帶有表格的文當導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進行編輯
轉(zhuǎn)換圖像格式:將掃描進來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性
批量識別:可以讓用戶一次把多頁文稿全部掃描之后再進行識別,避免了掃描一頁識別一頁帶來的麻煩,這一版本最多可實現(xiàn)10000頁的批量識別
手寫體識別:手寫的信件或文件就可以掃描到計算機中,識別出來后用電子文檔的方式進行保存
自學(xué)習(xí):當遇到有生僻字時,可以通過鍵盤輸入進行學(xué)習(xí),用戶就可以自由地添加一些本來不“認識”的字,大大拓寬了中文OCR系統(tǒng)的識別字符集。
清華紫光ocr文字識別軟件安裝說明:
壓縮包內(nèi)含免費補丁,故被部分殺軟報毒
安裝完成后,將免費補丁復(fù)制至安裝目錄運行即可完成免費