本教程主要介紹了LeadTools其中一個(gè)小功能——鼠標(biāo)移動(dòng)選擇區(qū)域的使用。
由于處理能力和存儲(chǔ)空間的制約,移動(dòng)設(shè)備上的文字識(shí)別(OCR)一直是一個(gè)很大的挑戰(zhàn)。LEADTOOLS正在使用HTML5/JavaScript圖像查看器控件和RESTful Web服務(wù)改變這一切。
LEADTOOLS是世界一流的圖像開(kāi)發(fā)工具包,以“程序員友好”的方式為您提供高質(zhì)量、高性能、高穩(wěn)定性的圖像組件。開(kāi)發(fā)者可以明顯減少應(yīng)用程序的開(kāi)發(fā)時(shí)間,從而最大化生產(chǎn)率,保證了最大可能的投資回報(bào)。
LEADTOOLS OCR文字識(shí)別教程:掃描文檔并識(shí)別為可搜索的PDF文件。
Google Drive是存儲(chǔ)、組織和分析文件如文檔、圖片和視頻等的完美服務(wù)。但是,TIFF和其他光柵圖像文件很容易被忽略,因?yàn)镚oogle Drive的搜索功能非常有限。有了LEADTOOLS,就能使用OCR 文字識(shí)別提取每個(gè)項(xiàng)的文本,并將它添加到IndexableTextData中。這些完成后,就可以像搜索基于文本的文檔如DOC或PDF一樣搜索光柵圖像文件了。
我們經(jīng)常使用表單識(shí)別和處理解決各種各樣的任務(wù),包括分類、文檔歸檔、OCR識(shí)別和光學(xué)標(biāo)記(OMR)識(shí)別。基于OMR表單創(chuàng)建的時(shí)間稍長(zhǎng)和準(zhǔn)確檢測(cè)掃描文檔中OMR字段的比較困難,使得OMR在文檔圖像中經(jīng)常被誤解且沒(méi)有被充分利用。創(chuàng)建和處理OMR表單非常耗時(shí),此白皮書(shū)將討論如何通過(guò)自動(dòng)檢測(cè)、分類和處理緩解這些問(wèn)題。
使用LEADTOOLS創(chuàng)建的應(yīng)用程序可以將一個(gè)掃描文檔與已經(jīng)的模板比較,并對(duì)文檔類型正確分類。當(dāng)正確識(shí)別一個(gè)文檔后,LEADTOOLS可以從表單中已定義的位置提取文字、選項(xiàng)、條碼等。
在本白皮書(shū)中,我們將討論處理大量主表單的若干種策略,以及如何使用LEADTOOLS表單識(shí)別SDK快速準(zhǔn)確地處理表單。