PDF-XChange Editor使用教程:如何對(duì)文檔執(zhí)行OCR?
PDF-XChange Editor能替代Adobe Reader功能,比任何其他免費(fèi)的PDF閱讀器、查看器和編輯器更小,但功能更加豐富,支持用戶在評(píng)價(jià)模式嘗試使用PDF-Xchange免費(fèi)提供的擴(kuò)展功能。
點(diǎn)擊下載最新版的PDF-XChange Editor
OCR
OCR(光學(xué)字符識(shí)別)會(huì)掃描基于圖像的文檔,識(shí)別文本,然后在文本上插入不可見的文本層。文本層包含與文檔中識(shí)別的文本相同的文本,這意味著可以通過不可見的文本層有效地搜索和選擇文檔中基于圖像的原始文本,這是OCR的主要優(yōu)勢。但是,應(yīng)注意,文檔文本無法以與普通的基于文本的文檔相同的方式進(jìn)行編輯-盡管它是不可見的文本層,但它仍然是基于圖像的文檔。
請(qǐng)按照以下步驟執(zhí)行OCR:
單擊功能區(qū)工具欄中的Convert,然后單擊子菜單中的OCR頁面。將打開OCR頁面對(duì)話框:
頁面范圍選項(xiàng)如下:
選擇All即所有頁面應(yīng)用為OCR文檔。
選擇Current Page僅對(duì)當(dāng)前頁面進(jìn)行OCR。
使用Pages確定在其上執(zhí)行OCR處理的文檔的特定頁面。頁面范圍設(shè)置在下文詳細(xì)說明。
使用Subset選項(xiàng)選擇所有頁面,僅奇數(shù)頁或僅偶數(shù)頁。
識(shí)別選項(xiàng)確定OCR流程的語言和準(zhǔn)確性。如果所需的語言在下拉菜單中不可用,請(qǐng)單擊More Languages以獲取更多選項(xiàng)。提高精度會(huì)增加過程花費(fèi)的時(shí)間,反之亦然。此外,應(yīng)注意,如果執(zhí)行操作的文檔具有瑕疵,則將精度設(shè)置為較高可能會(huì)導(dǎo)致輸出異常。這是因?yàn)樵撥浖⑺阉鞯礁蟮纳疃龋⑶铱赡車L試將瑕疵識(shí)別為文本。
輸出選項(xiàng)確定OCR流程中輸出信息的格式。選擇創(chuàng)建新的可搜索PDF或保留原始內(nèi)容并根據(jù)需要添加文本層。
創(chuàng)建新的可搜索PDF將復(fù)制當(dāng)前文件并創(chuàng)建一個(gè)新的PDF,在其中執(zhí)行OCR過程。如果您希望使當(dāng)前文件不受該過程的影響,但是想測試結(jié)果,則是一個(gè)不錯(cuò)的選擇。
保留原始內(nèi)容,添加文本層將完全按照其暗示的方式運(yùn)行。保留原始內(nèi)容,并在其上方放置OCR文字層。此方法不會(huì)創(chuàng)建新文檔,而是通過添加可搜索文本來更改當(dāng)前文檔。
Quality設(shè)置確定新的PDF文檔的分辨率,以dpi(每英寸的點(diǎn)數(shù))為單位。
選擇Auto Deskew選項(xiàng)以自動(dòng)糾偏文檔。(去歪斜是一個(gè)有用的功能,可以矯正歪斜拍攝或掃描的圖像)。
最后,單擊確定以應(yīng)用OCR文檔。
在許多PDF-XChange Editor對(duì)話框中都可以使用頁面范圍設(shè)置。確定頁面范圍時(shí),請(qǐng)注意以下幾點(diǎn):
使用逗號(hào)分隔各個(gè)頁面。
使用連字符確定頁面范圍。
如果要定義多個(gè)頁面范圍,請(qǐng)使用逗號(hào)分隔頁面范圍。
在頁碼前使用破折號(hào)確定從文檔開頭到指定頁面的所有頁面。例如-7定義了從文檔開始到第七頁的所有頁面。
在頁碼后使用破折號(hào)確定從指定頁面到文檔末尾的所有頁面。例如7-定義了從第七頁到文檔末尾的所有頁面。
是不是非常簡單,如果您有如上的問題,那么就可以采用一下這個(gè)方法,但是如果還有其他的問題也可以在評(píng)論區(qū)留言,我們會(huì)及時(shí)回復(fù)的。
PDF-Tools,PDF-XChange Standard、PDF-XChange Editor等產(chǎn)品均已更新至最新版本,感興趣的朋友可以點(diǎn)擊此處,根據(jù)自己的需要下載使用。
想要購買PDF-XChange Editor正版授權(quán)的朋友,或者獲取更多該產(chǎn)品相關(guān)信息的朋友可以點(diǎn)擊
關(guān)注慧聚IT微信公眾號(hào) ???,了解產(chǎn)品的最新動(dòng)態(tài)及最新資訊。