Kaip konvertuoti nuskaitytus dokumentus į Word - laimingas Android

Jei jums reikia suskaitmeninti knygą tekstiniu formatu, jums gali kilti keletas klausimų. Ar tai galima padaryti, kaip dėl kokybės, ar ji gera? Tai ne tik galima padaryti, bet taip pat yra keletas būdų, kaip konvertuoti nuskaitytą dokumentą į Word. Pažiūrėkime:

  • Dokumento nuskaitymas PDF formatu ir jo redagavimas vėliau naudodami „Adobe Acrobat XI Pro“, kad išsaugotumėte jį „Word“ formatu. Acrobat Pro versija yra mokama, tačiau galite įsigyti nemokamą 30 dienų bandomąją licenciją.
  • Iš OnlineOCR.net svetainės. Ši žiniatinklio programa leidžia konvertuoti PDF, JPG, TIFF ir GIF formatų dokumentus į Word, Excel ir tekstą. Nemokamoje versijoje galime konvertuoti iki 15 puslapių per valandą ir ne daugiau nei vieno puslapio dokumentus.
  • Dokumento nuskaitymas (OCR) formatu ir išsaugokite jį kaip tekstą. Tada galime atidaryti Word ir redaguoti arba išsaugoti .doc formatu.
  • Naudojant kokią nors optinę simbolių atpažinimo programą:
    •  VueScan (galima naudoti „Windows“, „Mac OS X“ ir „Linux“)
    • Kooka(skirta Linux)
    • Biuro objektyvas (skirtas Android ir ios)
    • „CamScanner“ (skirta Android ir ios)

Veiksmingiausias būdas, kurį galime pasakyti, yra „Adobe Acrobat Pro“, bet tik tuo atveju, jei nuskaitymas yra labai, labai švarus ir aukštos kokybės. Optinio simbolių atpažinimo programos nuėjo ilgą kelią, tačiau jose vis dar yra spragų, pvz., pusjuodžiu ar kursyvu, o kai kurių žodžių transkripcija, atsižvelgiant į originalaus dokumento šrifto tipą, gali būti klaidinga.

Pabandykite nuskaityti ir perduoti šį dokumentą „Word“, kad pamatytumėte, kas atsitiks

Iš paties skaitytuvo

Kai kurie skaitytuvai turi optinio atpažinimo (OCR) funkciją savo nuskaitymo programoje. Norėdami nuskaityti dokumentą į tekstą, tereikia nustatyti skaitmeninimo formatą ir pažvelgti į tą, kuris nurodo OCR ar panašiai (tai priklauso nuo skaitytuvo prekės ženklo / modelio).

Pereikite iš PDF į Word su Adobe Acrobat XI Pro

Kadaise „Adobe Acrobat XI Pro“ (ČIA turite 30 dienų nemokamą bandomąją versiją) eikite į „Įrankiai -> Teksto atpažinimas -> Šiame faile”.

Lange "Atpažinti tekstą"Spustelėkite"Redaguoti"Ir pasirinkite teksto kalbą, išvesties stilių ir skiriamąją gebą.

Norėdami baigti, grįžkite į "Įrankiai -> Turinio redagavimas -> Redaguoti tekstą ir vaizdus"Ir pakeiskite tekstą, jei reikia pataisyti žodį. Norėdami baigti, spustelėkite "Failas -> Išsaugoti kaip"Ir išsaugokite jį Word formatu.

OnlineOCR

„OnlineOCR“ yra žiniatinklio programa, skirta vaizdams ar pdf failams perkelti į „Word“, ir ją labai paprasta naudoti. Paaiškinu, kaip tai veikia: Įveskite //www.onlineocr.net/ ir spustelėkite "Pasirinkite failą“. Pasirinkite nuskaitytą dokumentą, tada pasirinkite kalbą ir išvesties formatą iš 2 išskleidžiamųjų meniu, esančių ekrano centre.

Norėdami baigti, spustelėkite "Paversti“. Tiesiog po juo bus rodoma paprasto teksto peržiūra, kurią galėsite redaguoti, jei reikia pataisyti žodžius. Galiausiai spustelėkite "Atsisiųskite išvesties failą"Ir jūs galite atsisiųsti failą Word formatu. Čia yra PDF, konvertuoto į Word naudojant OnlineOCR, pavyzdys:

  • Originalus PDF:

  • Konvertuotas dokumentas:

Jei ši žiniatinklio programa jūsų netenkina, galite išbandyti kitas panašias alternatyvas, pvz Nemokama OCR arba Nemokamas internetinis OCR.

Optinio simbolių atpažinimo (OCR) programos

Jei nenorite keisti savo dokumentų internete ir jums reikia darbalaukio programos, galite naudoti tokias programas kaip VueScan (kuris taip pat galimas „Mac“ ir „Linux“, be visur esančių „Windows“).

Kita galimybė yra naudoti „Android“ arba „iOS“ įrenginį dokumentui nuskaityti ir tiesiogiai konvertuoti į tekstą. Yra tokių programų kaip Biuro objektyvas (dėl Android ir ios) arba CamScanner (dėl Android ir ios), kurie visą procesą atlieka iš tos pačios programos. Tokiais atvejais rekomenduojama išvalyti vaizdą prieš konvertuojant jį į tekstą. Jei norite sužinoti daugiau apie šį metodą, pažiūrėkite ŠIS ĮRAŠAS.

Mano nuomone, optinio simbolių atpažinimo technika, nors pastaraisiais metais labai patobulėjo, vis dar tebėra šviesmečių nuo tobulos technikos. Daug smulkmenų, daug žodžių, kuriuos „išverčia“ neteisingomis raidėmis ir simboliais, kurie iškrauna tekstą. Jam vis dar trūksta to papildomo intelekto tai leidžia pamatyti, kad «t &! $ olog1a»Negali būti tinkamas jokio teksto žodžio vertimas. Vis dar matau ne skaitymo supratimą, o paprastą vizualinį atskirų raidžių, kurios sudaro žodžius, atpažinimą, neintegruojant jų su likusiu tekstu. Tačiau esu įsitikinęs, kad akimirka, kai padarysime tą paskutinį didžiulį šuolį, kasdien artėja.

Tu turi Telegrama įdiegta? Gaukite geriausią kiekvienos dienos įrašą mūsų kanalas. Arba, jei norite, sužinokite viską iš mūsų Facebook puslapyje.

Naujausios žinutės