Sziasztok!
Most kivételesen megkaptam az aktuális GURU-t, csak a két előzőt nem,
így csak annyit ismerek az előzményekből, ami az utolsóból kiderül.
Én régebben használtam OCR-eket és a legjobbnak az Abbyy FIneReader-t
találtam. Mind a sima nyomtatott, mind a PDF-ket nagyon jól értelmezte.
PDF-kre van külön programja is. Régebben el lehetett érni próba verziót
a FineReader-ból, érdemes megkeresni a honlapját.
A FoxitReader is viszonylag jó volt PDF-kre, de nagyon függött a minőség
az eredetitől (talán a mentés felbontásától) és a többhasábos anyagokat
csak hasábonként lehetett kijelölni és másolni. Magyarra nem próbáltam,
de az angol szöveggel jól elboldogult.
Szerintem a Recognita nyomtatott anyagokból jól dolgozott, de nagyon
érzékeny volt a szöveg vízszintes elhelyezésére (legalábbis a kezdeti
verziók). Arra viszont számítani kell, hogy a nyomtatási hibák hibás
felismerést eredményeztek. Viszont tanítható. Tehát, ha valamelyik -
általában ékezetes - betűt következetesen nem jól azonosítja, akkor meg
lehet adni, hogy azt mivel kell lecserélni.
Török Árpád
2019. 02. 21. 2:59 keltezéssel, HIX GURU írta:
Sziasztok!
>Lelkesedésem lelohadt, kiderült, nem is a Canoscan
>OCR-ezi a szöveget, hanem az Acrobat reader.
>És nem is jól, most illusztrálódott számomra az, amiről
>Kormos Krisztián írt. A képernyőn a PDF helyesnek
>látszik, de a kijelölt / kimásolt szöveg máshova
>beillesztve már helytelen lesz. Az é betű helyet 6,
>az á betű helyett 5 lesz a másolatban, pl....
Nem, ez szandekos!!! Mesterseges intelligencia oran volt, hogy
alkothato tokeletes karakterfelismero, de az mindenkepp titkosszolgalati,
mert akkor te mindent be tudsz digitalizalni hibatlanul.
Avagy a hibakat szandekosan csinaljak, hogy a maganember nehogy
tudjon valamit csinalni, meg hogy lassu legyel.
Allitolag nagy tomegben letezik hamis Recognita (OCR) is, vagy letezik
olyan
Recognita , ami hibatlatlanul olvas, de ahhoz csak az allam juthat hozza.
Tamas
|
"Allitolag nagy tomegben letezik hamis Recognita (OCR) is, vagy letezik
olyan
Recognita , ami hibatlatlanul olvas, de ahhoz csak az allam juthat hozza."
---
--- Hűha. Hát a tanár le lehet maradva pár évtizeddel. Működő és frankó
OCR
létezik és elérhető is. Az online converter például kellően nagy és éles
kép esetén kb. hibátlanul dolgozik. Ezért mondtam, hogy csak a dokumentumok
megjelenése legyen megőrizve, majd az újra-OCR-ezni és kész is. A kérdező
elveszett abban, hogy én celformátumnak szintén PDF-et javasoltam, de mehet
.txt-be vagy akár .docx-be is, meg a bánat tudja hogy még mi a bánatba
nem.
Szerintem ez a titkosszolgálatos dolog légbőlkapott. Miért is fájna nekik
az, hogy van OCR-ünk? Nehogy beszkenneljünk egy egyetemi handoutot, vagy
mi?! :D Meg aztán szabványos betűtípusokhoz akár házilag is meg lehet írni
egyet, mert csak statisztikai egybevetés, amíg nem pocsék a kép. Nyilván
izzasztó, de megoldható, és nem jelenik meg a TEK helikopterrel, ha
csinálsz egyet :D
--
KORMOS Krisztián
+36304778633
- User of Links 2.17/2.15 web browser for DOS operating system on Caldera
DR-DOS 7.03 KormaX distribution, 2019.
-- Author of KormaX DOS distribution for modern PC's
DOS ain't dead C:\>_
|