Sziasztok.
Már hetek óta fontolgatom, hogy nyitok egy fórumtémát a karakterfelismerésről, mert nekem is hasonló gondom van, de mint látom,másoknak is, akkor inkább ide írom szerény "tapasztalataimat ".
Rengeteget "gugliztam" ebben a témában, mivel egy kis irodában néhány gépet tartok karban, és nekünk is néha életbevágó lenne egy jó Linuxos karakterfelismerő, íme az eddigi eredményeim :
A legjobb, mai napig verhetetlen karakterfelismerő az Abby Fine Reader, ami jelenleg a 10. kiadásánál tart, windowsra van írva, az ára 41.600 FT.
( Lehet off-olni, de ha valaki egy hasonló, Ubuntu-n használható karakterfelismerő linkjét elküldi, annak fizetek egy virtuális nagyfröccsöt ! )
Linkek itt :
http://pcworld.hu/abbyy-finereader-10-20100310.html
http://wareseeker.com/download/ABBYY-FineReader-9.0.rar/60266034
( Volt szerencsém belenézni a telepítőlemezén a txt-be... hát még akkor is életveszélyes fenyegetéseket helyeztek kilátásba, ha csak ránézek a lemezre fizetés nélkül, úgyhogy nem semmi csapat...)
Van Linuxra is, "természetesen" fizetős.
http://www.ocr4linux.com/Linux_CLI_OCR_Download.html
http://forditoprogram.lap.hu/
Miután ezeket valahogy nem akartam...szétnéztem mit lehetne az Ubuntu alatt, úgy "helyből"
Synapticban benne van :
gscan2pdf -könnyen telepíthető, kezelhető, de nem tud magyarul. A benne lévő GOCR-ről az olvastam valahol, hogy német, lehet hogy nem, de egy a lényeg : csodásan kimenti a szöveget bármilyen pdf-ből, scannerből is, a merevlemezről is be lehet vinni pdf-et - csak éppen annyi hibát vét, hogy szinte teljesen át kell írni, gondolom a nyelv nem stimmel....
A PDF-Editor-al sem boldogultam, nem ment txt-be, ( vagy csak én nem értek hozzá..)
http://code.google.com/p/ocropus/downloads/list -innen letölthető az ocropus nevű progi, de a Synaptic-ban is benne van, a hocr nevű úgyszintén a Synaptic-ban- egyik se hozta nálam a várt eredményt, afféle futottak még kategória.
De: http://www.free-ocr.com/
http://www.newocr.com/
Ez a két link olyan oldalra visz, ami ingyenes,tud magyarul, és elég tűrhető szövegmentést lehet vele csinálni, állítólag nincs darabszám-korlátozás.
Regisztrálni nem kell, rögtön használhatók.
Találtam még : http://letoltokozpont.hu/letoltes_programok_reszletes.php?a=3689&k=42 - windows-os, fizetős...
A legjobb eredményt ez adta : http://ocrterminal.com/
Teljesen ingyenes, be kell ugyan regisztrálni egy felhasználónév-mail -címmel, és oda küldik a linket, ami aktiválja.Viszont itt van darabszám-korlát, havi 20 oldal !
Nem sok... 5 oldalt próbáltam ki, el is használtam a havi kvótám egynegyed részét, viszont egyetlen betűt sem kellet javítanom, teljesen hibátlan !
Szóval ezek szerintem szükségmegoldások. És a legfőbb gondom velük, hogy a formátumot nem tartják meg, inkább csak afféle " szövegkimentésre" használhatók.
Én olyat szeretnék ami a formátumot is megtartja, tehát ha valaki tud olyat, annak nagyon örülnék, és ahogy itt olvasgatok az oldalon, talán mások is megköszönnék...
Viszont ezek a web-es megoldások szerintem legalább a topiknyitó kolléga gondját megoldják.