türkçe desteği olan pdf'ten doc-txt formatlarına dönüştüren program önerisi
selamlar herkese,elimde pdf olarak taranmış eski yıllardan ansiklopediler var. içerisinde resimler de olabiliyor bazı sayfalarında. ben bu pdf dosyalarını doc ve txt formatlarına çevirmek istiyorum. özellikle txt dosyalarına çevirmem lazım. hem türkçe karakterleri tanıyacak hem de ansiklopedi format
selamlar herkese,
elimde pdf olarak taranmış eski yıllardan ansiklopediler var. içerisinde resimler de olabiliyor bazı sayfalarında. ben bu pdf dosyalarını doc ve txt formatlarına çevirmek istiyorum. özellikle txt dosyalarına çevirmem lazım.
hem türkçe karakterleri tanıyacak hem de ansiklopedi formatı sebebiyle (-) işaretiyle biten kelime sonlarını birleştirecek bir program arıyorum.
eskiden mizanpaj programları sanıyorum bunu yapabiliyordu ama güncel olarak hangisi var bilemiyorum.
bildiğiniz bu tip program ya da programlar önerisi olan arkadaşlardan tavsiye rica ediyorum.
teşekkürler.
0
ABBYY FineReader OCR'ların en iyisidir ama - işaretini birleştirebileceğini sanmıyorum. Word'e attıktan sonra bunu kendin yapabilirsin.
Ctrl+H yapıp gelen pencerede aranan bölümüne -^p yazıp değiştirilecek bölümü boş bırakırsan - ile alt satıra geçen tüm kelimeleri birleştirir.
0
@himmet dayi cevap için teşekkürler.
ancak şimdi word'te dediğini denedim ve malesef komut sadece 1 adet değişiklik yapabildi. bazı kelimelerin en dibine - işareti konmuş bazısının ise bir boşluk bırakıldıktan sonra konmuş. her iki durum için senin verdiğin komutun başına boşluklu ve boşluksuz denedim yine olmadı.
0
Boşluktan sonra 'Enter' ile alt satıra geçilmediyse ^p işe yaramaz normal olarak.
Birkaç hamlede yapılabilir. Önce -^p'ler değiştirilir. Hala duran varsa ' -' değiştirilir (tırnaklar olmadan). sonra '- ' değiştirilir, son olarak ' - ' değiştirilir. Tabii bunları metin içinde - işareti sadece alt satıra geçmek için kullanıldıysa yapmakta fayda var.
0
hocam ufak bir örnek yükledim. zahmet olmazsa bi dener misiniz? her türlü kombinasyonu denedim ama olamadı.
www50.zippyshare.com
0
örnek metindeki bazı - işaretleri klavyedeki - tuşundaki - değil. farklı bir karakter.
-^p yapıp tümünü değiştirdikten sonra (az sayıda) kalan satırlardan birinden - simgesini kopyalayıp onu arama bölümüne yaz. ardına ^p ekle. Tümünü değiştirince - ile bölünmüş kelimeler birleşecek. Ancak dar bir sütundan kopyalandığı için çok fazla satır aşağı inilmiş. Bunların tümünü ^p ile değiştirmekte fayda var.
Böyle yapınca tüm paragraflar da birleşip düz metin olacak ama yapmayınca bir satırda bir kelime olan bir halde kalıyor. Paragrafları birleştirip sonra elle bölebilirsin.
0
hocam aynen dediğin gibi yaptım ve oldu. bazı kelimeler birbirine yapışsa da daha fazlasını isteyemem senden. ama genel olarak sonuçtan memnunum.
yarın abby fine ocr ile de deneyip tekrar bakacağım sonuçlara.
yardımların için çok çok teşekkürler.
0
çok zor iş. ocr programları bu işleri yapacaklarını iddia ediyorlar ama sonrasında çok fazla redaksiyon gerekiyor. kolay gelsin. illa lazım değilse, hiç girmemek iyi olabilir.
0