Giriş
(7)

türkçe desteği olan pdf'ten doc-txt formatlarına dönüştüren program önerisi

mirenk
selamlar herkese,elimde pdf olarak taranmış eski yıllardan ansiklopediler var. içerisinde resimler de olabiliyor bazı sayfalarında. ben bu pdf dosyalarını doc ve txt formatlarına çevirmek istiyorum. özellikle txt dosyalarına çevirmem lazım. hem türkçe karakterleri tanıyacak hem de ansiklopedi format
selamlar herkese,


elimde pdf olarak taranmış eski yıllardan ansiklopediler var. içerisinde resimler de olabiliyor bazı sayfalarında. ben bu pdf dosyalarını doc ve txt formatlarına çevirmek istiyorum. özellikle txt dosyalarına çevirmem lazım.

hem türkçe karakterleri tanıyacak hem de ansiklopedi formatı sebebiyle (-) işaretiyle biten kelime sonlarını birleştirecek bir program arıyorum.

eskiden mizanpaj programları sanıyorum bunu yapabiliyordu ama güncel olarak hangisi var bilemiyorum.

bildiğiniz bu tip program ya da programlar önerisi olan arkadaşlardan tavsiye rica ediyorum.

teşekkürler.
0
mirenk
(10.03.21)
ABBYY FineReader OCR'ların en iyisidir ama - işaretini birleştirebileceğini sanmıyorum. Word'e attıktan sonra bunu kendin yapabilirsin.

Ctrl+H yapıp gelen pencerede aranan bölümüne -^p yazıp değiştirilecek bölümü boş bırakırsan - ile alt satıra geçen tüm kelimeleri birleştirir.
0
himmet dayi
(10.03.21)
@himmet dayi cevap için teşekkürler.

ancak şimdi word'te dediğini denedim ve malesef komut sadece 1 adet değişiklik yapabildi. bazı kelimelerin en dibine - işareti konmuş bazısının ise bir boşluk bırakıldıktan sonra konmuş. her iki durum için senin verdiğin komutun başına boşluklu ve boşluksuz denedim yine olmadı.
0
🌸mirenk
(10.03.21)
Boşluktan sonra 'Enter' ile alt satıra geçilmediyse ^p işe yaramaz normal olarak.

Birkaç hamlede yapılabilir. Önce -^p'ler değiştirilir. Hala duran varsa ' -' değiştirilir (tırnaklar olmadan). sonra '- ' değiştirilir, son olarak ' - ' değiştirilir. Tabii bunları metin içinde - işareti sadece alt satıra geçmek için kullanıldıysa yapmakta fayda var.
0
himmet dayi
(10.03.21)
hocam ufak bir örnek yükledim. zahmet olmazsa bi dener misiniz? her türlü kombinasyonu denedim ama olamadı.

www50.zippyshare.com
0
🌸mirenk
(10.03.21)
örnek metindeki bazı - işaretleri klavyedeki - tuşundaki - değil. farklı bir karakter.

-^p yapıp tümünü değiştirdikten sonra (az sayıda) kalan satırlardan birinden - simgesini kopyalayıp onu arama bölümüne yaz. ardına ^p ekle. Tümünü değiştirince - ile bölünmüş kelimeler birleşecek. Ancak dar bir sütundan kopyalandığı için çok fazla satır aşağı inilmiş. Bunların tümünü ^p ile değiştirmekte fayda var.

Böyle yapınca tüm paragraflar da birleşip düz metin olacak ama yapmayınca bir satırda bir kelime olan bir halde kalıyor. Paragrafları birleştirip sonra elle bölebilirsin.
0
himmet dayi
(10.03.21)
hocam aynen dediğin gibi yaptım ve oldu. bazı kelimeler birbirine yapışsa da daha fazlasını isteyemem senden. ama genel olarak sonuçtan memnunum.

yarın abby fine ocr ile de deneyip tekrar bakacağım sonuçlara.

yardımların için çok çok teşekkürler.
0
🌸mirenk
(10.03.21)
çok zor iş. ocr programları bu işleri yapacaklarını iddia ediyorlar ama sonrasında çok fazla redaksiyon gerekiyor. kolay gelsin. illa lazım değilse, hiç girmemek iyi olabilir.
0
co2s2
(10.03.21)
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler basond, compumaster, fraise, kibritsuyu, rakicandir
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır.