(1)
Python 2.x karakter sorunu
Merhaba ;Python da sıkıntı yaşadığım bir konu var. Web'de araştırdım ama çözemedim. Yardımcı olabilirseniz sevirim.Bir adet text belgem var : content.txt , tek satır içerik var şöyle : ÇEMIŞ Kodlarım da şu şekilde:# -*- coding: utf-8 -*-#metin belgesinden gelen yazıdan türkçe karakterleri replace ed
Merhaba ;
Python da sıkıntı yaşadığım bir konu var. Web'de araştırdım ama çözemedim. Yardımcı olabilirseniz sevirim.
Bir adet text belgem var : content.txt , tek satır içerik var şöyle :
ÇEMIŞ
Kodlarım da şu şekilde:
# -*- coding: utf-8 -*-
#metin belgesinden gelen yazıdan türkçe karakterleri replace ediyor.
def tr2en(str):
replace_chars = [ ('ı','i'), ('İ','I'), ('ü','u'), ('Ü','U'), ('ö','o'), ('Ö','O'), ('ç','c'), ('Ç','C'), ('ş','s'), ('Ş','S'), ('ğ','g'), ('Ğ','G') ]
for search, replace in replace_chars:
str = str.replace(search, replace)
return str
with open("content.txt" ,"r") as txt:
line = txt.read()
print tr2en(line)
test_line = "ÇEMİŞ"
print tr2en(test_line)
#ilk cikti CEMIS olmalı fakat hiçbir değişiklik olmuyor , ikinci çıktı olması gerktiği gibi CEMIS
print type(line)
print type(test_line)
#burada iki değer de str olarak geliyor
Not : Tablar için özür dilerimi kodları buraya taşıyınca yazım bozuk oldu
0
python 3.5'de kodun çalıştığını söylemek için geldim. yalnızca print'e parantezler ekledim. bir de txt dosyası ansi formatında kayıtlı. dosya unicode ise karakterler başka şeylere dönüştüğünden fonksiyon dokunamadı, utf-8'de de direkt dosya okuma hatası verdi.
0