[]

Datada ne aradığını bilmeden pattern veya korelasyon bulmak?

Benim elimde belki de onlarca kolondan oluşan bir tablo var. Bu tabloda korelasyonlar veya patternler arıyorum. Önerileriniz var mıdır? Mümkün mü böyle bir şey, bir metodu var mı? (python vs. kullanabiliyorum düzgünce)




 
pythonda dataset(burda sizin tablo adınız yani nasıl kayıtlıysa).corr() denediniz mi? 1 veya -1e yakınlaştıkça pozitif veya negatif korelasyon artıyor.


  • pide  (09.02.23 13:00:08 ~ 13:01:21) 
df.corr() bence de iş görecektir, ek olarak bunları bir heatmap ile görmek bence faydalı oluyor:
stackoverflow.com

  • guguklusaat  (09.02.23 13:28:50) 
peki categorical stringler varsa ne yapmalıyım mesela tip 1 tip 2 tip 3, ve bunların bir integer ile korelasyonu gibi. corr sanırım sadece iki sayısal değer arasında bir yaklaşım belirliyor


  • Ranchoddas  (09.02.23 13:35:56) 
You can convert datatype to categorical and then do it

df['profession']=df['profession'].astype('category').cat.codes
df['media']=df['media'].astype('category').cat.codes
df.corr()

böyleymiş sanırım
  • Ranchoddas  (09.02.23 13:37:44) 
kategorik değişkenleri dummyye çevirip öyle yine corr'u çağırabilirsiniz. stackoverflow.com linkte ilk cevapta örnek vermiş. sizin durumunuzda değişkenler tip1, tip2, tip 3se örneğin, tip1 sütunu oluşturup tip1 olanlar 1 diğerleri 0, tip2 sütununda tip2 olanlar 1 diğerleri 0, hem tip1 hem tip2 sütunu 0sa bu da tip3 demek olacak.


  • pide  (09.02.23 13:44:47) 
Bazi metotlar var ama oyle ya da boyle bir amaca hizmet edecek ve o amaci/ne yapilacagini senin belirlemin lazim. Acikcasi verdigin cevaplardan yola cikarak, eger onemli bir calisma ise profesyonel bir hizmet almani oneririm. Kendin yapacaksan korelasyon iyi bir baslangic. Analiz yontemi veri tipine baglidir. Kategorikte de korelasyon olur ama ornegin numerikte kullandigin pearson korelasyonundan farkli olculerdir. Kategorik degiskenin de nasil bir kategorik degisken olduguna bagli olarak farkli korelasyon olculeri secilebilir. Illa numerikte oldugu ile ayni olcuyu kullanacaksan anlatildigi gibi dummy degisken kullanabilirsin (transforme ettigin degiskenlerin birbirini onemli sekilde belirlemedigine dikkat ederek) Bu durumda cikan sonuclarin yorumlamasini da ona gore yapman lazim.


  • dunal  (09.02.23 15:45:10) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.