[]

Linguistik alanında AI kullanımı

Asıl amacımı yazarak başlayayım. Diyelim ki bir dilde yazılmış, çok kolayları ve çok karmaşıkları da olan, binlerce metin var elimde. Ben bunları formüle etmek istiyorum. Mesela JSON formatında her cümle ayrı olacak, cümlenin öğeleri, sıralaması anlaşılacak. Mesela ingilizce de water kelimesi isim de olur fiil de, bunu ayırt edecek vs.

Ben bunu ChatGPT'nin normal ücretsiz versiyonuyla yazışarak sağladım ama belli bir noktada küçük hatalar yapmaya başlıyor. Metin biraz karmaşıklaşınca çok hata yapıyor. Hatalar dil bilgisi hataları değil, üzerinde anlaşılan formata uymama yönünde hatalar.

Sorum şu; bu işi nasıl daha düzgün yaptırabilirim. Prompt anlamında mı yaklaşımımı değiştirmeliyim yoksa daha özelleşmiş araçlar mı kullanmalıyım. Birkaç örneğe baktım da onlar biraz daha günlük kullanımdan uzak işin bilimsel yönüne daha yakın geldi. NLP işleri yapan örnekler denk geldi. Bunlardan da işe yarar şeyler çıkabilir bu yönde de tavsiyelere açığım.

 
Formulasyonun amacı ne? Çok kolay ve çok zor metin ne demek?

Elde etmek istediğiniz çıktıyı ben tam anlayamadım. Bir şeyler söyleyebilirim belki ama önce anlamam lazim.

Not: chatgptye muğlak promptlar verince (belki aynı olmamıştır ama, mesela buraya yazdığınız metin de muglak) bazen tutturuyor ama bazen de sekteye uğruyor, öyle bir şey de oluyor olabilir.
  • encokbenisevinnolur  (17.08.25 01:28:24) 
Prompt iyileştirme yaklaşımı da garanti değil ama denenebilir. İşi ve sorunu tanımlayıp bu iş için en iyi promptu oluştur diyebilirsiniz yine chatgptye ancak benim kendi deneyimim bu tarz kompleks işlerin eninde sonunda sarpa sardığı. Bilimsel makalelerden, önceden tanımlanmış bir veri tablosunu otomatik dolduracak şekilde veri çekecek bir iş akışı oluşturmaya çalışmıştım ama bir türlü istediğim doğruluğa ulaşamayınca rafa kaldırmıştım. Verdiğim json'a uymayıp ısrarla kendi kafasından yeni field uyduruyordu promptta üstüne basa basa yapma dememe rağmen. NLP araçları direkt bu iş için oluşturulduğu için daha mantıklı olabilir, ben olsam onlara da bakardım. Spacy, stanza, nltk vesaire araçlar. Türkçe için de zemberek vardı.


  • aloha snackbar 3  (17.08.25 07:07:33 ~ 07:12:01) 
Formulasyonun amaci baska bir uygulamada yazilimla kullanicilara gosterilmesi, neresi ozne, neresi yuklem, kelimenin gorevi ne isim mi sifat mi vs.
Cok kolay cumle mesela ‘ali okula gidiyor’ gibi basit yapili, cok zoru ise ‘alinin okula neden gitmediğini bilmiyordum’ gibi yan cumleler iceren, farkli zamanlardan bahseden cumle olarak dusunulebilir.

@aloha, bende de böyle oldu ama API ortaminda sanirim daha somut yollarla tanimlanabiliyor yapi, tabii her zaman hata ihtimali olacaktir.
  • mbond  (17.08.25 16:24:13) 
Anladım, zor ise kalkismisiniz, en azından benim gözümde, anladığım bir dilin yapısını formüle etmeye çalışıyorsunuz.

Eğer chatgpt ile gidilecekse, önce dilin temel gramerinden oluşan prompt verilebilir. Örneğin zor olarak örnek verdiğiniz cümlede hem ilgili kelimenin kategorisi (eylem, isim, nesne ismi, özel isim) hem cümledeki işlevi sonra bu kontekste göre tanımlanabilir. Ama her durumda metne ve metnin de anlattığı şeye göre, ek promptlar gerekecektir diye düşünüyorum.
  • encokbenisevinnolur  (17.08.25 17:45:05) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler basond, compumaster, fraise, kibritsuyu, rakicandir
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.