[]

c#'da html parsing

c# kullanarak bilgisayardaki bir html dosyasını parse ederek bazı bilgileri çekmek istiyorum. internette bayağı baktım, mshtml sınıfını kullanmam gerektiğini falan gördüm ama bir türlü beceremedim. şöyle olayı anlayabileceğim açıklamalı bi kullanım örneği falan var mı bildiğiniz.

not: ek dll falan kullanmak istemiyorum onu belirteyim


 
(bkz: regex)

diyelim id'si test olan bir div'in icerigini almak istiyorsun,
Regex re = new Regex("<div id=\"test\">(.*)</div>");
seklinde bir regex yazman gerekiyor. istedigin gibi genisletip gelistirebilirsin tabi. ondan sonra aldigin veriyi de islemek sana kaliyor.
  • sourlemonade  (07.07.09 22:36:44 ~ 22:38:31) 
teşekkürler ama bu sanki olayın daha sonraki kısmı oldu gibi :)

mesela bilgisayardaki a.html dosyasını açmak için mshtml kullanmam gerekmiyo mu. yoksa direk filestream falan da kullanabiliyo muyum?
  • iterator  (07.07.09 22:42:27) 
StreamReader sayfa = new StreamReader(@"C:\hede.html",Encoding.Default);
isini gormesi lazim?

msdn.microsoft.com
  • sourlemonade  (07.07.09 22:52:54) 
tamamdır buraya kadar süper, şimdi son soru bununla çektim bi stringe attım mesela hepsini(ki yaptım :) daha sonra onun içinde uyan yeri bulmak için regex'i nasıl kullanabiliriz.. çok teşekkürler bu arada..

edit: tembellik edip bakmadan sormuşum bi bakınca gördüm. teşekkürler tekrar ;)
  • iterator  (07.07.09 23:10:57 ~ 23:12:14) 
C# taki WebBrowser kontrolünüde kullanabilirsin, elindeki dosyayı sunucu gibi gösterebileceğin biryere at. WebBrowser kontrolünden o sayfaya gir ve webbrowser sınıfının fonksiyonlarına bir bakıver, baya kullanışlı fonksiyonlar var.


  • sekizbit  (08.07.09 13:48:55) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler basond, compumaster, fraise, kibritsuyu, rakicandir
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.