[]

PHP/ curl ile source code çekmek

selamlar,

function get_html_content($url, $timeout=10) {
// fake user agent
$userAgent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2) Gecko/20070219 Firefox/2.0.0.2';

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
curl_setopt($ch, CURLOPT_USERAGENT, $userAgent);
$string = curl_exec($ch);
curl_close($ch);

return $string;
}

kodum bu. çoğu sitede gayet rahat çekiyor olmama rağmen, bazı sitelerde sanırım site bir türlü önlem almış olduğu için çekemiyorum. bunun için farklı bir yöntem var mıdır?(file_get_contents ile hiç olmuyor)

 
eger her sitede 1 sayfa cekiyorsaniz bu onlem alinacak bir sey degil.


  • orcu  (14.03.12 10:03:50) 
ona önlem demiyoruz, bazı siteler cookie'yi şart koşar, bazıları geldiğin referans adresi kontrol eder falan. bir tek user-agent belirtmekle toparlanıcak olay değil curl. hatta bilmeyene curl öğretmek de etik değil ya.

curl_setopt($ch, CURLOPT_COOKIEJAR, "cookie.txt");
curl_setopt($ch, CURLOPT_COOKIEFILE, "cookie.txt");

curl_setopt($ch, CURLOPT_REFERER, $ref_url);
  • Dr. Kissingher  (14.03.12 10:09:24) 
evet her sitede çektiğim belirli sayfalar var, ama bazı sitelerde dediğim gibi sitenin hiçbir sayfasınınn contentini çekemiyorum... öm attım sayfayı


  • project zero  (14.03.12 10:09:39) 
1
buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler basond, compumaster, fraise, kibritsuyu, rakicandir
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.