PHP DOMDocument - Benim "gerçek" ne

0 Cevap php

Ben bazı HTML DOM ayrıştırma yapmak için çalışıyorum. Ben yapıyorum ayrıştırma sayfanın URI bağlıdır. Sorun olduğunu ben aşağıdaki gibi bir HTML dosyasını yüklediğinizde:

// Creat HTML DOM
$dom_document = new DOMDocument();
@$dom_document->loadHTMLFile('http://www.google.com/');

Bazen siteye (örneğin Google bir ülke belirli bir etki beni yönlendirebilir) tarafından yönlendirildi. Sorular:

  1. Nasıl yönlendiriliyorsunuz engellerim? Ben ayrıştırmak istediğiniz sayfaya açıkça belirtmek istiyorum - ve başka bir sayfaya gönderilir değil. Ben DOMDocument kullanmak gerekmez.
  2. Yönlendiriliyorsunuz önlemek için bir yol varsa, ben gönderilen ne URI bilmek en azından bir yolu var mı?

EDIT 1:

function get_html_content($url)
        {
            $ch      = curl_init();

            curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
            curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
            curl_setopt($ch, CURLOPT_FOLLOWLOCATION, FALSE); // not good for 301 redirects
            curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
            curl_setopt($ch, CURLOPT_URL, $url);

            $data = curl_exec($ch);

            // Check if any error occured
            if(curl_errno($ch))
            {
                echo 'Curl error: ' . curl_error($ch);
                assert(FALSE);
                die();
            }

            curl_close($ch);

            return $data;
        }

0 Cevap