Bir web kazıyıcı yapıyorum ve bu beni deli ediyor!
Ben bir paragraf metni almak gerekiyor. Basit, değil mi?! İşte kod.
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//div");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('class');
echo "<br />Found it: $url";
}
Bu, mükemmel çalışıyor sayfadaki her div sınıfını kapmak ve dışarı yankıları. Sayfadaki her biri - - Ama ben gerçekten yapmanız gereken tüm <p>
etiketleri bulmak ve <p>
arasında olan metni echo! Ben basit bir his var ama ben sadece bunu anlamaya olamaz.
edit
Tüm aldı şu oldu:
$doc = new DOMDocument();
@$doc->loadHTML($html);
$node = $doc->getElementsByTagName('p')->item(3);
echo $node->textContent."\n";
Ne gerçekten istediğiniz getElementsByName olduğunu ve düğüm var bir kere o zaman kazanmak için TextContent. Teşekkürler millet! Emin değil herkesin başkasının durum için geçerli olacak, ama emin benim eğer. = O