Question

Bir web kazıyıcı yapıyorum ve bu beni deli ediyor!

Ben bir paragraf metni almak gerekiyor. Basit, değil mi?! İşte kod.

$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//div");

for ($i = 0; $i < $hrefs->length; $i++) {
 $href = $hrefs->item($i);
 $url = $href->getAttribute('class');
 echo "<br />Found it: $url";
}

Bu, mükemmel çalışıyor sayfadaki her div sınıfını kapmak ve dışarı yankıları. Sayfadaki her biri - - Ama ben gerçekten yapmanız gereken tüm <p> etiketleri bulmak ve <p> arasında olan metni echo! Ben basit bir his var ama ben sadece bunu anlamaya olamaz.

edit

Tüm aldı şu oldu:

$doc = new DOMDocument();
@$doc->loadHTML($html);
$node = $doc->getElementsByTagName('p')->item(3);
echo $node->textContent."\n";

Ne gerçekten istediğiniz getElementsByName olduğunu ve düğüm var bir kere o zaman kazanmak için TextContent. Teşekkürler millet! Emin değil herkesin başkasının durum için geçerli olacak, ama emin benim eğer. = O

Paragrafın metin dom elemanı

0 Cevap

etiketler