GÜNCELLEME 2: http://htmlpurifier.org/phorum/read.php?3,5088,5113 Yazar zaten sorun belirlemiştir.
GÜNCELLEME: Sayı 4.2.0 sürümüne özel olarak görünmektedir. Ben 4.1.0 geçtim ve o inşaat. Tüm yardım için teşekkür ederiz. Onaylanmış paket yazarı.
Ben gibi bazı sayfalarını kazıma am:
http://form.horseracing.betfair.com/horse-racing/010108/Catterick_Bridge-GB-Cat/1215
W3C doğrulama göre, sıkı geçerli XHTML.
Sonra http://htmlpurifier.org/ bir DOMDocument içine yüklemeden önce HTML arındırmak için kullanıyorum. Ancak sadece içerik tek bir satır döndürüyor.
Çıktı:
12:15 Catterick Bridge - Tuesday 1st January 2008 - Timeform | Betfair
Kod:
echo $content; # all good
$purifier = new \HTMLPurifier();
$content = $purifier->purify($content);
echo $content; # all bad
Btw bu etki tüm sayfalar için başlık bırakır dediğiniz gibi, başka bir siteden kaynaklı veriler için çalışıyor.
İlgili Bağlantılar
- HTMLPurifier dies when the following code is run through it. (benzer bir konu üzerinde cevapsız soru)