htmlpurifier, üçüncü şahsın overpurification kaynağı

0 Cevap php

GÜNCELLEME 2: http://htmlpurifier.org/phorum/read.php?3,5088,5113 Yazar zaten sorun belirlemiştir.

GÜNCELLEME: Sayı 4.2.0 sürümüne özel olarak görünmektedir. Ben 4.1.0 geçtim ve o inşaat. Tüm yardım için teşekkür ederiz. Onaylanmış paket yazarı.

Ben gibi bazı sayfalarını kazıma am:

http://form.horseracing.betfair.com/horse-racing/010108/Catterick_Bridge-GB-Cat/1215

W3C doğrulama göre, sıkı geçerli XHTML.

Sonra http://htmlpurifier.org/ bir DOMDocument içine yüklemeden önce HTML arındırmak için kullanıyorum. Ancak sadece içerik tek bir satır döndürüyor.

Çıktı:

12:15 Catterick Bridge - Tuesday 1st January 2008 - Timeform | Betfair

Kod:

echo $content; # all good
$purifier = new \HTMLPurifier();
$content = $purifier->purify($content);
echo $content; # all bad

Btw bu etki tüm sayfalar için başlık bırakır dediğiniz gibi, başka bir siteden kaynaklı veriler için çalışıyor.

İlgili Bağlantılar

0 Cevap