Ben Markdownify kütüphaneyi kullanarak Markdown HTML parçacıkları yüzlerce dönüştürmek için bir PHP komut satırı komut dosyası yazma sürecinde yaşıyorum. Ancak, benim bazı HTML Markdownify ile kullanılmak için yeterince iyi yapılandırılmış olmayan bir duruma rastlamak var. Bu yüzden ilk önce o kadar temiz ve ben tam HTML belgeleri, HTML kısmi blokları ile değil çalışıyor olacak isteğe bağlı kapatma etiketleri, vb ekleyebileceğiniz bazı kütüphane aracılığıyla benim HTML göndermek gerek, bu yüzden döndürülen HTML kısmi olmalı (ve DOCTYPE, vb) dahil değildir.
Eğer XHTML HTML dönüştürmek bir PHP script biliyor musunuz?
Solution:
PHP DOMDocument class yararlanın. Kırılmış olsa bile HTML'nizi biçimlendirir. Sonra temizlenmiş HTML çıkarabilir:
libxml_use_internal_errors(true); //use this to prevent warning messages from displaying because of the bad HTML
$doc = new DOMDocument();
$doc->loadHTML($badHtml);
$goodHtml = $doc->saveHTML();
Bu ben bunu bir HTML kısmi blok geçti bile, (vücut etiketi temizlenmiş sürümü ile) tam bir HTML belgesi dönecektir, bu yüzden bu regex ile temizlenir kısmi çıkarabilir:
$goodHtmlPartial = trim(ereg_replace('(.*)<body>(.*)</body>(.*)', '\2', $goodHtml));