Java gibi PHP Html Ayrıştırıcı

3 Cevap php

Ben Jericho, NekoHTML vb gibi çeşitli html ayrıştırıcılarını kullanarak web sayfalarının html kaynak kodu ayrıştırmak Java programlarını gelişmekte olan ..

Şimdi PHP dilinde ayrıştırıcıları geliştirmek istiyoruz. Yani başlamadan önce, ben html kodu ayrıştırmak için PHP ile, kullanabileceğiniz herhangi bir html ayrıştırıcılarda olduğunu bilmek istiyorum

3 Cevap

Çıkış DOMDocument.

Örnek 1 Bir Belge Oluşturma

<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();

Yerleşik sınıfı DOM parser çok iyi bir iş yok. Diğer çok da xml parsers vardır.

DOM Bunun için oldukça iyidir. Ayrıca ben size DOM ile yüklemeden önce HTMLPurifier ile HTML ya da diğer bazı kütüphanesini filtrelemek önermek yüzden ancak, bu kusurlu biçimlendirme durumlarda belgelenmemiş hataları ve istisnalar atar, geçersiz biçimlendirme ile başa çıkabilirim.