DOM ile HTML ayrıştırma sırasında dosya uzaklıklar tutulması?

0 Cevap php

I <img src="">-çok-malforme değil HTML (WordPress mesaj) niteliklerini değiştirmek istiyorum. Ben basit bir şekilde almak ve Regexes kullanabilirsiniz biliyorum, ama korkarım people in blue furry suits will come haunt me in my sleep değilim.

Ben HTML okumak ve <img> etiketleri değiştirmek için DOM ayrıştırıcı kullanırsanız DOM çözümleyici muhtemelen olacak, çünkü, ben, ben (sadece benim modifikasyonu ile) olduğu gibi aynen sonrası yeniden edemez korkuyorum Çok fazla temizlik yapmak ve belki de temel verileri kaldırmak. Bir SAX çözümleyici muhtemelen geçersiz XML idare edemiyorlar, dolayısıyla bu da işe yaramaz.

Yani, bir DOM ayrıştırıcı kullanabileceğiniz bir orta yol vardır, ancak her eleman başladı bir olduğunu bilir, bu yüzden dize değiştirmeleri veya oradan benzer bir şey yapabilirim? Ben (<b>Some <i>bizarre</b> formatting</i> muhtemelen bu tetikleyecek) DOM ağacındaki bazı düğümler kaynak belgede yok biliyorum, ama bu her zaman mümkün değildir demek? PHP 5.3 'te eklenen bir DOMNode::getLineNo() function olduğunu görmek, ama ben 5.2.x. kullanıyorum

0 Cevap