Oldukça basit eminim, ama ..
Ben sadece bir
bazı yazı h1> için garanti bir dosya var ettik ve bir
içinde biraz daha metin p>.
Nasıl ayrı değişkenler gibi unsurların bu geri dönen hakkında gitmek istiyorsunuz?
Sizin dosyası sadece metin olduğunu, bu nedenle bunu ayrıştırmak zorunda gidiyoruz. Genellikle HTML normal operasyonlarına ayrıştırma için tüm bu uygun değildir, ancak tam olarak içeriğini biliyor eğer bir sorun olmamalıdır.
Lütfen ayırıcı iki etiketi bloklar arasında ne bağlı olarak (en bir \n, böyle bir şey yapabileceğini gibi davranalım bakalım:
$contents = file_get_contents("yourfile.html");
list($h1,$p) = explode("\n",$contents);
Bu size $h1 iki metin bloklarını vermek ve $p olur. Eğer daha fazla iş yapmak için gerekli eğer oradan kalanını ayrıştırmak olabilir.
Dosya bir HTML biriyse, genel bir çözüm olacaktır:
DOMDocument, with
DOMDocument::loadHTML , bir dize olarak HTML içerik varsaDOMDocument::loadHTMLFile DOMDocument::getElementsByTagName mükemmel olmalı
Böyle bir şey kullanabilirsiniz:
function strBetween($au, $au2, $text) {//gets substring beetween $au and $au2 in $text
$pau = strpos($text, $au);
if($au2 !== '') {
$pau2 = strpos($text, $au2,$pau);
if($pau !== false && $pau2 !== false)
return substr($text, $pau+strlen($au), $pau2-$pau-strlen($au));
else
return '';
} else {
return substr($text, $pau+strlen($au));
}
}
$contents = file_get_contents("yourfile.html");
$h1 = strBetween('<h1>', '</h1>', $contents);
$p = strBetween('<p>', '</p>', $contents);