Normalde regexes ile bir HTML dosyasını ayrıştırmak gerektiğini, ancak bu durumda bir istisna yapabilir (özellikle sayfa hala <font> kullandığından beri, yapı yine kırık ve bir XML ayrıştırıcı çok yardımcı olmaz) . Burada Bu kod parçası zaten web sayfasını getirilen ve dize değişkeni içine koyduk varsayar $webpage_as_string:
preg_match('|Results.+?of +about +\<b\>([0-9,]+)\<\/b\> +for|', $webpage_as_string, $matches);
$matches[1], bir dize olarak sonucu içerecektir. Tabii ki, bu kod olarak yakında Google bu site şablonunu değiştirir gibi kıracak ... virgül filtre ve bir dizi ayrıştırmak gerekiyordu.
http://php.net/manual/en/function.preg-match.php işlevi hakkında daha fazla bilgi içerir, model manuel burada: http://www.php.net/manual/en/reference.pcre.pattern.syntax.php