html belge, php cURL, php, preg_match'in belirli bir kısmını ayıklamak

3 Cevap php

I'm trying to extract some information from a webpage using php cURL+preg_match or any other function but for some reasons it doesn't work at all . For example from this page http://www.foxtons.co.uk/search?location_ids=1001-29&property_id=712128&search_form=map&search_type=LL&submit_type=search I want to extract the title which is "4 bed house to rent, Caroline Place, Bayswater, W2", the price which is "2,300" and the description which starts at "This fantastic..." and ends at "(Circle and District Lines). " I tried to use php cURL + dom but I'm getting a lot of errors like this "htmlParseEntityRef: expecting ';' in Entity, line: 243" and no result displayed

Ayrıca ben preg_match veya preg_match_all kullanmak için ama ya çalışmıyor çalıştı.

Çok temel bir örnek son derece mutluluk duyacağız!

teşekkür ederim!

3 Cevap

A very basic example would be highly appreciated

Regex kısmını cevaplamak için:

preg_match('!<title>(.*)</title>!s', '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
    <head>
<title>

            4 bedroom


        house


    to rent in Caroline Place, Bayswater, W2 through Foxtons (Property to rent)</title>
<meta name="keywords" content="Houses" />', $matches);
print_r($matches);

/* output:
Array
(
    [0] => <title>

            4 bedroom


        house


    to rent in Caroline Place, Bayswater, W2 through Foxtons (Property to rent)</title>
    [1] => 

            4 bedroom


        house


    to rent in Caroline Place, Bayswater, W2 through Foxtons (Property to rent)
)
*/

s regex sonunda (inaptly) denilen bir şey içine ayrıştırıcı koyar single-line mode.

Sen Simple HTML DOM parser hoşgörülü daha suçu olup olmadığını deneyebilirsiniz.

Ve Terms & Conditions Eğer kazıma sitenin dikkat.

Ben HTMLsql için yeterince yüksek bir tavsiye veremem:

http://www.jonasjohn.de/lab/htmlsql.htm

Bu köpek yavrusu saymak pek çok yönden bana birçok kez kurtardı.