PHP ile bir web sitesi bilgi almak için nasıl

5 Cevap

PHP ile bir web sitesi bilgi almak için nasıl.

Kullanmadığınız

file_get_contents

Web sitesi bilgi almak için başka bir yolu var mı.

Örnek URL: http://www.quarkbase.com/google.com

Bu sayfada size GOOGLE sayfa hakkında tüm bilgileri alırsınız. I bir sitenin herhangi bir URL girerseniz böyle ben bu site ile ilgili daha fazla bilgi almak gerekir.

Ben sorgu çok açıktır umuyoruz.

Eğer sorgu ile ilgili herhangi bir şüpheniz varsa bana bildirin

Teşekkürler n önceden

Fero

5 Cevap

curl işlevlerine bakıyoruz.

php.net a basic example vardır.

Sen C taşıdık f * () işlevlerini kontrol etmek isteyebilirsiniz

Bunlar ince akışı manipülasyon için izin verir.

Bazı iyi ipuçları here.

$handle = fopen( "http://www.quarkbase.com/google.com/", "r", false, $context );
$text = '';
while ( !feof( $handle ) )
    $text .= fread( $handle, 8192 );
fclose( $handle );

cURL onun sorunu çözmez. Bu, belki de ona web sitesinin bir ekran görüntüsü almaya yardımcı olabilir, ancak URL ile ilgili kendi bilgi kaynaklarının bir bolluk geliyor. Trafik bilgisi Alexa geliyor, onlar ilgili internet sitelerinden sosyal ağ istatistikleri elde, ve şirket hakkında herhangi bir bilgi ayrı bir veritabanından almak ya web sitesi çalışan, ya da çalışanların büyük web siteleri onlar indeksi hakkında bilgi girmeye var.

Sadece sayfanın kaynağını okuyarak bilgi türünü ayırt yolu yoktur. Onlar, vb onlardan maden verilerine sosyal ağ servislerinin API'lerini kullanan, onların kullanım verilerini almak için Alexa API kullanmak, desen için sayfanın içeriğini aramak için algoritmaları ton kullanın

Kesinlikle kolay bir iş değil ...

Ben toplamak için çalışıyoruz ne 'web sitesi bilgileri' tamamen anlıyorum, ama belki http://builtwith.com daha yakın alırsınız emin değil misiniz?

Yani .. web sitesi bilgileri yaparak, kayıt ve etki alanı bilgilerini demek? Dnsstuff.com veya etki sahibi bir firma hakkında diğer meta bilgileri aracılığıyla gibi.

Verilerin bu tür birçok otomatik kazıma zor olabilir. Eğer birkaç yerde bu bilgi almak gerekiyor, ama onlar kendi robots.txt uymamanın bulursanız bu yerlerin çoğu sizi bloke kalmaz.

Sen toplamak istediğiniz şeylerin bir daha kesin listesini yapmak gerekir. "Dns araçları" için Google ve http://dnsstuff.com bu yakın bu bilgileri almak için sizi götürecek gibi şeyler bulacaksınız. Bazen de bilgi almak için networksolutins.com gibi kayıt için gitmek zorunda. Ayrıca, unix whois komutu ve unix kazı komutu içine bakmak.