birçok şirket web sitelerinden endeksi yeni işler için bir arama motoru oluşturmak mümkün mü?

3 Cevap php

Ben işveren web siteleri tarafından verilen bazı xml / API olmadan mümkün sanmıyorum?

temelde i ayıklamak ve bir html sayfasından bilgi belirleyebilir?

3 Cevap

Siz teoride olabilir, ama iş ilanlarında için işveren web kazıma çok karmaşık programlama, örüntü tanıma, (pek çok) kez sistem yanlış alacak için manuel post-processing ve sürekli güncellenmesi gerektiren bir beyhude, beyhude bir çabadır.

Ayrıca, yasal sorunlar var. Kazıma süreci genellikle izin verilir iken, çoğu web siteleri verilerin otomatik işleme korusun, bu yüzden herhangi bir iş teklifi yeniden yayımlamak bu şekilde getirilen zaman bir sürü sorun için olabilir.

XML ya da yapılandırılmış, standart, yasal verilerin başka türlü için gitmek gerekir.

Bunu alamıyorsanız, onu unutmak ve zaman ile daha neşeli bir şeyler söyleyebilirim.

Bazı insanlar ekran kazıma girişiminde - anlamıyla metni getiriliyor ve bilgileri ayrıştırmak çalışıyorum, (x) html yapısı bir bilgiye dayalı. Varsayım, hedef sitenin sahibi verilerini paylaşmak istedim eğer, verileri bir yem veya webcoder olarak hazır olacağı gibi, bu son derece hoş karşılanmaz.

Belki onlara sormak?

Bu mümkün olabilir, ama ben bu yasal değil sanırım, en azından çok gölgeli bulunuyor. Bir xml yem ya da böyle bir şey almak için şirketlere sormak gibi, daha iyi bir çözüm için giderdim.