Ben işveren web siteleri tarafından verilen bazı xml / API olmadan mümkün sanmıyorum?
temelde i ayıklamak ve bir html sayfasından bilgi belirleyebilir?
Siz teoride olabilir, ama iş ilanlarında için işveren web kazıma çok karmaşık programlama, örüntü tanıma, (pek çok) kez sistem yanlış alacak için manuel post-processing ve sürekli güncellenmesi gerektiren bir beyhude, beyhude bir çabadır.
Ayrıca, yasal sorunlar var. Kazıma süreci genellikle izin verilir iken, çoğu web siteleri verilerin otomatik işleme korusun, bu yüzden herhangi bir iş teklifi yeniden yayımlamak bu şekilde getirilen zaman bir sürü sorun için olabilir.
XML ya da yapılandırılmış, standart, yasal verilerin başka türlü için gitmek gerekir.
Bunu alamıyorsanız, onu unutmak ve zaman ile daha neşeli bir şeyler söyleyebilirim.
Bazı insanlar ekran kazıma girişiminde - anlamıyla metni getiriliyor ve bilgileri ayrıştırmak çalışıyorum, (x) html yapısı bir bilgiye dayalı. Varsayım, hedef sitenin sahibi verilerini paylaşmak istedim eğer, verileri bir yem veya webcoder olarak hazır olacağı gibi, bu son derece hoş karşılanmaz.
Belki onlara sormak?