http://www.atpworldtour.com/Rankings/Singles.aspx oyuncuların listesini kapmak istiyor
Sınıf "bioTableAlt", biz ilk bir tablo başlığı için kullanılır (class "bioTableHead"), tüm sonra <tr> kapmak zorunda olan bir tablo var.
: Aranan içerik benziyor
<tr class="oddRow">
<td>2</td>
<td>
<a href="/Tennis/Players/Top-Players/Novak-Djokovic.aspx">Djokovic, Novak</a>
(SRB)
</td>
<td>
<a href="/Tennis/Players/Top-Players/Novak-Djokovic.aspx?t=rb">6,905</a>
</td>
<td>0</td>
<td>
<a href="/Tennis/Players/Top-Players/Novak-Djokovic.aspx?t=pa&m=s">21</a>
</td>
</tr>
<tr>
<td>3</td>
<td>
<a href="/Tennis/Players/Top-Players/Roger-Federer.aspx">Federer, Roger</a>
(SUI)
</td>
<td>
<a href="/Tennis/Players/Top-Players/Roger-Federer.aspx?t=rb">6,795</a>
</td>
<td>0</td>
<td>
<a href="/Tennis/Players/Top-Players/Roger-Federer.aspx?t=pa&m=s">21</a>
</td>
</tr>
Ben iyi fikir array(), her <tr> eşsiz bir satır yapmak ve benzeri list.txt dosyasına, nihai kod atmak bir oluşturmak için olduğunu düşünüyorum:
Array (
[2] => stdClass Object (
[name] => Djokovic, Novak
[country] => SRB
[rank] => 6,905
)
[3] => stdClass Object (
[name] => Federer, Roger
[country] => SUI
[rank] => 6,795
)
)
Biz ayrıştırma ediyoruz her <tr>:
[2]ilk<td>bir sayıdır[name]İkinci<td>içindeki bağlantı metni[country]İkinci<td>in (...) arasında bir değer[rank]üçüncü<td>içindeki bağlantı metni
Son dosyada list.txt (ilk 100 oyuncu ile sayfa kapma) ~ 100 IDS ile bir array() içermelidir.
Biz bir array() eklemeden önce her [name] için küçük bir düzeltme yapmak, ayrıca, şaşırtıcı olacak - "Federer, Roger" dönüştürülmesi gerekir {[(3) }] (sadece virgülden önceki kelimeyi yakalamak satırın sonuna kadar atmak).
Teşekkürler.