Ben sayfanın html kaynağında aşağıdaki etiketleri + içeriği yakalamak gerekiyor:
<li class="someClass someClass2">
... some html code ...
</li>
Ben düzenli ifadelere çok iyi değilim, bu yüzden de iyi bir öğretici link içeren yorumlar takdir edeceksiniz. I http://www.regular-expressions.info/ kontrol ettik, ama orada açıklamalar ile çok mutlu değilim.
Ben yukarıdaki sitede bulunan bu ne gibi smt edildi:
<li\b[^>]*>(.*?)</li>
Bu ne istediğiniz değil tüm <li>
etiketleri, eşleşir. Ben onunla düşünsen çalıştı ve bu bir test
<li class="someClass someClass[1-9]{1,1}[0-9]*">(.*?)</li>
Ne yazık ki, bu bir de iş yapmaz. İkinci sınıf adı biçiminde someClassX, burada X, dan {1, 2, ...} (iyi, belli ki, o :) doğal sayılar bir dizi değil) olduğunu
All I get from this regexp is "no matches". I'm using Ubuntu, Kodos tool.
Ne daha iç karartıcı bu Regexp olmasıdır:
<li class="someClass someClass[1-9]{1,1}[0-9]*">
aslında yeni satır karakteri tarafından "deli" alır gibi eğer, açılış <li>
etiketleri, ama hiçbir şey daha yakalar.
Ben hala google bir çözüm arıyorum ve buldum ben burada onu göndeririz, ama ben de gerçekten bazı yararlı giriş seviniriz :)
Thx