Birden fazla metin dosyaları bir e-posta adresi nasıl ayıklanır

2 Cevap

Ben için gönderenin adresini çıkarmak istiyorsanız yaklaşık 96K metin e-postalar var. Ben bunun için domdoc kullanabilirsiniz ama beni başlamak için birine ihtiyacım inanıyoruz. Birisi Bunu yapmanın daha iyi bir yolu olup olmadığını lütfen bildiriniz miyim?

Thanks, Jim

2 Cevap

Daha sonra, (örneğin) e-posta / dizinine dosya (lar) kopyalamak, dosyaların düz metin çeşit vardır Sağlanan ... PHP bunu yapmak için hiçbir neden görmüyorum

cat * | grep "From: " | egrep -oi ‘\b[A-Za-z0-9._%-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}’ | sort | uniq > mail.list

Tabii ki have ardından PHP bunu eğer

  1. Bir dizine dosyaları / postaları kopyalayın
  2. readdir() ile dosyaların bir listesini alın
  3. Dosyasını okuyun (lar)
  4. Ayrı bir dize gelen başlığını bölmek
  5. Bir e-posta adresini bulmak ve $ email_arr koymak için bu dize üzerinde preg_match () yapmak
  6. Bittiğinde, $ email_arr üzerine () array_unique yok.

Bazı şeklinde bir düzenli ifade kullanarak bunu yapmak için en iyi yol olacaktır. Eğer dosyaları metin e-postaları kaydetmek Eğer, düzenli ifade tabanlı e-posta adreslerini aramak için TextPad gibi bir şey kullanabilirsiniz.

Sen online e-posta adresleri için normal ifadeler bulmak mümkün olmalıdır.