Ben XML düz metin verileri dönüştürmek için bir ayrıştırıcı oluşturmak için çalışıyoruz amatör PHP / Javascript programcısı yaşıyorum.
Düz metin düzeni belgeden belgeye değişir ama içerik o temsil sadece nasıl olduğunu, her aynıdır.
Ben yarım verileri dönüştürmek için özel bir çözümleyici yazdım, ve ben bu konuda hakkını elinden gidiyorum olmadığını bilmek istersiniz?
Ben denemek ve recursive asıllı ayrıştırıcıların ve LALR ayrıştırıcıları hakkında okudum ama kafamda gitmek gibi görünüyor, bu yüzden bunu yaparken benim kendi yöntemi ile geliyor benim vakit ediyorsam ben merak ediyorum?
Ben (desen saklanan bilgilere göre) attı önemli unsurlardan, her tokenised ve her desen frekansını sayımı var.
Skoru ile (Yakalanan bilgi her bit için 1,2,4,8 vb ekleyerek yapılır) bu bilginin düzeni itibariyle potansiyel yinelenen desenler / bilgi (ayıklamak mümkün olan bir set biçiminde olması ve boyunca tekrarlanan olacak şifresiz) ve frekans herhangi bir anlam ifade etmek olası değildir bu kalıpları atmak mümkündür.
Bu gitmek için doğru yolu var mı ya da ben bir idame tehlike oluşturma?
Ben arada PHP kullanıyorum. Özür dilemek bu bir frivilous soru ise!
Shaun