Fullstops kullanarak Segment metin

1 Cevap php

I need to segment text using fullstops using PHP/Javascript.The problem is if I use "." to split text then abbreviations , date formatting (12.03.2010 ) or urls as well split-ed , which I need to prevent.There are many such possibilities , I might not be able to imagine. How to recognize that the "." is used as fullstop and nothing else ?

Ben googled zaman SRX http://www.lisa.org/fileadmin/standards/srx20.html, bu kuralları kullanarak herhangi bir opensource PHP projesi kademeli metin yaklaşık mu?

Ödenen olmadıkça ben de herhangi bir Linux tabanlı bir komut satırı yardımcı programı ile yapabilirsiniz.

Bu sorun Fullstop.We bir nokta arasındaki ayırt etmek gerekir gibi kabul edilir gibi kademeli bir nokta (.) Ile kırılıyor davalarla fiyatları (.) Ve FullStop

Kılıfları nerede. fullstops değildir:

  1. http://www.yahoo.com '> iyi bir bağlantıdır. Ben sevdim

    - only one valid fullstop
  2. Bu bir test durumdur. Bunu hiçbir geçerli noktayı deneyin sağlar

    http://www.yahoo.com '> Test amold12 @ yapılır .... - Geçerli FullStop

  3. Sayın Abc kasabasında bugün - hiçbir geçerli FullStop

  4. S. Khan yapmıştı - hiçbir geçerli noktayı
  5. ABD bir durgunluk ortaya çıkmaktadır. - Geçerli FullStop

Kod ilgili olarak gelince - I (".") Javascript text.split kullanıyorum yöntemi

Teşekkürler

1 Cevap

İnsan dili ilginç. Bazı köşe dava ile gelip ne olursa olsun kurallar size yenmek muhtemeldir. Size% 100 doğru olması ne kadar önemli? Arada tam stop eksik gerçekten önemli misiniz? Ya da gerçekten konu çok agresif bir tad olmak istiyorum. Lütfen objektif (örneğin) Yayınlanacak içinde sentance uzunluğunun bazı istatistiki anlysis ile gelip ise, ben üzerinden veya sayma altında bazı önemli olacağını sanmıyorum.

Benim önerim gibi desen aramak olacaktır

full-stop space(s) Capital letter
full-stop quote
full-stop new line

Sizin örnek metin üzerinde olduğunu çalıştırın ve anomaliler kalır ne olduğunu görmek.

Sizin en içtenlikle, David J. N. Artus. (Ben bu şekilde. Henüz tam sentance kullanımı yoktu çünkü, ve daha önceki. Ikisinden biri değil. Ama bu son. Oldu.