Ben bir dize yayıncı bilgileri ayıklamak çalışıyorum. Bu gibi çeşitli biçimlerde gelir:
John Wiley & Sons (1995), Karton Kapak, 154 sayfa
New York, Crowell [1963] viii, 373 s. illus. 20 cm.
New York: Bantam Books, c1990. xx, 444, s. : Hasta. ; 27 cm.
Garden City, New York, Doubleday, 1963. 142 s. illus. 22 cm. [1st ed.]
Ben ayıklamak istediğiniz tüm yayıncı adı, yani her şey sonra (veya [Ben, ancak bu daha önce herhangi bir karakter kapmak gerekiyordu. Göz ardı edilebilir. Ve bu örneğin üç, ben isterdim ki gerçeği ile karışık virgülden önce bilgi kapmak için, fakat örneğin iki, ben sadece köşeli ayraç önce bilgi kapmak ve mümkünse eğer virgül tutmak isterdim.
Ben ([önce her şeyi alır ve, ve ben içine örnek 3 tüm eklemek istemem beri sadece) Örnek 2 için "New York" almak gibi herhangi bir kusurlu verileri (çalışmak bir regex ile çalışmaya hazırım veri tabanı. verilerin çoğunluğu, örnek 1 ve 2 'de olduğu gibi parantez içinde tarihi vardır.
Önerileriniz için şimdiden teşekkürler!