Nasıl metin man sayfalarını tarama için bir web arayüzü tasarlıyorsunuz?

2 Cevap php

Bana, sıralamak göz sağlayan bir web uygulaması tasarlamak istiyorum, ve man sayfaları bir koleksiyon için çeşitli özelliklerini (örneğin, başlık, etiket, açıklama) görüntüler.

Özellikle, bu R documentation files bir SVN deposu birkaç kişi tarafından tutulan veri setleri, bir koleksiyona ev sahipliği bir R paketi içinde bulunmaktadır. Bu dosyaların formatı LaTeX gibi, ama farklı. Rd, olduğunu.

R html ya da pdf bu adam sayfaları dönüştürmek için fonksiyonları vardır, ama kullanıcıların belirli bir anahtar kelime üzerine tıklayarak, ve bir liste (ve kısa alıntılar) getirmek için olanak sağlayan bir web arayüzü var edebilmek istiyorum bu adam sayfaları için \ anahtar kelime {} etiketi içinde bu anahtar kelime var.

Ayrıca, oluşturulan html biraz çirkin ve benim kendi CSS sağlamak mümkün olmak istiyorum.

Bir bariz seçenek MySQL gibi bir veritabanı içine arzu ve sorgular çalıştırmak ve uygun veri almak benim site tasarımı tüm meta yüklemektir.

Ben gelecek bakıcılarına için bakım en aza indirmek için bu önlemek istiyorum. Dosya sayısı azdır (<500) ve veri miktarı (dosya başına yalnızca birkaç yüz hatları) küçük.

Benim geçerli eğik bir özeti json dosyası içine her dosyadan istenen meta çeker bir komut dosyası var ve akımına uygun niteliklere sahip olanlar öğeleri arıyor dizi aracılığıyla çözmek, PHP bu summary.json dosyası yüklemek ve döngü için Sorgu (Keyword1 VE Sözcük2 örn. tüm dokümanlar).

Aşağıdaki bu yönde başlangıç ​​edildi ...

$contents=file_get_contents("summary.json");
$c=json_decode($contents,true);
foreach ($c as $ind=>$val ) { .... etc

Başka bir fikir bu. Rd dosyaları xml dönüştürmek olacak bir senaryo yazmak oldu. Bu durumda, xml dosyaları küçük bir koleksiyon sıralamak ve kolay arama yaptığınız hafif çerçeveler vardır?

Ben içine kazmak zamanınız varsa xquery overkill veya eğer ben emin değilim ...

Ben tüm AJAX Temptations ile çok-çok-seçenekleri-sendromu muzdarip düşünüyorum. Herhangi bir yardım büyük beğeni topluyor.

Ben bir süper basit bir çözüm arıyorum. Nasıl orada biraz sizin bu yaklaşım olabilir?

2 Cevap

My approach would be parsing the keywords (from your description i assume they have a special notation to distinguish them from normal words/text) from the files and storing this data as searchindex somewhere. Does not have to be mySQL, sqlite would surely be enough for your project. A search would then be very simple.

Ayrıştırma dosyaları subversion deposundan post-taahhüt-kanca olarak otomatik olabilir.

Why don't you create table SUMMARIES with column for each of summary's fields? Then you could index that with full-text index, assigning different weight to each field.

Sen MySQL gerekmez, sen (FTS3) yerleşik Google'ın tam metin indeksleme vardır SQLite kullanabilirsiniz