Basit bir metin dosyası tabanlı arama motoru oluşturma

0 Cevap

Ben (PHP kullanarak) asap basit bir metin dosyası tabanlı arama motoru oluşturmak gerekiyor! Temelde her belgede görünür kaç kez birlikte kalan her yararlı kelimeyi, bir dizindeki dosyaları okumak durdurmak ve gereksiz kelime, dizini kaldırmak için vardır.

Bunun için sahte kod sanırım:

for each file in directory:
    read in contents,
    compare to stop words,
    add each remaining word to array,
    count how many times that word appears in document,
    add that number to the array,
    add the id/name of the file to the array,

Ayrıca sürece ben bu diziden dosya kimliği almak ve daha sonra içindeki kelimeleri saymak gibi sonradan yapılabilir tahmin im bütün dosyasına kelimelerin toplam tutarı (yararsız çıkarıldıktan sonra sanırım), saymak gerekir .... ?

Herkes yardım, belki bir iskelet yapı sağlayabilir? Ben gerek bir ana bit her kelime belgede görünür sayısını alma ve dizin dizisine ekleyerek olduğunu yardım düşünüyorum ...

Teşekkürler

0 Cevap