pdf kullanarak PHP içerik çıkarma

2 Cevap php

Nasıl PHP kullanarak PDF belgesinden içeriği ayıklamak için bana söyleyebilir misiniz? Biçimlendirme burada karşılaştığı temel sorun im. Aynı formatta içeriği ayıklamak ve bir çevrimiçi metin editörü görüntülemek için bazı yolları vardır Yani, bana bildirin.

Teşekkürler

2 Cevap

Bildiğim kadarıyla ben gördüğünüz gibi, bu biçimlendirme korurken, anında PHP kullanarak düzenlenebilir HTML bir PDF dönüştürmek için not mümkündür. Masaüstü Tüm try, bazen daha fazla, bazen daha az güvenilir sonuçlar PDF'leri veri ayıklamak için etrafında apps vardır. Bu şu anda gerçekçi mümkün değildir ve tüm yapabileceğiniz xpdF veya diğer komut satırı araçlarını kullanarak düz metin ayıklamak olduğunu söyleyebilirim.

Bu yeni XML Tabanlı PDF formatında farklı olabilir ama gerçekten henüz bu konuda hiçbir şey bilmiyorum.

Tabii ki, beni yanlış kanıtlamak için çekinmeyin - bir çözüm olsaydı ben kendimi çok ilgi duyarım.

XPDF bakabilirsiniz

Ben bunu varsayalım

$text = shell_exec("pdftotext $pdffile");

As for displaying it in an editor? Well, which editor? To retain some type of formatting information, and assuming by web editor you mean HTML editor, you can convert it to HTML. Perhaps there are other tools available, but since i use xpdf i came across this converter that is based on xpdf.

Temel kullanım

pdftohtml -noframes -c test.pdf test.html

Favori editörü içine almak

echo file_get_contents('test.html');

PHP fonksiyonları / sınıfları içinde bir şeyler sarmak gerekebilir. Ve güvenlik önlemleri ve etajer eklemek isteyebilirsiniz.