Hoe een DOC-bestand te lezen met behulp van PHP

PHP-programmeurs zijn vaak op zoek naar manieren om de functionaliteit van deze taal buiten zijn comfortzone uit te breiden. PHP wordt meestal gebruikt op Linux-besturingssystemen, maar de bezoekers van PHP-websites werken meestal op Windows- of Macintosh-systemen. Een website die is ontworpen om een ​​Microsoft Word-bestand van deze gebruikers te uploaden, moet mogelijk de inhoud van dit bestand extraheren en de tekst e-mailen of verwerken met behulp van PHP-algoritmen. Maar Microsoft Word-bestanden, die eindigen op de DOC-extensie, zijn niet native voor Linux of PHP. Het overbruggen van deze twee computeromgevingen is met enige voorbereiding mogelijk.

Stap 1

Controleer bij uw hostprovider of er PHP-toegang beschikbaar is voor uw website. De meeste servers ondersteunen PHP, maar af en toe vereist deze service een accountupgrade. U kunt een DOC-bestand niet lezen met PHP zonder toegang tot de compiler.

Stap 2

Download het hulpprogramma Antiword MS Word-documentlezer (zie referenties). Dit open-sourceprogramma bevat programmeermateriaal dat PHP uitbreidt voor DOC-conversie.

Stap 3

Pak het Antiword-archief uit om de inhoud uit te pakken.

Stap 4

Upload de volledige Antiword-bestandsbibliotheek naar de webserver. Plaats de bestanden in de map "bin" van het hostaccount. Deze map is een algemene opslagplaats voor hulpprogramma's en andere binaire bewerkingen die gebruikers van webservers vaak moeten misbruiken.

Stap 5

Roep het Antiword-programma aan in een PHP-script dat is ontworpen om een ​​DOC Microsoft Word-document te lezen. De opdracht wordt geïmplementeerd met behulp van een enkele functie. Typ "$content = shell_exec('/usr/local/bin/antiword '.$bestandsnaam);" waarbij "$filename" gelijk is aan de volledige bestandsnaam van het DOC-document. De inhoud van het DOC-bestand wordt ingelezen in de variabele "$content". Deze variabelenamen, beginnend met het "$"-symbool, kunnen worden aangepast.

Verwerk de variabele "$content" naar wens om de inhoud van het DOC-bestand te manipuleren. Zodra de DOC door PHP is gelezen, is de volledige tekst van het bestand beschikbaar voor elke vorm van verdere activiteit. De inhoud kan bijvoorbeeld worden gemaild of opgeslagen in een database.