Wkhtmltopdf - Un instrument inteligent pentru a converti pagina HTML a site-ului web în PDF în Linux


Wkhtmltopdf este un utilitar shell de linie de comandă cu sursă deschisă, simplu și foarte eficient, care permite utilizatorului să convertească orice HTML (pagină web) în >document PDF sau o imagine (jpg, png etc).

Wkhtmltopdf este scris în limbajul de programare C++ și distribuit sub GNU/GPL (Licență publică generală). Utilizează motorul de aspect de randare WebKit pentru a converti paginile HTML în documentPDF fără a pierde calitatea paginilor. Este o soluție foarte utilă și de încredere pentru crearea și stocarea instantanee a paginilor web în timp real.

Caracteristici Wkhtmltopdf

  1. Open source și cross platform.
  2. Convertiți orice pagini web HTML în fișiere PDF utilizând motorul WebKit.
  3. Opțiuni pentru adăugarea antetelor și subsolurilor
  4. Opțiune de generare a tabelului de conținut (TOC).
  5. Oferă conversii în modul lot.
  6. Suport pentru PHP sau Python prin legături la libwkhtmltox.

În acest articol vă vom arăta cum să instalați programul Wkhtmltopdf sub sistemele Linux folosind fișierele tarball sursă.

Instalați Evince (PDF Viewer)

Să instalăm programul evince (un cititor de PDF) pentru vizualizarea fișierelor PDF în sistemele Linux.

$ sudo yum install evince             [RHEL/CentOS and Fedora]
$ sudo dnf install evince             [On Fedora 22+ versions]
$ sudo apt-get install evince         [On Debian/Ubuntu systems]

Descărcați fișierul sursă Wkhtmltopdf

Descărcați fișierele sursă wkhtmltopdf pentru arhitectura dvs. Linux utilizând pagina de descărcare wkhtmltopdf.

Pe sistemul de operare Linux pe 64 de biți
$ wget https://github.com/wkhtmltopdf/wkhtmltopdf/releases/download/0.12.4/wkhtmltox-0.12.4_linux-generic-amd64.tar.xz
Pe sistemul de operare Linux pe 32 de biți
$ wget https://github.com/wkhtmltopdf/wkhtmltopdf/releases/download/0.12.4/wkhtmltox-0.12.4_linux-generic-i386.tar.xz

Instalați Wkhtmltopdf în Linux

Extrageți fișierele într-un director de lucru curent folosind următoarea comandă tar.

------ On 64-bit Linux OS ------
$ sudo tar -xvf wkhtmltox-0.12.4_linux-generic-amd64.tar.xz 

------ On 32-bit Linux OS ------
$ sudo tar -xvzf wkhtmltox-0.12.4_linux-generic-i386.tar.xz 

Instalați wkhtmltopdf sub directorul /usr/bin pentru o execuție ușoară a programului din orice cale.

$ sudo cp wkhtmltox/bin/wkhtmltopdf /usr/bin/

Cum se utilizează Wkhtmltopdf?

Aici vom vedea cum să ascundem paginile HTML la distanță în fișiere PDF, să verificăm informațiile, să vedem fișierele create folosind programul evince din GNOME Desktop.

Convertiți pagina HTML a site-ului în fișier PDF

Pentru a converti orice pagină web de site HTML în PDF, executați următorul exemplu de comandă. Va converti pagina web dată în 10-Sudo-Configurations.pdf în directorul de lucru actual.

# wkhtmltopdf https://linux-console.net/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdf
Ieșire eșantion:
Loading pages (1/6)
Counting pages (2/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done

Vizualizați fișierul PDF generat

Pentru a verifica dacă fișierul este creat, utilizați următoarea comandă.

$ file 10-Sudo-Configurations.pdf
Ieșire eșantion:
10-Sudo-Configurations.pdf: PDF document, version 1.4

Vizualizați informații despre fișierul PDF generat

Pentru a vizualiza informațiile fișierului generat, lansați următoarea comandă.

$ pdfinfo 10-Sudo-Configurations.pdf
Ieșire eșantion:
Title:          10 Useful Sudoers Configurations for Setting 'sudo' in Linux
Creator:        wkhtmltopdf 0.12.4
Producer:       Qt 4.8.7
CreationDate:   Sat Jan 28 13:02:58 2017
Tagged:         no
UserProperties: no
Suspects:       no
Form:           none
JavaScript:     no
Pages:          13
Encrypted:      no
Page size:      595 x 842 pts (A4)
Page rot:       0
File size:      697827 bytes
Optimized:      no
PDF version:    1.4

Vizualizați fișierul PDF creat

Aruncă o privire la fișierul PDF nou creat folosind programul evince de pe desktop.

$ evince 10-Sudo-Configurations.pdf
Exemplu de captură de ecran:

Arată destul de bine sub cutia mea Linux Mint 17.

Creați TOC (Tabel de conținut) al unei pagini în PDF

Pentru a crea un tabel de conținut pentru un fișier PDF, utilizați opțiunea ca toc.

$ wkhtmltopdf toc https://linux-console.net/sudoers-configurations-for-setting-sudo-in-linux/ 10-Sudo-Configurations.pdf
Ieșire eșantion:
Loading pages (1/6)
Counting pages (2/6)
Loading TOC (3/6)
Resolving links (4/6)
Loading headers and footers (5/6)
Printing pages (6/6)
Done

Pentru a verifica TOC pentru fișierul creat, utilizați din nou programul evince.

$ evince 10-Sudo-Configurations.pdf
Exemplu de captură de ecran:

Aruncă o privire la poza de mai jos. arata chiar mai bine decat cele de mai sus.

Opțiuni și utilizare Wkhtmltopdf

Pentru Wkhtmltopdf mai multe utilizări și opțiuni, utilizați următoarea comandă de ajutor. Va afișa o listă cu toate opțiunile disponibile pe care le puteți utiliza cu el.

$ wkhtmltopdf --help