pdftohtml
Convierte archivos PDF a HTML, XML e imágenes PNG. Más información: https://manned.org/pdftohtml.
- Convierte un archivo PDF en un archivo HTML:
pdftohtml
ruta/al/archivo.pdf
ruta/al/archivo_resultado.html
- Ignora imágenes en el archivo PDF:
pdftohtml -i
ruta/al/archivo.pdf
ruta/al/archivo_resultado.html
- Genera un único archivo HTML que incluye todas las páginas PDF:
pdftohtml -s
ruta/al/archivo.pdf
ruta/al/archivo_resultado.html
- Convierte un archivo PDF en un archivo XML:
pdftohtml -xml
ruta/al/archivo.pdf
ruta/al/archivo_resultado.xml