pdftohtml
Convierte archivos PDF a HTML, XML e imágenes PNG. Más información: https://manned.org/pdftohtml.
- Convierte un archivo PDF en un archivo HTML:
pdftohtml ruta/al/archivo.pdf ruta/al/archivo_resultado.html
- Ignora imágenes en el archivo PDF:
pdftohtml -i ruta/al/archivo.pdf ruta/al/archivo_resultado.html
- Genera un único archivo HTML que incluye todas las páginas PDF:
pdftohtml -s ruta/al/archivo.pdf ruta/al/archivo_resultado.html
- Convierte un archivo PDF en un archivo XML:
pdftohtml -xml ruta/al/archivo.pdf ruta/al/archivo_resultado.xml