tabula
PDF 파일에서 테이블을 추출. 더 많은 정보: https://tabula.technology.
- PDF에서 모든 테이블을 CSV 파일로 추출:
tabula -o
파일.csv
파일.pdf
- PDF에서 모든 테이블을 JSON 파일로 추출:
tabula --format JSON -o
파일.json
파일.pdf
- PDF의 1, 2, 3, 6 페이지에서 테이블 추출:
tabula --pages
1-3,6
파일.pdf
- PDF의 1 페이지에서 테이블을 추출하며, 분석할 페이지의 부분을 추측:
tabula --guess --pages
1
파일.pdf
- 셀 경계를 결정하기 위해 줄을 사용하여 PDF에서 모든 테이블 추출:
tabula --spreadsheet
파일.pdf
- 셀 경계를 결정하기 위해 빈 공간을 사용하여 PDF에서 모든 테이블 추출:
tabula --no-spreadsheet
파일.pdf