pup

명령줄 HTML 파싱 도구. 더 많은 정보: https://github.com/ericchiang/pup.

  • 원시 HTML 파일을 정리되고 들여쓰기된 색상 형식으로 변환:

cat index.html | pup --color

  • 요소 태그 이름으로 HTML 필터링:

cat index.html | pup '태그'

  • ID로 HTML 필터링:

cat index.html | pup 'div#아이디'

  • 속성 값으로 HTML 필터링:

cat index.html | pup 'input[type="text"]'

  • 필터링된 HTML 요소와 그 자식 요소의 모든 텍스트 출력:

cat index.html | pup 'div text{}'

  • HTML을 JSON으로 출력:

cat index.html | pup 'div json{}'