pdfid 介绍

这个工具不是一个PDF解析器,但它会扫描文件,以寻找某些PDF的关键词,让你打开时,以识别包含(例如)PDF文档的JavaScript或执行一个动作, PDFiD也将处理名称混淆。

我们先使用该工具来分流PDF文档,然后用PDF解析器分析可疑的文档。

这个项目的一个重要设计标准是简单,析PDF文档完全需要一个非常复杂的程序,因此它必然包含许多(安全)漏洞。为了避免被利用的风险,我决定保留这个程序非常简单(比pdf-parser.py更简单)。

资料来源:http://blog.didierstevens.com/programs/pdf-tools/
pdfid 首页
pdfid 源代码版本库

包含在pdfid里的工具

pdfid - 扫描的PDF文件的某些PDF的关键词

root@kali:~# pdfid -h
Usage: pdfid [options] [pdf-file]
Tool to test a PDF file

Options:
  --version     show program's version number and exit
  -h, --help    show this help message and exit
  -s, --scan    scan the given directory
  -a, --all     display all the names
  -e, --extra   display extra data, like dates
  -f, --force   force the scan of the file, even without proper %PDF header
  -d, --disarm  disable JavaScript and auto launch

pdfid 用法示例

root@kali:~# pdfid /usr/share/doc/texmf/fonts/lm/lm-info.pdf

PDFiD 0.0.12 /usr/share/doc/texmf/fonts/lm/lm-info.pdf
 PDF Header: %PDF-1.4
 obj                  526
 endobj               526
 stream               151
 endstream            151
 xref                   1
 trailer                1
 startxref              1
 /Page                 26
 /Encrypt               0
 /ObjStm                0
 /JS                    0
 /JavaScript            0
 /AA                    0
 /OpenAction            0
 /AcroForm              0
 /JBIG2Decode           0
 /RichMedia             0
 /Launch                0
 /EmbeddedFile          0
 /Colors > 2^24      0