PDFからテキスト抽出

Apache PDFBox | A Java PDF Library

Apache PDFBox | Downloads
pdfbox-app-1.8.9.jarをダウンロード

Apache PDFBox | Command Line Tools

java -jar pdfbox-app-1.8.9.jar ExtractText -encoding UTF-8 <inputfile>