愛媛県内の状況のPDFから検査陽性者の状況をスクレイピング3

shellで作ってみた

wget https://www-eu.apache.org/dist/pdfbox/2.0.21/pdfbox-app-2.0.21.jar -O pdfbox-app.jar
wget https://www.pref.ehime.jp/h25500/kansen/documents/kennai_link.pdf -O kennnai_link.pdf

java -jar pdfbox-app.jar ExtractText -sort -startPage 1 -endPage 1 -console kennnai_link.pdf | grep '合 計' | awk '{print $2, $3, $4}' | grep -oP '[0-9,]+' > data.tsv
java -jar pdfbox-app.jar ExtractText -sort -startPage 1 -endPage 2 -console kennnai_link.pdf | grep -oP "([0-9,]+)人" | sed -r 's/([0-9,]+)人/\1/g' >> data.tsv