2021-02-01から1ヶ月間の記事一覧

GASでスクレイピング

iwb.jp github.com qiita.com

GASで玉川ダムの放水情報を抽出

2021/04/18現在利用できません function kasenalarm() { var label = GmailApp.getUserLabelByName("kasenalarm") //ラベルを取得 var thds = label.getThreads(0,10) //ラベルのスレッド取得 for(var n in thds){ Utilities.sleep(1000); var thd = thds[n]…

A.I.VOICE 琴葉 茜・葵 exVOICE」収録音声一覧(PDFファイル)をCSVに変換

aivoice.jp A.I.VOICE 琴葉 茜・葵 exVOICE」収録音声一覧(PDFファイル) https://aivoice.jp/pdf/exVOICE_kotonoha.pdf tabula-javaで変換できる wget https://aivoice.jp/pdf/exVOICE_kotonoha.pdf wget https://github.com/tabulapdf/tabula-java/releas…

スクレイピング法律

topcourt-law.com

pdfplumber

import pdfplumber import pandas as pd pdf = pdfplumber.open("gaiyo2.pdf") page = pdf.pages[6] # cropで範囲指定 crop = page.within_bbox((0, 120, page.width, 700)) table_settings = { # 垂直基準 "vertical_strategy": "lines", # 水平基準 "horiz…

兵庫県のコロナ

Pandasをつかわない縛りでまだ途中 from openpyxl import load_workbook, utils import datetime import json import pathlib from statistics import mean def xlsx2table(filename, n=1): wb = load_workbook(filename=filename, data_only=True) ws = wb.…