2017-01-01から1年間の記事一覧

インフルエンザによる学級閉鎖等の状況

import requests from bs4 import BeautifulSoup url = 'http://www.city.imabari.ehime.jp/gakukyou/info_influenza/' r = requests.get(url) # エラーがないか確認する if r.status_code == requests.codes.ok: soup = BeautifulSoup(r.content, 'html.par…

【解決】カスペルスキー12月のWindows Updateするとエラーメッセージ

以下は10:00以降にカスペルスキーをアップデートした場合は大丈夫そうです 電話で問い合わせしたがどうも殺到しているようで受付のみ 後日メールにて返答あり カスペルスキーとWindowsDefenderも無効になるので とりあえずカスペルスキーをアンインストール…

pythonスクレイピング関連記事

adventar.org qiita.com vaaaaaanquish.hatenablog.com orangain.hatenablog.com qiita.com qiita.com blog.mursts.jp www.yoheim.net qiita.com dev.classmethod.jp dev.classmethod.jp www.mediaplex.co.jp kiito.hatenablog.com kiito.hatenablog.com

Pythonで総選挙データのスクレイピング

データのスクレイピング AKB48総選挙データのスクレイピング import csv from urllib.request import urlopen from bs4 import BeautifulSoup url = 'http://www.akb48.co.jp/sousenkyo_45th/result.php' html = urlopen(url).read() soup = BeautifulSoup(h…

Pythonのマルチスレッドで同じものを含む順列

import concurrent.futures def permutations(head, rest): if len(rest) == 0: return [head] else: res = [] # set(集合)型で重複を削除、ソート data = sorted(set(rest)) for i in data: #配列の複製 restx = rest[:] #指定データ削除 restx.remove(i)…

mineoのパケットギフトに変換

パケットギフト自動取得したい driver.find_element_by_name("nablarch_form1_1").click() ここでエラー、一回だけログイン通ったけど次から通らない エラー後コマンドで打つとログイン通るんだけどなんで? from selenium import webdriver from selenium.w…

Python3 Webスクレイピングの実践入門

imabari.hateblo.jp qiita.com 「Python Webスクレイピング 実践入門」の 「1時間ごとに日本経済新聞にアクセスを行いその時の日経平均株価をcsvに記録する」を 定時実行を「apscheduler」に「select_one」でCSSセレクタで取得に変更しました 基本 imabari.h…

Pythonログ

speakerdeck.com

蒼社川の水位をスクレイピング

import datetime import requests from bs4 import BeautifulSoup def scraping(): url = 'http://183.176.244.72/cgi/050_HQ_100_03.cgi?GID=050_HQ_100&UI=U777&SI=00000&DT=000000000000&DBDT=0000000000&MNU=1&DTO=-1&DN=0972900400025&KTM=3&GHK=3&YSK=…

PythonでRSSの新着チェック(feedparser/sqlite3)

rss_cron.pyを実行すると5分おきにrss_print.pyが実行される。 rss_cron.py from apscheduler.schedulers.blocking import BlockingScheduler import os sched = BlockingScheduler() @sched.scheduled_job('interval', minutes=5) def timed_job(): os.syst…

ウイルスバスター クラウドの Windows 10 Fall Creators Updateでブルースクリーン

ウイルスバスター クラウドの Windows 10 Fall Creators Update (RS3) の対応状況について | サポート Q&A:トレンドマイクロ ウイルスバスター クラウドが入っている状態でKB4043961をインストールするとpage_fault_in_nonpaged_areaでブルースクリーン KB4…

ubuntuのPDFBOXでPNG変換するとファイルサイズが大きい

PDFファイル http://www.city.imabari.ehime.jp/kouhou/koho/201710/kyukyu.pdf PDFのサイズは927,664バイト PDFBOX http://ftp.kddilabs.jp/infosystems/apache/pdfbox/2.0.7/pdfbox-app-2.0.7.jar 最新の2.07 コマンド # PNG java -jar pdfbox.jar PDFToIm…

Twitterでマルチメディア投稿

import datetime import os import shlex import subprocess import requests import twitter # 今月 now = datetime.datetime.now() # 来月 # now = datetime.datetime.now() + datetime.timedelta(days=28) # URL作成 url = 'http://www.city.imabari.ehim…

Raspbian stretchにphantomjsをインストール

makezine.jp # ユーザー追加・pi削除 sudo /usr/sbin/useradd --groups sudo -m username sudo passwd username sudo passwd root sudo passwd --lock pi # phantomjsをインストール wget https://github.com/piksel/phantomjs-raspberrypi/releases/downloa…

カスペルスキー セキュリティ 2018

https://support.kaspersky.co.jp/12605?cid=dl_klsupport 最新のカスペルスキー セキュリティ 2018 に含まれる各プログラムのダウンロード提供及びライセンスの販売は、2017年10月12日10:00頃の開始を予定しています。

Tomarigi(校正・推敲支援ツール)のインストール

Tomarigi http://www.pawel.jp/outline_of_tools/tomarigi/ ダウンロード http://www.pawel.jp/download/tomarigi/ MeCab http://taku910.github.io/mecab/#download ダウンロード https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7UDg1QnF5WHJ…

Cloud9にPython3.6をインストール

curl https://gist.githubusercontent.com/ryanpcmcquen/7ef4bf8dea788f73d82397c2b9d1d796/raw/udev_dpkg_workaround.sh | bash sudo apt-get update sudo apt-get install python3.6 sudo update-alternatives --install /usr/bin/python3 python3 /usr/bi…

Heroku

フリー 無料アカウントは550時間 アドオンを使えないので定時実行、スリープ等できない。 APSchedulerで定時実行できるがバックグラウンドで常時動いているので時間がなくなる。 クレジットカードを登録すると 450時間プラスで合計1000時間利用可能 アドオン…

HerokuでChrome Headlessでスクレイピング

git init git add . git commit -m "my first commit" heroku create xxxxx git push heroku master Chromeとchromedriverをbuildpacksに追加 heroku create --buildpack https://github.com/heroku/heroku-buildpack-python.git heroku buildpacks:set http…

Ubuntu設定からHerokuでPythonのTwitter Bot作成

# heroku cli インストール wget -qO- https://cli-assets.heroku.com/install-ubuntu.sh | sh # python3.6インストール sudo add-apt-repository ppa:fkrull/deadsnakes sudo apt update sudo apt install python3.6 wget https://bootstrap.pypa.io/ez_set…

Githubでアカウント作りました

github.com

bottleとfeedgeneratorでRSSを作成

sudo -H pip3 install bottle sudo -H pip3 install feedgenerator sudo -H pip3 install pytz import datetime import pytz import os import re from urllib.parse import urljoin from urllib.request import urlopen from bs4 import BeautifulSoup impo…

feedgeneratorでRSS生成

import feedgenerator feed = feedgenerator.Rss201rev2Feed( title="Poynter E-Media Tidbits", link="http://www.poynter.org/column.asp?id=31", description= "A group Weblog by the sharpest minds in online media/journalism/publishing.", language…

今治市の避難準備情報、避難勧告、避難指示情報と避難所情報をスクレイピング

import datetime import re from urllib.parse import urljoin from urllib.request import urlopen from bs4 import BeautifulSoup def get_refuge(url): html = urlopen(url).read() soup = BeautifulSoup(html, 'html.parser') title = soup.select_one('…

玉川ダムの貯水率をスクレイピング

2021/04/18現在利用できません from urllib.request import urlopen from bs4 import BeautifulSoup import datetime import csv # GRP = USR004:玉川ダム、USR005:台ダム grp = 'USR004' # KTM = 1:1時間毎、2:30分毎、3:10分毎 ktm = 1 # 現在の時刻の8分…

PDFの表をテキスト変換

PDF

オンライン smallpdf smallpdf.com 1時間に2回無料で利用 セキュリティ関係ない書類であればこれでいいかも オフライン soft text table xml camelot × ◎ × pdfplumber 〇 〇 × Poppler 〇 △ 〇 tabula × 〇 × PDFBOX ◎ × × Apache Tika 〇 × × Word 〇 △ × …

PDFminer.sixでテキストが取得できない

PDF

Pythonクローリング&スクレイピング ―データ収集・解析のための実践開発ガイド― サポートページ:Pythonクローリング&スクレイピング ―データ収集・解析のための実践開発ガイド―:|技術評論社 5-8_pdf\print_pdf_textboxes.pyのサンプルコードを試してい…

厚生労働省のブラック企業リストをTSV変換

PDF

最新 imabari.hateblo.jp tabula a244.hateblo.jp tabulaでブラウザで範囲を指定してPDFからTSV変換できます。 tabula.technology コマンド用 github.com tabula-1.0.1-jar-with-dependencies.jarをダウンロードして java -jar .\tabula-1.0.1-jar-with-depe…

スプラトゥーン2

imabari.hateblo.jp 7/21 バッグとコントローラーは届いた 7/22 本体が届くみたい www.nintendo.co.jp アカウントは作成済みだけどSwitchがないので先に進めない www.ikaclo.jp 有線LANも購入済み ロジテック 有線LANアダプタ Nintendo Switch 動作確認済 US…

auの新プラン

www.au.com auの新プランって割引した金額から1000円引きが適正価格だよな ランクが来たら通知確認があって次まで使えるならいいけど入る価値ないよな。 アップグレードプログラムEXの設定みると機種代金の半額以下が仕入れ価格で +1万円払って2年と2ヵ月後…