4列目以降をCSVにする雑なワンライナーです、、、 pic.twitter.com/xJoilFDsae
— ぱぴろんちゃん😱 (@papiron) 2022年8月8日
curl -s "https://www.bleague.jp/stats/?tab=1&year=2021" \ | nkf -Wwd \ | xmllint --html --xpath '//table[@id="tbl-player"]//tr' - 2> /dev/null \ | grep -e '<tr class="tips-parent">' -e '<th class="sort' -e '<td class="{sortValue:' -e '<td>[^<>]*</td>' \ | sed 's/<[^<>]*>//g' \ | tr -d ' ' \ | tr "\n" "," \ | sed 's/,順位,選手,チーム,//' \ | sed 's/,,/\n/g' \ | sed '/^$/d'
なんでかカンマだけになるどうも改行コードがだめみたい
sed 's/ //g'
が機能していないのか
改行コードが違うのか動かなったので調整
改行コードCRの除去
nkf -Wwd # 本はこっち nkf -wLux sed 's/\r//g'
utf-8の改行\nに変換
sed '/^$/d'
空行削除