ワンライナーでテーブルをCSVに変換

papiro.hatenablog.jp

curl -s "https://www.bleague.jp/stats/?tab=1&year=2021" \
| nkf -Wwd \
| xmllint --html --xpath '//table[@id="tbl-player"]//tr' - 2> /dev/null \
| grep -e '<tr class="tips-parent">' -e '<th class="sort' -e '<td class="{sortValue:' -e '<td>[^<>]*</td>' \
| sed 's/<[^<>]*>//g' \
| tr -d ' ' \
| tr "\n" "," \
| sed 's/,順位,選手,チーム,//' \
| sed 's/,,/\n/g' \
| sed '/^$/d'

なんでかカンマだけになるどうも改行コードがだめみたい

sed 's/&#13;//g' 

が機能していないのか

genzouw.com

改行コードが違うのか動かなったので調整

改行コードCRの除去

nkf -Wwd
# 本はこっち
nkf -wLux
sed 's/\r//g'

utf-8の改行\nに変換

sed '/^$/d'

空行削除