競馬について徒然と

競馬について適当に書きます. ちょっとtech系風味も入れて.

競馬道オンラインのデータをCSVに変換する

競馬道オンラインで提供されているデータはKD3というフォーマットになっている。仕様書はここ。

で、とりま汎用的なフォーマット、CSVあたりに変換したほうがいろいろ便利だよね、ということでツールも提供されているのだけど、全部Windowsなんだよね・・・

https://www.keibado.ne.jp/soft/soft-list.html

データ解析や機械学習に使うなら自動化できるような形にしたい。ということでRubyで書いてみた。とりま成績データ(kol_sei2.kd3)の場合。

ShiftJIS日本語全角込の固定長データとか普段扱うことがほとんどなくて、最初PythonPerlで書いてみたのだけどうまく書けず、Rubyで書いたらサクッとできた。文字コード周りはホント難しい。

多分他のデータも同じようにできると思う。ただ可変長になるデータもあるっぽいので多少調整は必要かも。全部見てないから知らんけど。