#057「サトノダイヤモンドさん凱旋門賞直前独占インタビュー(仮)」


前哨戦のフォワ賞、日本の期待を背に出走したサトノダイヤモンドさんはまさかの4着。最大目標、日本の悲願である凱旋門賞に暗雲が立ち込めています。
失意のどん底であろうサトノダイヤモンドさん、Twitterの更新も止まり音信不通となっています。我々の前に姿を見せてくれるのか、あの輝きを取り戻すことはできるのか。
甘く切ない日本の競馬、楽しんでいただければと思います。よろしくどうぞ。

#056「サトノダイヤモンドさんフォワ賞直前独占インタビュー&POG序盤戦振り返り」

いよいよ秋競馬!
今回はこれから世界と日本の競馬を共に席巻するであろう、二人のホースマンをお呼びしています。ダークホースラジオ独占インタビューです。よろしくどうぞ。

統計学でダビスタっぽい種牡馬パラメータを作ってみた

こんにちは。人工知能による競馬予測がひと段落ついたこともあり、今回はその中に学習させているデータを使って種牡馬の特徴を定量化してみました。で、どうせならダビスタっぽいものにしてみようかと。計算自体は四分位範囲とか標準偏差とか偏差値とか統計学入門のシンプルなものですが定義を考えるところが難しいですね。定義を教えてくれるような教科書はないので。その分、自分で考えてやってみて肌感覚と合うものができた時にはうっとりしてしまいます。

レースの合間の時間でダラダラ作ったものですが、それなりにいい感じのものができたと思います。今回は以下の定義と計算方法で作ってみました。

◇距離適性
産駒の連対距離の25%~99%地点の範囲。長距離レースの施行数が少ないので四分位範囲より広げました

◇成長
産駒の3歳と古馬時点の標準化した走破タイムの差の分布。偏差値60以上を晩成、35未満を早熟

◇ダート
産駒のダートと芝の標準化した走破タイムの差の分布。偏差値55以上を◎、35未満を△

◇体質
産駒の古馬時点の平均出走回数の分布。偏差値55以上を◎、35未満を△

◇実績
産駒の標準化した走破タイムの99%地点(上位クラスの産駒のレベル)の分布。偏差値55以上を◎、35未満を△

◇底力
産駒の標準化した走破タイムの平均(産駒全体のレベル)の分布。偏差値55以上を◎、35未満を△

◇安定
産駒の標準化した走破タイムの標準偏差(産駒のレベルのばらつき)の分布。偏差値55以上を◎、35未満を△

◇気性
気性悪い≒極端な位置取りになる、で、その出現率から求めようと思いましたが、結果がフィットせずこれはあきらめました。数字から気性を出すのは難しい…

結果はこんな感じです。

ダビスタっぽい種牡馬パラメータ_2014-2017

出典:2014年~2017年6月18日までのJRA平地競争 出走回数500以上の種牡馬を対象(TARGETより算出)

これは「馬券の参考に」というよりも、普段は予想に使うような競馬データを使って馬券以外の楽しみ方ができないかなという試みでした。競馬ゲームや種牡馬関連書籍でも種牡馬の特徴をパラメータ化しているもの、たくさんありますが、どのような計算や根拠で算出しているかはわかりません。識者達による議論で決めているかもしれませんが、こんな感じでやっているのかもしれませんね。今回は自分の予想用のデータの範囲で作ってみましたが、統計学を使った種牡馬評価は「瞬発力」や「パワー」など、まだまだ色々なアプローチや見せ方がありそうです。