ダークホースラジオのマイニング競馬 : 小倉大賞典2017結果

馬名結果予測指数着順指数順位人気
マルターズアポジー1171101124
ヒストリカル114115218
クラリティスカイ113112375
ロードヴァンドール11310741611
ストロングタイタン1121115101
フルーキー112114646
レッドソロモン1091117812
スピリッツミノル1081158213
コスモソーンパーク10510991416
ダコール105108101514
ダノンメジャー10511411510
ベルーフ1051141232
クランモンタナ10411113915
ケイティープライド9811114119
パドルウィール9710915137
マイネルハニー961121663

過去5年の予測推計結果から「ある程度バラつきが出るが1番人気は連対している」という傾向から広めに構えていたのが良かったです。全体では着順は綺麗には並びませんでしたが指数1位のヒストリカルから7位のクラリティスカイのワイドが拾えました。予測精度そのものを上げることが本質的な課題ですが、馬券購入時にはバラつきの癖は理解しつつ対応していこうと思います。3月に向けてモデルをさらにチューンナップしていく予定です。

ダークホースラジオのマイニング競馬 : 小倉大賞典2017予測

2017年 2月19日(日) 1回小倉4日目 16頭 [15:20発走]
【11R】  第51回小倉大賞典
4歳以上・オープン・G3(ハンデ)(国際) 芝1800m (A)

今週はフェブラリーSがありますが地方交流のデータが欠損して分析がうまくできているのかよくわからず、しばらくはダート戦は様子見したいと思います。(中央の戦績だけでも十分予測できそうな気もしています)今週は小倉大賞典にしたいと思います。

過去5年の予測です。

年度馬名着順予測順位人気
2016年アルバートドック152
ダコール236
ネオリアリズム325
2015年カレンブラックヒル163
コスモソーンパーク216
ダコール3511
2014年ラストインパクト111
カフナ268
ブレイズアトレイル354
2013年ヒットザターゲット156
ダコール212
ダローネガ3105
2012年エーシンジーライン135
スマートギア2810
コスモファントム321

予測1位は5年で3連対、1-6位くらいが馬券に絡むようです。少しバラつきが出そうなレースです。この癖を理解しつつ買いたいです。

2010年以降の小倉芝1800m出走2161頭を対象に重回帰分析でTARGET補正タイムを予測(R2=0.72)

枠番馬番馬名予測指数指数順位人気
11レッドソロモン111811
12ストロングタイタン111103
23ダノンメジャー11459
24コスモソーンパーク1091416
35クランモンタナ111913
36マイネルハニー11261
47マルターズアポジー110124
48ベルーフ11432
59パドルウィール109137
510ケイティープライド1111110
611クラリティスカイ11276
612フルーキー11445
713スピリッツミノル115214
714ヒストリカル11518
815ダコール1081515
816ロードヴァンドール1071612
年度馬場状態勝ち馬指数
2016年アルバートドック117
2015年カレンブラックヒル116
2014年ラストインパクト115
2013年ヒットザターゲット115
2012年エーシンジーライン116

ハンデ戦ですが予測上斤量は特に影響なく(むしろ重い方が有利に出るくらい)実績を軽視せずに買いなさいということのようです。ヒストリカルは2-3走前のパフォーマンスが素直に評価されています。また、以下スピリッツミノル、ベルーフ、フルーキーと後方待機組の決着を期待した算出にもなっています。ただ、指数通りに綺麗に並びそうにはないのでボックス、ワイドと手広く買って何かが最後飛んできてくれればですね。よろしくどうぞ。

ダークホースラジオのマイニング競馬 : 京都記念2017結果

馬名結果予測指数着順指数順位人気
サトノクラウン120120123
スマートレイアー1181012105
マカヒキ118125311
ミッキーロケット117115444
アングライフェン1171075810
ガリバルディ111111662
ヤマカツライデン109116738
ウインインスパイア104110876
アクションスター104111957
ショウナンバッハ1031071099

サトノクラウンの評価はドンピシャだったのですが、マカヒキが予想の下を下回るパフォーマンス。118はなかなか厳しい数字。サトノダイヤモンドの昨年秋初戦の神戸新聞杯が120、そこから菊花賞が121、有馬記念が125です。国内再始動と考えてもライバルの背中は遠くなったのか。低評価したスマートレイアーが2着に来たりなど、いい予測結果は残せませんでした。シンザン記念に続き重馬場2連敗。今後は道悪の評価の仕方を再検討したいと思います。今までは種牡馬の実績から「得意」の変数を作って組み込んだり、重馬場の過去データだけを使った予測式を立てるなどをしていたのですが、その馬自身の道悪実績を加えるなどの改良が必要そうです。データの紐づけが大変そうだけど。海外もデータカットして予測していたのですが、レーティングから推計してパフォーマンスだけは入れておいた方がいいのか(地方交流も同様)こいつは大変だ。予測上の大きな課題を一気に突き付けられたレースでした。

ダークホースラジオのマイニング競馬 : 京都記念2017予測

2017年 2月12日(日) 2回京都6日目 10頭 [15:35発走]
【11R】  第110回京都記念
4歳以上・オープン・G2(別定)(国際)[指定] 芝2200m・外 (B)

少頭数ですが重馬場、さらに前走海外が3頭と、データ分析の観点からは非常に難解なレースになりました。適性が変わるのは言うまでもなく、過去の重馬場のレース実績だけの予測式を使った方が精度が上がるはずです。ただし、分析対象のレース数が少なくなることで予測のブレも生じやすくその判断に悩みます。一方、海外のレースは日本のレースと同等基準のデータがないため、凱旋門賞や香港のレースをどう評価し、データ変換していけばいいのか、これも非常に悩ましいものです。レベルだけならレーティングから推測することもできそうですが。

というわけで結局、馬場に関しては分析対象を広げるために京都芝2400mのレース結果も含めて予測式を作りました。京都記念は近年、2016年が重、2014年が稍重で行われています。前述の芝2400mのデータも含めた予測式を過去にあてはめるとこのような結果になりました。

年度馬名着順予測順位人気
2016年サトノクラウン116
タッチングスピーチ293
アドマイヤデウス344
2014年デスペラード136
トーセンラー212
アンコイルド324

予測1位のサトノクラウン、トーセンラーが連対しているので、モデルとしてはこれで良しとします。良しとしないと話が進まない。

海外レースは、思い切って(しょうがなく)データから削除しました。過去のパフォーマンスがある程度把握できればいいのですから国内レースがあれば大丈夫、という言い訳です。残念ながら海外レースのパフォーマンスの観点は落ちてしまうのですがそれだけで評価が決まるわけではないので、データ処理の全体バランスを優先させます。よってマカヒキはダービーまでのパフォーマンスから今回の予測をします。

上記を前提とした今回の予測です。

2010年以降の京都芝2200-2400m(良馬場を除く)出走348頭を対象に重回帰分析でTARGET補正タイムを予測(R2=0.76)

枠番馬番馬名予測指数指数順位人気
11アクションスター11157
22ヤマカツライデン11634
33マカヒキ12511
44スマートレイアー101105
55ウインインスパイア110710
66サトノクラウン12023
77ショウナンバッハ10798
78アングライフェン10789
89ミッキーロケット11542
810ガリバルディ11166
年度馬場状態勝ち馬指数
2016年サトノクラウン121
2015年ラブリーデイ120
2014年デスペラード119
2013年トーセンラー119
2012年トレイルブレイザー122

はい。それでも1位はマカヒキです。125は古馬G2では飛び抜けたスコアです。レベルの高いダービーでのパフォーマンス、格下げのステップ、母父系統のこのコースと馬場への条件替わりがプラス材料です。ちなみに有馬記念のサトノダイヤモンド、キタサンブラックが125です。やはり予測上でも現役トップの評価となるようです。
少し差が開いて2位は昨年の勝ち馬サトノクラウン、120です。昨年は重馬場を突き放して121でした。これは過去10年の京都記念でも3番目の評価(1位はブエナビスタ、トレイルブレイザーの122)、今年もほぼ同等となりました。正直、算出の内訳見てもサトノクラウンのどこが特に良いというわけではないのですが悪いところもなく、今回の重馬場専用の予測式で浮上してくるということはやはりこの馬場がプラスなのでしょう。

こうなるとあまり手は広げられず、遊ぶなら3連単の3着でアクションスター、ガリバルディあたりがどこまで頑張ってくれるかなという並びです。

今回もダラダラ書いてしまいました。来月あたりから各馬の評価構造がもう少しわかりやすくなるような見せ方をしていきたいと思います。
よろしくどうぞ。

ダークホースラジオのマイニング競馬 : きさらぎ賞2017結果

馬名結果予測指数着順指数順位人気
アメリカズカップ10197146
サトノアーサー98102211
ダンビュライト9899322
プラチナヴォイス9699433
エスピリトゥオーゾ9394577
マテラレックス8389688
タガノアシュラ7397754
スズカメジャー095865

あろうことか良馬場で予測してしまったので検証外ですね。3歳戦と馬場悪化は分析データが少なくなるので課題です。

ダークホースラジオのマイニング競馬 : 東京新聞杯2017結果

馬名結果予測指数着順指数順位人気
ブラックスピネル116120113
プロディガルサン116115255
エアスピネル115119321
マイネルアウラート112117434
ストーミーシー11210751010
ヤングマンパワー112114662
ダイワリベラル109113778
ブラックムーン107116846
ロイカバード107111987
タガノブルグ1031101099

シルクロードSに続き、精度高く予測できていると思います。スローペースの分、指数の絶対値は乖離が生じてしまいましたがほぼ順番どおりです。結果は万々歳ですが予測として正しかったのか疑問に残るところもありますが(ブラックスピネルは1位予測でしたが中団やや前で計算してました)。ただ、古馬戦で開催数の多いコースは分析対象のデータも多く、信頼できる予測式になっていることが多いです。

今週は京都記念を予測します。京都2200m自体は精度高く予測できそうですが、重馬場と海外帰りのデータ処理がポイントになりそうです。

ダークホースラジオのマイニング競馬 : きさらぎ賞2017予測

2017年 2月 5日(日) 2回京都4日目 8頭 [15:35発走]
【11R】  第57回きさらぎ賞
3歳・オープン・G3(別定)(国際)(特指) 芝1800m・外 (B)

3歳限定戦は京成杯、フェアリーステークスと結果よくなかったのですが、そこから予測式も見直しましたし、過去データの少ない若駒のレースでも成果を出したいです。昨年はサトノダイヤモンドが圧勝したこのレース、今年はサトノアーサーが近い立場での参戦となります。過去の勝ち馬のスコアと比較しながら見極めていきたいと思います。

過去5年の予測と結果です。

年度馬名着順予測順位人気
2016年サトノダイヤモンド111
レプランシュ224
ロイカバード332
2015年ルージュバック131
ポルトドートウィユ212
アッシュゴールド353
2014年トーセンスターダム122
バンドワゴン211
エイシンエルヴィン336
2013年タマモベストプレイ146
マズルファイヤー235
アドマイヤドバイ313
2012年ワールドエース161
ヒストリカル254
ベールドインパクト372

昨年は1-2-3位が綺麗に並びました。少頭数かつ人気サイドで決まることが多いので当然なのですが精度は高いです。昨年のサトノダイヤモンドが105。歴代でも抜けています。その次がワールドエースの103、今年注目のサトノアーサーは102になりました。これでもルージュバックなど例年よりは高いレベルにあります。断然人気で相手は無駄に広げられないので過去の2着馬がどのスコアレベルまでなのかで判断します。過去5年、スコア98未満で2着に入った馬はいません。連下にしても99の2頭までにしたいと思います。

予測の主なポイントは、

◎過去3走のベストパフォーマンス
タンビュライト、プラチナヴォイス、アメリカズカップ

◎前走のパフォーマンス
アメリカズカップ、サトノアーサー、プラチナヴォイス

◎騎手の成績
タンビュライト、サトノアーサー、スズカメジャー

◎種牡馬のコース適性
◎母父のコース適性
◎生産牧場の成績

になります。よろしくどうぞ。

2010年以降の京都芝1800m出走2534頭を対象に重回帰分析でTARGET補正タイムを予測(R2=0.73)

枠番馬番馬名予測指数指数順位人気
11サトノアーサー10211
22マテラレックス8988
33タガノアシュラ9755
44ダンビュライト9923
55プラチナヴォイス9932
66エスピリトゥオーゾ9477
77アメリカズカップ9746
88スズカメジャー9564
年度馬場状態勝ち馬指数
2016年サトノダイヤモンド105
2015年ルージュバック101
2014年トーセンスターダム101
2013年タマモベストプレイ101
2012年ワールドエース103

ダークホースラジオのマイニング競馬 : 東京新聞杯2017予測

2017年 2月 5日(日) 1回東京4日目 10頭 [15:45発走]
【11R】  第67回東京新聞杯
4歳以上・オープン・G3(別定)(国際)[指定] 芝1600m (D)

先週のシルクロードSは精度高く予測することができました。今週は東京新聞杯、初の東京コースの予測です。頭数も少ないですし、先週同様に全着順まで結果が出るといいなと思っています。

今回は予測する前に東京芝1600mの予測算出式を使って、過去5年の東京新聞杯にタイムスリップして予測してみました。傾向や精度の参考になればなと。結果はこちらです。

年度馬名着順予測順位人気
2016年スマートレイアー125
エキストラエンド216
マイネルアウラート3811
2015年ヴァンセンヌ1113
アルフレード299
フルーキー321
2014年ホエールキャプチャ188
エキストラエンド213
クラレント345
2013年クラレント162
ダイワマッジョーレ215
トライアンフマーチ334
2012年ガルボ178
コスモセンサー214
ヒットジャポット3107

高配当が出ているようになかなか難しいレースです。紛れのある結果となっており、予測下位の馬も食い込んでいるようです。ただ、中穴人気も含む予測1位馬はこの波乱含みの中5年4連対していますので、予測1位は信頼し、あとは絶対値とレースレベルを比較しながら可能な限り広めにとってみようと思います。

それでは今年の東京新聞杯の予測です。年によりレベルのバラつきがあり、それも紛れの要因のひとつかと思われますが、今年は2頭が過去の高水準の勝ち馬118以上のスコアとなりました。2倍前後のエアスピネルの人気を考えても素直に予測指数1位から入りたいです。一方で113で勝ったヴァンセンヌの実績もありますので、115プロディガルサン、113ダイワリベラルあたりはおさえておきたいところです。

予測の主なポイントは、

◎過去3走のベストパフォーマンス
エアスピネル、ブラックスピネル、ブラックムーン、ヤングマンパワー

◎前走のパフォーマンス
エアスピネル、ブラックスピネル、マイネルアウラート

◎前走からの種牡馬適性変化
ダガノブルグ、ヤングマンパワー、プロディガルサン

◎騎手成績
◎母父のコース適性
◎前走からクラス上げ、もしくは維持

になります。よろしくどうぞ。

2010年以降の東京芝1600m出走4142頭を対象に重回帰分析でTARGET補正タイムを予測(R2=0.78)

枠番馬番馬名予測指数指数順位人気
11ダイワリベラル11378
22ブラックスピネル12013
33マイネルアウラート11735
44ストーミーシー107109
55プロディガルサン11556
66ブラックムーン11644
77エアスピネル11921
78タガノブルグ110910
89ロイカバード11187
810ヤングマンパワー11462
年度馬場状態勝ち馬指数
2016年スマートレイアー118
2015年ヴァンセンヌ113
2014年ホエールキャプチャ114
2013年クラレント117
2012年ガルボ118

ダークホースラジオのマイニング競馬 : シルクロードS2017結果

馬名結果予測指数着順指数順位人気
ダンスディレクター113107123
セイウンコウセイ113107234
セカンドテーブル111106357
ヒルノデイバロー110107448
ラインスピリット110105566
ソルヴェイグ108105672
アースソニック10810471011
ダイシンサンダー1081058910
ブラヴィッシモ1061029129
テイエムタイホー10610510812
ネロ1051091111
カオスモス9697121313
ブランボヌール9410313115

前夜にほぼ徹夜で予測モデルをチューンナップしました。その甲斐もありネロ以外は非常に精度高い予測。指数1ポイントが約1馬身換算になるのですが着差もだいたい当たりとても気持ち良くこの記事を書いています。ただ、毎度のことながら課題も残り、勝ち馬ダンスディレクターの113に対し予測では107。どうも全体的に予測がやや低めに出てしまう傾向があり要検証です。仮説としては予測式が未勝利戦から重賞まで同コースで過去出走した全馬のデータを使って作っているため、高いレベルのレースの絶対値の精度が少し低いのかもしれません。コースは同じでもクラスによって算出構造が異なる部分もあるはずなので、分析対象のクラスをある程度絞って予測を行うことも検討したいと思います。

また、レース後Twitterで「人気のソルヴェイグとブランボヌールを低評価にしたのはどういう要因が影響していたのですか?」と質問を受けました。計算式から各要素がどの程度影響していたかを使って説明してみたのですが、面白い質問だったのであらためて分析してみました。前述通り絶対値は少しズレてしまっているのですが、予測時のスコアを使って勝ち馬ダンスディレクターとの差異を分解してみます。

まずはソルヴェイグ。ダンスディレクターとは予測では2馬身~2馬身半の差があるとみていました。微差ではありますが人気を考えると買いにくいです。実際は3馬身の差がつきましたが精度としては良いでしょう。この差を重回帰分析で算出した各要素の影響度から分解していくと図のようになります。指数1ポイントが約1馬身換算です。

SnapCrab_NoName_2017-1-31_0-47-16_No-00

勝ち馬に対して特に影響の大きかったものは「母父ジャングルポケットの適性」と「久々」になります。要素によってはダンスディレクターに対して勝っている部分もあります。「キャリア」はダンスディレクターが7歳になっている分、この点ではソルヴェイグが有利でした。最終的にはすべてを合算した総合評価になるのですが、上記2要素でだいたい2馬身の差がつく計算になります。

ブランボヌールは5人気でしたが11番手評価でした。こちらは様々な要素がマイナスに働いています。

SnapCrab_NoName_2017-1-31_0-54-45_No-00

「前走のパフォーマンス」「久々」「外枠」「父ディープインパクトの適性」などです。「アルデバラン2に対してディープで1馬身損している」現実感や正解はともかく分析の切り口としては面白いと思っています。少なくとも数値の根拠がなければ間違いなく「お前は何を言ってるんだ?」となるでしょう。

このように予測値を使ってレビューしたり、予測値を実績値に変えて影響度で再按分すれば統計学的アプローチでのレース回顧もできそうです。

今はまだ実践しながら「あ、こんなこともできそう」と五月雨式に行ってブログに書いています。スタイルかたまってきたら見せ方も工夫したいと思っていますので、引き続きお付き合いいただければ嬉しいです。今週は東京新聞杯を予測していきます。よろしくどうぞ。

ダークホースラジオのマイニング競馬 : シルクロードS2017予測

2017年 1月29日(日) 2回京都2日目 13頭 [15:35発走]
【11R】  第22回シルクロードS
4歳以上・オープン・G3(ハンデ)(国際)[指定] 芝1200m・内 (B)

1月から初めてまだ数レースしか予測していませんが、ここまでの気づきを踏まえて予測に使用するデータを再構成しました。30万頭近いレース結果を使用しているので容量大きくデータすべてをアップできないのですが、こちらにサンプルを保存しておきます。このデータを使ってタイム(馬場差などを補正したTARGET発行のデータ)の予測式をつくっています。現在はシンプルにタイム順を並べるアスリート的なモデルになっていますが、今後は期待値を加味した「お得な馬」の予測もできればと思っています。

今回からは主に以下の要素を使用しています。サンプルには具体的なデータ内容がわかるようなラベルをつけていますので「ああこんなデータを使ってるんだな」というのが伝わればと思います。

競走馬の属性レース条件競争条件競争能力
性別年月キャリア前走の3角ポジション
年齢場所間隔前走逃げ
調教師の成績距離休み明け~戦目前走スロー逃げ、ハイペース逃げ
生産牧場の成績芝・ダ逃げ候補前走上り1位、3位以内経験
生産牧場の輩出レベルクラス芝・ダ変化補正タイム上昇、下降
種牡馬の成績レース種別距離変化近5走の補正タイム
種牡馬の輩出レベル馬場状態クラス変化前走勝利、2連勝、3連勝
父系統の成績騎手騎手変化前走連対、2連続連対、3連続連対
父系統の輩出レベル斤量斤量変化近3走上がり3F1位経験
母父の成績出走頭数馬番変化近3走平均補正タイム
母父の輩出レベル馬番血統適性条件変化近3走ベスト補正タイム
母父系統の成績
母父系統の輩出レベル

さて、今回の予測ですが、モデルをチューンナップしたので試し斬りを。今回の舞台、京都芝1200mの2010年-2016年の出走馬2486頭を対象にシミュレーションを行いました。過去の馬の出走時のデータを使いTARGETの補正9タイムを予測し、結果と照らし合わせたものがこちら。

SnapCrab_NoName_2017-1-29_10-20-37_No-00

概念上は斜め45度線上に乗ってればすべての馬のパフォーマンスが完璧に予測できとても素敵、馬券が外れることもない、ということになります。まだまだそこまでは難しく、前後3-4ポイント(そのまま3-4馬身に相当します)くらいのズレが発生しています。現状でも精度高いとは言えるのですが、ここをもっと縮めていくためのアプローチを試行錯誤していきたいです。また、グラフの左下に行くとややバラつきが大きいのも特徴です。左下は新馬や未勝利戦が含まれています。ここは過去成績などのデータが少なく予測が立てにくいということでしょう。基本的には1000万下(目安100あたり)以上のレースに適用する方が良さそうです。

さて、シルクロードSの予測です。
ストレイトガールが勝った年の114を除くとだいたい110前後の決着、古馬混合G3の中ではやや低い数値です。高松宮記念のステップレースとして重要な位置づけですが、このスコアは全競争との相対比較ができるものなので近年の短距離戦線のレベルをあらわしているのかもしれません。昨年の勝ち馬はダンスディレクター、今回も上位評価ですが昨年比較では枠の分もありややスコアを下げました。ということであれば同じ107のヒルノデイバロー、106のセカンドテーブルが魅力的です。

予測の主なポイントは、

◎過去3走の平均パフォーマンス
ダンスディレクター、ネロ、ソルヴェイグ

◎前走のパフォーマンス
ネロ、ダンスディレクター、セイウンコウセイ

◎母父の基本パフォーマンス
ラインスピリット、テイエムタイホー、ヒルノデイバロー

◎種牡馬のコース適性
ダンスディレクター、セカンドテーブル、テイエムタイホー

◎馬番(内枠有利)
◎前走の上がり3F(速い上がりを使っている馬不利)
◎生産牧場の成績
◎前走からクラス上げ、もしくは維持

になります。よろしくどうぞ。

2010年以降の京都芝1200m出走2486頭を対象に重回帰分析でTARGET補正タイムを予測(R2=0.74)

枠番馬番馬名予測指数指数順位人気
11ラインスピリット10566
22テイエムタイホー105810
33アースソニック1041011
44ヒルノデイバロー10748
45ソルヴェイグ10572
56ブラヴィッシモ102129
57ダンスディレクター10723
68ダイシンサンダー105912
69セカンドテーブル10657
710ネロ10911
711セイウンコウセイ10734
812ブランボヌール103115
813カオスモス971313
年度馬場状態勝ち馬指数
2016年ダンスディレクター111
2015年アンバルブライベン111
2014年ストレイトガール114
2013年ドリームバレンチノ109
2012年ロードカナロア111