亀谷敬正 オフィシャル競馬サロン
  • TOP
  • 会員ログイン
  • マイページ
  • 入会案内
  • Q&A
  • お問い合せ
競馬AIで勝つ/城崎哲 12/01 (水)

【無料公開】『未来がぼんやり見える』赤兎馬の“着順確率AI”と“高期待値厳選馬”(3)/競馬AIで勝つ


当連載は競馬AIの作者を、単行本『AI競馬 人工知能は馬券を制することができるか?』の著者・城崎哲氏と元『競馬王』編集長・柿原氏がインタビューし、城崎氏が対談形式にまとめたものです。

なお、インタビューに登場する赤兎馬氏のAIコンテンツは『競馬放送局』にて公開中です。



ディープラーニングの最新のライブラリを使って大幅な成績向上に成功した赤兎馬だが、単行本を読み直すと、1年半前に思い描いていた青写真をそのまま実行したのだとわかる。さすが工学系の秀才!

その一方で、さまざまな試行錯誤を経て、競馬を始めた当初に作った指数系の特徴量に原点回帰していた。


指数系の特徴量に部分的に回帰する

城崎(以下、J):「使っている特徴量は以前から大きく変わりましたか?」

赤兎馬(以下、赤):「中心は以前からあまり変わってないです。いろいろ新しい特徴量を入れてみたりもしましたけど、目に見えるような効果はありませんでした。結局、昔作った特徴量で学習させたものがいちばん成績いいことがわかって……」

J:「昔作った特徴量というと?」

赤:「競馬を初めたばかりの頃に作ったスピード指数みたいなものです。それを使った従来型の指数も最近調子いいし、時計系の指数の有効性にあらためて気づきました」

J:「といってもスピード指数だけで勝っている人はいないといいますが……?」

赤:「ただ最近、馬の個々の数値に加えて、そのレースの特徴を表すような特徴量を追加しました」

柿原(以下、K):「なんかそれ面白そうですね」


どう作れば“未来がぼんやり見えるような特徴量”になるか?

赤:「基本ぼくはデータを入力するとき、馬1頭1頭で学習させてるんですけど、でも、実際の競馬って複数の馬が競走した結果じゃないですか。そこで、レースに出走する他の馬の情報ができるだけ入るような特徴量を工夫するようにしています。

たとえば、4コーナー通過順位の平均が5番手以内の馬が何頭いるかとか、脚質の構成とか。そういう、レース全体がぼんやり見えるような特徴量をできるだけ考えるようにしています」

K:「4コーナー5番手以内っていうのは、過去のレースでそうだった馬がどれくらいいるか……みたいなことですか?」

赤:「そうです。要するに出馬表の脚質構成の図みたいなものを特徴量にして入れているイメージですね。また、レースという相手関係の中でどう走るかが重要だと考えると、指数も絶対値ではなく相対値として見るほうが意味をもたせやすいことになります。

なので、最大指数の馬とのギャップがいくらかとか、指数の平均からのギャップはいくらかとか、指数のレース内偏差値はどうかとか、そういうレース内の自分の立場、立ち位置を相対的に見れるような特徴量を取り入れています」

K:「これから行われるレースがどういうレースになるかを予測しようとしているわけですね」

赤:「さまざまな方向から相手関係を見ていくことで、レースのおおまかな未来図が垣間見れるかもしれないと期待しているわけです。たとえば逃げ馬が多いレースで、今の自分の指数だったらどうなるか、みたいに予測してくれるんじゃないかと思います」

K:「それを、じゃあ後はディープラーニングさんお願いします、というふうに渡すわけですね?」


CNNを使わなくても相手関係は見れる

J:「どうしてCNN(※1)でやらないんですか?」

赤:「CNNは使ってないですね。競馬のデータを画像系に近いやり方に落としてる人もいるようですけど、ぼくはテーブル形式が基本の入力で、全結合でやってます」

J:「DNN(※2)ってやつですよね」

赤:「そうです。もちろんCNNを検討してみたことはあるんですが、相手関係を含めてCNNで真正直に学習させようとするとめちゃくちゃデータが増えるんですね。

やり方にもよりますが、今回の予測対象の馬はこの馬で相手はこの馬とこの馬……とやっていくのであれば、1レースに18頭出ていたら18頭×17頭分の予測対象データが要ります。他にも馬柱全体を入力としてそのレースの勝ち馬を予測するような方法も考えられますが、出走頭数にばらつきがあるので工夫が必要です。

それにCNNの畳み込みって、隣接した複数の特徴量をまとめてピってくっつけるイメージなんですけど、馬番、距離、トラックみたいな特徴量をくっつける意味があるかどうか。だからCNNでやる代わりに、レースの他の出走馬の情報ができるだけ入るような特徴量を作って代用としているわけです」

※次回(12/8更新)に続く


(※1)CNN
(Convolutional Neural Network 畳み込みニューラルネットワーク)
二次元のデータを取り扱うためのディープラーニング技術で、主に画像処理に使われる。ネットワーク内部に畳み込みとプーリングの層を持つという特徴がある。

(※2)DNN
(Deep Neural Network ディープニューラルネットワーク)
従来のニューラルネットワークでは、基本的に、1つの入力層、1つの隠れ層、1つの出力層、の3層で構成されていた。それに対して4層以上に層を深くしたものをディープラーニングまたはDNNと呼ぶ。したがってCNNやRNNもDNNに含まれるが、シンプルな初期型の方法をDNNと呼んで、とくに区別することがある。


▼赤兎馬プロフィール
2015年東京大学大学院情報理工学系研究科修了。2017年夏の競馬観戦をきっかけに競馬にのめり込む。2017年冬より独自指数の開発をはじめ、その後着順予測AIを開発しTwitterやnoteなどのSNSで活動中。

競馬AIを特集した競馬王2020年7月号や業界初の競馬AI単行本、城崎哲著『AI競馬』(ガイドワークス)に登場。ロボットAIエンジニアとして日々最新技術に触れ、それらを取り入れた独自の競馬AIは日々進化中。

  • 12/08 (水) 【無料公開】『ベタ買いでもプラスになるはずです』赤兎馬の“着順確率AI”…
  • 12/01 (水) 【無料公開】『未来がぼんやり見える』赤兎馬の“着順確率AI”と“高期待値厳…
  • 11/24 (水) 【無料公開】『新しいものが次々に』赤兎馬の“着順確率AI”と“高期待値厳選…
  • 11/17 (水) 【無料公開】『一気に変わりました』赤兎馬の“着順確率AI”と“高期待値厳選…

コラム一覧

城崎哲 近影

城崎哲

日経BP社の科学技術情報誌スタッフライター、「競馬最強の法則」編集者を経てフリーライターに。「競馬王」にてコースの鬼!シリーズを執筆し、競馬場・コース分析の第一人者として知られるようになる。『カリスマ装蹄師西内壮の競馬技術』(白夜書房刊)で2007年JRA賞馬事文化賞を受賞。本連載は『AI競馬 人工知能は馬券を制することができるか?』の後日談で主に構成される。

新着記事/コンテンツ
記事一覧
  • 08/16 (火) 今週は気鋭の2厩舎が新潟でデビューさせる新馬2頭に注目を/東スポ・藤井記者の“若駒”生情報!
  • 08/16 (火) アスクメークシェアなど8月13日(土)~8月14日(日)デビュー馬評価/競馬オタク・坂上明大の新馬戦…
  • 08/16 (火) 週刊アサヒ芸能・亀谷敬正の連載記事/札幌記念
  • 08/16 (火) 高速決着で欧州型の人気薄激走が連発した小倉ダート/今週末(8/20~8/21)の見どころ
  • 08/16 (火) 先週は小倉で活躍! C.ホー騎手を改めて知ろう!/亀谷サロン編集部が選ぶ今日(8/16)の注目トピ…
  • 08/15 (月) 札幌記念・北九州記念/亀谷敬正の重賞アプローチS
  • 08/15 (月) 重賞レース過去10年好走馬一覧/札幌記念・北九州記念
  • 08/15 (月) 2022年愛ダービー、愛オークス回顧/栗山求の海外競馬トピックス
  • 08/15 (月) “世界のYAHAGI”がフランスのセールで凱旋門賞馬・ソットサスの全弟を落札/亀谷サロン編集部が選…
  • 08/14 (日) ノッキングポイントは理想的。新馬戦での勝ち方とは/NF天栄・木實谷雄太~フロントライン #26

会員ログイン

データバイヤーIDをお持ちの方

亀谷競馬サロンの会員でない方は、
入会案内をご参照ください。

copyright © K-MATE All rights reserved. 特定商取引法に基づく表記

入会手続き
page top