当連載は競馬AIの作者を、単行本『AI競馬 人工知能は馬券を制することができるか?』の著者・城崎哲氏と元『競馬王』編集長・柿原氏がインタビューし、城崎氏が対談形式にまとめたものです。
※11/15更新 掲載内容変更のお知らせ
単行本『AI競馬』の執筆のため、前回赤兎馬に取材したのは2020年4月だった。当時コロナが拡大傾向を見せていて、初めてZoomで取材することになった。あれから1年半が過ぎて、今やZoomなんて当たり前のツールになったが、当時はなにやらやたら未来に来てしまったような気がしたものだ。
赤兎馬は東京大学→同大学院で知能機械情報学を専攻し、ロボットの研究をした。現在は都内のロボット関係のAIベンチャーでエンジニアとして働いている。
前回はコロナの流行で熊本の実家に里帰りしていた。このところコロナは収束傾向だが、引き続き熊本にいてテレワークで仕事している。今回もZoomでの取材ということになった。
基本アルゴリズムの変更で一気に進化
城崎(以下、J):「あれから1年半経って、けっこう変わりましたか?」
赤兎馬(以下、赤):「そうですね、一番大きいのは基本アルゴリズムをディープラーニング(※1)に変えたことですね。それで一気に変わりました」
J:「今どれくらいの成績が出ているのですか?」
赤:「シミュレーションの仕方によって変わってくるのですが、中央に限定して、儲かる指数が一定以上の馬の単勝または複勝をベタ買いした場合、だいたい勝率が13~14%で、回収率が122%くらい。複勝の的中率が33%、複勝回収率が113%くらい。さらにオッズで絞ればもう少し向上する……みたいな感じですね」
J:「単勝回収率が122%で、複勝回収率が113%……すごいですね!」
赤:「儲かる指数が一定以上の馬……その馬の単勝または複勝をベタ買いし続けた場合、プラスになると考えられる馬……はだいたい3~4レースに1頭程度出現します。『競馬放送局』ではその馬のリストを、“高期待値厳選馬”として販売しようと思ってます」
※高期待値厳選馬は11/12から『競馬放送局』で販売開始。
組み合わせ馬券の取捨選択に使える
赤:「販売するもう一つが指数表の“着順確率AI”で、これは出走全馬について、各馬の1着確率、2着確率、3着確率を表にしたものです。馬券の回収率とは関係なく、あくまでも1着に来るかどうかの確率、2着に来るかどうかの確率、3着に来るかどうかの確率なので、儲かるかどうかは使い方にかかっています」
▲着順確率AIのサンプル(2021年ヴィクトリアマイル)
柿原:(以下、K):「1着確率とか、3着内確率みたいな出し方はありますが、1・2・3着確率として全部出すのは珍しいですね」
赤:「まだ予想として公開している方はいないのではないでしょうか。これがいいのは、1・2・3着になるそれぞれの確率から馬連、馬単、三連複、三連単のような組み合わせ馬券の発生確率が計算できることです。
それぞれの馬券の発生確率がわかれば、オッズと確率を照らし合わせて、これは過剰人気なので買わない方がいいとか、これは人気の盲点になっているから買おうとかいう判断ができるし、オッズに応じた適切な資金配分もできるようになると思います」
K:「なるほど。三連単でも、2着にはつけるけど、3着にはつけないとかいうこともできそうですね」
赤:「“高期待値厳選馬”との組み合わせももちろんですが、ご自身の予想メソッドや他の予想家さんの予想と組み合わせて、買い目の取捨や投資金額の検討に有効だと思います」
※着順確率AIは11/12から『競馬放送局』で販売開始。
勾配ブースティングからディープラーニングへ
J:「アルゴリズムを変えたら成績がぐっとよくなったとおっしゃいました。以前は勾配ブースティング(LightGBM)(※2)でしたよね。次はディープラーニングでやってみたいとおっしゃってましたが、実際にディープラーニングに変えたのですね」
赤:「そうです。それで、ここ1~2年の試行錯誤はなんだったの?と思うぐらい良い成績が出ました。そうするとちょっと学習時間が長くなるのですが、精度には変えられないので」
K:「ディープラーニングだと何が違うんですか?」
赤:「勾配ブースティングは基本的に木構造のモデルなので、ある項目の値がある値より大きいか小さいかの判断の単純な繰り返しですが、ディープラーニングはそうじゃなくて、変なところの関係性とかまで勝手に学んでくれます。それに勾配ブースティングの場合は、大小関係がきれいにわかるような特徴量をこちらで作って与えないといけないのですが、ディープラーニングなら自分でなんとかしてくれます」
1年半前の構想がそのまま実現した
赤:「本業では以前からディープラーニングを使ってたんで、競馬でも使ってみたいというのは前々からありました。前回も話したと思いますが、ディープラーニングならもっと柔軟にモデル設計ができそうだと思っていたこともあって」
J:「たしかに以前、アルゴリズムをディープラーニングに変えて、当たる、じゃなくて、儲かるモデルにしたい、と言ってましたね」
赤:「実は以前やってみたときはディープラーニングも勾配ブースティングも、そんな性能に差が出なかったんですが、ごく最近新しいライブラリがいろいろ出てきて、そのうちの一つ、とあるライブラリを使ってみたらびっくりするほど変わったということです」
次回は赤兎馬が見つけた新しいライブラリとはどんなものか、最新の状況についての話題をお届けする。
(※1)ディープラーニング
神経細胞(ニューロン)の働きを重回帰分析等の数学的な方法で模したニューラルネットワークの技術から発展した。ニューラルネットワークの処理が1層のものがロジスティック回帰、少しだけ層数を多くしたものが多層パーセプトロン、さらに多層にして、より複雑な回帰を解けるようにしたのがディープラーニング。
(※2)勾配ブースティング(LightGBM)
予測やマーケティングの分野で発展してきたアルゴリズム。樹形図的に枝分かれしていく決定木(けっていぎ)という学習法にアンサンブル学習を組み合わせて未学習の領域を埋めていくように学習する方式。LightGBMはその進化系で、学習速度が非常に速いのが特徴。
<おまけ>ドラえもんはいつ誕生するか
J:「ロボットといえばボストン・ダイナミクスのアトラス。最近動画でみてびっくりしました」
K:「宙返りしたりするロボット?」
J:「そうそう」
赤:「アトラスは数年前に現物を見たことがあります。アメリカの国防総省の研究機関にDARPA(ダーパ)ってあって、そこの災害対応ロボットの競技会を見学したんですけど、アトラスを使って参加したチームがたくさんいました。やっぱり違いますよね。あちらは軍需産業なんで、お金のかけ方が違います」
J:「あれは障害物がここにあるからこう動こうみたいにAIで判断して動いているんですよね?」
赤:「いや、あれはAIではなく、通常の制御の積み重ねじゃないかと思います。レーダーとかセンサーをいっぱい使って、地面が今どういう状況で、じゃあどこに足をつくかとかものすごい計算して動いているハズです。めちゃくちゃすごいのはむしろハードウェアですね。アトラスのあのハードな動きは力を面で受ける油圧駆動の関節ならではで、普通のギアではあの撃力にとても耐えられないです」
K:「ところでドラえもんは後何年でできますか?」
赤:「ドラえもんは当分できないですね。あれは最強なんで。100年以上かかると思います」
K:「そういえばドラえもんは22世紀から来たロボットでしたね(笑)」
▼赤兎馬プロフィール
2015年東京大学大学院情報理工学系研究科修了。2017年夏の競馬観戦をきっかけに競馬にのめり込む。2017年冬より独自指数の開発をはじめ、その後着順予測AIを開発しTwitterやnoteなどのSNSで活動中。
競馬AIを特集した競馬王2020年7月号や業界初の競馬AI単行本、城崎哲著『AI競馬』(ガイドワークス)に登場。ロボットAIエンジニアとして日々最新技術に触れ、それらを取り入れた独自の競馬AIは日々進化中。