スポーツアナリティクスの歴史:シリーズ第2回「サッカーのデータ分析の歴史と戦術ブロガーの未来」
2019.10.03 written by Daichi Kawano(SPLYZA Inc.)
※第1回「スポーツアナリティクスの歴史を振り返る」
https://www.sportsanalyticslab.com/column/sports-analytics-history.html
※第3回「現代におけるスポーツアナリティクスの役割」
https://www.sportsanalyticslab.com/column/sports-analytics-for-business.html
「スポーツアナリティクスの歴史」シリーズ第2回目となる今回は、サッカーにおける「定量データを駆使した分析」を特集。データ分析がこれまで時間をかけてどのような進化を遂げてきたのかを深掘りします。
なおイングランド2部、チャンピオンシップに所属するリーズ・ユナイテッドの監督を務めるマルセロ・ビエルサ氏によると、彼のチームは試合前に何時間もかけて対戦相手の調査を行うそうです。これはコーチングスタッフやアナリストチームが次の対戦相手への準備に何日も時間を費やす現代のプロサッカー界の現実を反映しているといえるでしょう。
Incredible level of analytical detail in the preparations Leeds make for matches.
— Simon Gleave (@SimonGleave) January 17, 2019
- 4 hours of analysis of every match of an opponent this season (and sometimes last too)
- Quantitative and video analysis used
- Bielsa knows everything about every teamhttps://t.co/aQYiVr4Sbs
それでは、一旦1950年代まで遡りつつ、そこから半世紀以上たった現在何が行われているか、そして将来的な「データ分析」を用いた新たなアプローチについての考察を行っていきます。
**
■1950年~データアナリスト界のレジェンド!チャールズ・リープ御大
フットボールの定量データ収集、およびデータ分析の草分け的存在。元会計士でイギリス空軍にも籍を置いていたチャールズ・リープ氏。彼は独学で試合を観ながらデータを収集し始め、主に「オフェンス時の動き」に焦点を当て、膨大な量の文章や表、グラフを作成しレポートとして公開しました。
リープ氏は「パスの本数やパスを成功させるスキルには、ゲームに勝利に導くのに相関関係はない」と言い切り、ロングボールや少ない本数で縦に速いパスを駆使する「ダイレクトプレースタイル」を推奨しました。いわゆる「キック&ラッシュ戦術」というやつですね。これらは英国フットボール界としては初となる「データを用いた革新的なアプローチ」であり、かつ「すぐに実行可能!」ということですぐにイングランドサッカー協会も彼の理論を真に受けることとなります。
なお、今でこそ「分析のフレームワーク」というものが存在しますが、リープ氏の掲げた理論には致命的な欠陥がありました。それはサッカーにおいて多くのゴールは相手ゴール前でのトランジションの局面やセットプレーがきっかけとなるもの、つまり「短い保持時間」から生まれるものであるのにも関わらず、リープ氏はそれを局面ごとに考えず、一貫した「同一チームによるゴールの傾向」として統計結果を出してしまったことにあります。今だからこそ言えることかもしれませんが、そりゃあ「短いパス本数」から圧倒的に多くのゴールが生まれることなんて明白です。決して「多いパス本数に比べて、少ないパス本数のチーム方がゴールの確率が高まる」なんてことは断言できないでしょう。
リープ氏の書いたレポートの一部がこちら
via https://pbs.twimg.com/media/Drz_cSmXQAMLcvd?format=jpg
(レポートをかいつまんで要約すると)
ーそんなにチンタラ多くのパスを繋ぐのは何か意味があってのことですか?私はあまり意味がないと思いますが…
ーロングボールこそ至高!ショートパスを得意とするスタイルのチームにめちゃめちゃハマります。オススメ!
ーせっかくワールドクラスの選手が何本もパスを繋いで試合を進めるわけですが、そういった展開になってしまうと得点することは殆ど困難な状態になります。
ーこれから行われるチリでのワールドカップでは(イングランド代表は)ロングボールと縦パスを駆使したダイレクトプレーを積極的に用いるべし!
ーイングランドの皆様は1953年以前の「コンチネンタルスタイル(パスワーク志向)のフットボールが、英国のダイレクトプレースタイルよりも優れているため模倣する必要がある!」という幻想をあまりにも安易に受け入れすぎている。実際、結果は出ていないのでは?
ー私の出した統計は、これらすべてに対する答えが間違いなくYESであることを証明しています!
もの凄く自信に満ち溢れた内容になっていますが、このレポートがリリースされてから50年以上経ったイングランドで、ペップ・グアルディオラ率いるマンチェスター・シティが、1つの攻撃局面において約50本ものショートパスを繋いで繋いで…結果的に勝利を重ね続けることになろうとは。なんたる皮肉。
A) Charles Reep 1962
— Duncan Alexander (@oilysailor) November 12, 2018
B) Pep Guardiola 2018 pic.twitter.com/6Lih6WQuWc
現在は「”パスの成功率”と”枠内シュートの質”がゴールと相関関係にある」という統計データがあります。リープ氏の掲げる理念とはまさに真逆…そして、「パスを出す&受ける際に、各々が担当するスペースを保持することで生じる”別のスペース”を上手く使うこと」は「”質の高いパス”そして”ボールポゼッション”を維持することに大いに相関性がある」ということも、データで証明できるようになっています。
というわけでこのリープ氏の登場は良くも悪くも、欧州フットボールの世界において「定量データの収集&分析手法」として進化を遂げていくことになります。
■1960年~名手ドン・レヴィーの書いたマッチレポート
前途したビエルサ氏から遡って遥か昔、リーズ・ユナイテッドの監督を勤めたドン・レヴィーOBEの時代(1960~70年代)において「パス」「タックル」「利き足」「ドリブルの特徴」などをスタッフが収集し、対戦相手にどう対応するべきかの指示を監督が紙に書いてプレイヤーに渡しました。ただ、常に対戦相手をスカウティングしなくてはならないリーズのスタッフからはしょっちゅう苦情が出ていたとか出ていないとか…
ドン・レヴィー氏の記したとされる、クルー・アレクサンドラvsストックポート・カウンティのマッチレポートがこちら。一番上に往年の名GK、ブルース・グロベラー氏の名前もありますね。
via https://www.optasports.com/media/3357/79-match-report-smaller.jpg
このように60年代から現在に到るまで、リーズ・ユナイテッドというクラブは欧州フットボールのデータ分析界において重要な存在であることが判ります。戦術マニアであるビエルサ監督が現監督であるのも決して偶然ではなく、リーズというクラブのDNA、レガシーのもと必然的にそうなった。と言っても良いでしょう。
ここから90年代前半にかけては、ああでもない…こうでもないと試行錯誤の時代が続くことになります。
■1995年~ 試合のイベントデータを販売する企業の登場により、業界に大革新が!
フットボールにおけるデータ革命は1995年以降、STATS社やOpta社、Prozone社などのスポーツのイベントデータ販売企業の登場によりドラスティックな変化を遂げます。
彼らが提供する詳細で正確なパフォーマンスに関する定量データが、スタッフ陣をこれまで以上に手助けすることになりました。今でこそチーム専属のアナリストがリアルタイムでデータを分析している光景は当たり前になりましたが、ネットワークインフラもそこそこに整備されていた2000年代前半ですら、プレミアリーグのクラブはデータを郵送やファックスなどで受け取っていたのです。それほど欧州サッカーにおいても「IoT化」はすぐにチームの投資対象とはなりませんでした。
現在、これらのデータやレポートはより身近なものとなり、プロに限らず一般のファンでもサブスクリプション契約などで気軽に、オンラインを通じてアクセスすることが可能になっています。このようにデータやマッチレポートなどをデジタル的にアーカイブするデータ会社のサービスは、昔から高い離職率で知られるブラックなスポーツ業界においても、ライフワークバランスを重要視する現代において良い影響を与えています。
■2005年~現在 欧州のトップクラブでも徐々にデータ分析が主流に
「サッカーというのは”複雑系のスポーツ”といって、原因と結果が直結していないんですよ」というのは元日本代表監督・岡田武史氏の言葉ですが、最近ではそういった考えも少しずつ覆りつつあるようです。
フットボールのデータ分析の先端を走り続けるStatsBomb社のCEOであるテッド・ナットソン氏は自身のPodcastで以下のように述べています。
via https://pbs.twimg.com/profile_images/1082686134637998085/5U_Tduva_400x400.jpg
「スポーツにおける”データ”や”数字”というものは今に始まったものではありません。試合のコメンテーターは何十年もの間、勝敗数やこれまで試合中に放たれたクロスの回数まで、多くの統計をまとめてきました。しかし、過去の10年間で、テクノロジーを活用した手法が可能となり、試合の結果だけでなく、新たな選手の獲得にどのように資金を使うべきかが大きく変わりました。それは、個人のパフォーマンスを定量的な数字だけでなく、活きたデータとして可視化できるようになったからです。」
2000年代半ば、フットボールにおける新時代のデータ分析は、きめ細かな「イベントデータ」の取得から始まりました。試合中のすべての”ボールに関与するアクション”の詳細な記録を行ったのです。
2006年、ロンドンに拠点を置く「Opta
Sports」のデータ取得チームは、すべての「パス」「シュート」「タックル」「ドリブルの時間・場所」などを記録するために、それぞれ割り当てられたボタンをひたすらタップしていました。現在でもOpta社でコーディングされたマッチレポートには、約2000ものデータポイントが含まれています。
Passmaps & xGplot for Real Madrid U19 against Club Brugge U19. #passmap #xGplot #autotweet pic.twitter.com/d23qzFAGPo
— 11tegen11 (@11tegen11) October 2, 2019
次に「ゴール期待値(xG)」という新たな分析手法が開発されました。これは、ゴールからの距離と角度に基づいて、シュートが得点につながる可能性を計算するシステムです。この分析のコンセプトは英国プレミアリーグの人気番組である「MATCH
OF THE DAY」に2017年から採用されています。
チームスタッフは、わざわざ遠く離れた土地での試合に頻繁に出向くことなく、選手のプロファイルにアクセスできるようになりました。ピッチでの選手のアクションとチームの全体的なパフォーマンスレベルに関するデータを計算し、各プレーヤーに評価を割り当てます。クラブはこのデータを使用して、プレーヤーがチーム全体のパフォーマンスレベルを強化するか、弱めるか、またはほとんど変化させないかを確認できます。この手法をいち早く用いて選手を獲得したのが、かの奇跡を起こしたレスター・シティであると言われています。
もちろん、データを利用する際のコンテクスト(文脈や背景を読み取ること)は極めて重要です。フィールド上の選手は、自陣でフリーな状態にある時と、敵陣で相手に囲まれているときでは同じ意思決定をしません。そのためStatsBombのイベント記録担当は、選手がパスやシュートを行う際に、該当する選手がプレッシャーにさらされているかどうかを記録しているそうです。また、ゴールキーパーの位置や、シュートが放たれたときの選手とゴールの間のディフェンダーの位置も記録しています。
また定量データでカバーできない情報も、テクノロジーとデータサイエンスのナレッジを駆使して活用している例もあります。FCバルセロナのデータサイエンティスト、ハビエル・フェルナンデス氏はデータ分析に関するカンファレンスにて次のように述べていました。
Next November 13th we will have our second Barca Sports Analytics Summit. This time we have an open call for short research papers in Soccer/Football. The four selected winners will present their research at the event. web: https://t.co/jv6HOSYCeH video: https://t.co/fkBD7bTd1j pic.twitter.com/O5SggPw9dx
— Javier Ferna´ndez (@JaviOnData) July 10, 2019
「我々のようなデータを扱う人間に対して、コーチからの質問の多くは、定量イベントデータがカバーしていない部分のものです。コーチはよくスペースについて話します。スペースを創出し、そのスペースを活用したいのです。そのため、データでもピッチ上のスペースをより詳細に把握する方法が必要であることに気付きました。それらのデータを蓄積することでチームの目指すべきオフェンススタイルをより強固なものにできます。現代サッカーにおいて、データサイエンスの知識はより必要不可欠なものとなっていくでしょう。」
選手の動きのモデルは、チーム全体のプレースタイルから集約することができます。仮想の選手AIを用いて、シーズン中毎試合ごとに追加され変動する指標だけでなく、選手が特定の動きを実行する能力や特性が、チームに対して良い影響を与えるか、それとも悪い影響を与えるのか、というシュミレーションを何度も何度も繰り返すことで精度を上げ、擬似的に検証することが可能になっているのです。
データを用いた分析が市民権を得はじめた2000年代は「サッカーはデータが真の価値を提供するには流動的すぎる。そんなものは数字を都合よく解釈しているだけ。」という主張がまだまだあったようですが、テクノロジーの進化がその議論を打ち砕きました。選手の次の動きを予測できるツールに進化したことにより、究極の「データエコシステム」が確立されつつあるのです。
■これからのデータ分析時代の鍵を握る?戦術ブロガーの存在
日本国内のサッカークラスタにも属性として増えつつある「戦術ブロガー」。ヨーロッパにおいては「Total Football Analysis Magazine」や「BetweenThePosts」といった、在野のライター(本職の方もいらっしゃるとは思いますが)を多く抱えて、サブスクリプションモデルで運営を行うサイトも出てきています。特に「BetweenThePosts(以降、BTPと表記)」においては戦術ボード風画像を用いた定性分析に加えて、パスネットワークやxG、ピッチプロットと言った定量データをフルに活用した質の高いコンテンツが読めるということで、つい先日、私もブロンズ会員からシルバー会員にプラン変更したほどです。
via https://betweentheposts.net
なお、以下はBTPの創設者であるサンデル・アイズマ氏にプランの変更方法をメールで問い合わせたついでに、色々質問しつつやりとりした内容の記録です。(ご本人には掲載OKの旨いただいています。)
「読み手のレベルはより細分化され、タブロイド紙のようなコンテンツではなく、質の高い記事を欲している層が多くを占めてくるようになりました。以前は無料で記事を読めましたが、もともと収益化する目的でサイトを立ち上げたので、途中からサブスクリプションモデルに切り替えています。当初はユーザーが集まるか不安がありましたが、既に多くの方に月額課金してもらっており、マネタイズできるようになったことでより質の高いライターの方々が集まっています。」
「データを駆使したマッチレポートというのは誰でも書けるものではありません。我々のサイトはそれを強みとして他のマッチレポート系のサービスと差別化をしています。マッチレポートについてはプロのスカウティング分析の手法を一部用いているのもあって、強豪クラブのスタッフの方も多くユーザーとして登録してもらっています。」
You may have heard Barcelona were bailed out by Messi again after playing a bad first half against Inter.
— Between The Posts (@BetweenThePosts) October 3, 2019
While that's partly true, it also had a lot to do with a change to a 4-2-3-1 formation, which allowed for a lot more midfield control.
?? @JMftbl https://t.co/IHEQBGLHZF
このように、在野のライター/アナリストが記事を書いている「定量データを用いたマッチレポート」が収益化されたサービスが存在し、プロの現場でも活用される時代になってきています。日本でも「定性分析+定量データを活用したマッチレポート」が徐々に増えてきている傾向にあるので、これからより精度が上がってくれば近い将来国内でもこの「BTP」のようなコンセプトの「データを用いたマッチレポート集約型サイト」が出てくる可能性も充分あるでしょう。
従来サッカーに関わる仕事と言えば、例えば趣味でブログをやっていた方がサッカーライターになったり、プロ/アマ問わず指導者やトレーナーとして現場に入ることばかりがゴールとされてきたのかもしれません。ただ、ここ数年で特にスポーツに関わる仕事も多様化しています。この例のように「間接的にサッカークラブに貢献できる仕事」も、少しずつではありますが日本でも増えて行くことに違いありません。