ウェブサイト分析ソフトウェア開発の舞台裏(前編)

こんにちは。QuarkAの丸山です。 QA Heatmap Analyticsは、もうすぐVer.0.9の録画再生機能がリリースされる予定です。 最近Google Analytics 4もリリースされたこともあるので、このあたりで「データ分析ソフトウェア開発の舞台裏」について書いてみたいと思います。 ウェブサイト分析はイベント計測型へ もともとGoogle アナリティクスはUrchinというアクセス解析ソフトウェアを2005年にGoogleが買収したところから始まりました。もう15年も前の話です。 それから現在に至るまで、スマートフォンの登場などもあってやユーザー行動自体は大きく変化していますが、計測の仕組み自体はずっと当時の原則を守ったままでした。 しかしここに来て、Googleアナリティクス 4が登場しました。今までとの大きな違いはデバイスまたぎの計測(アプリ含む)に対応できるなどですが、従来のウェブサイト分析という範囲において大きな変化の一つは「ページへのアクセスではなく、イベントを計測するようになった」になったということです。 Google Analytics 4のイベントって何? イベントについて耳慣れない方もいるかも知れません。より正確に表現するならば「イベントとは、ブラウザ上で取得もしくは設定できる何らかのアクション」ですが、これでは何のことやら?です。 ウェブサイト分析で使うイベントについて、おおよそのイメージでいえば「イベント=ユーザーの行動」と捉えていいと思います。 たとえば、ページを閲覧しただけでなく、ページをスクロールした、動画を再生したといったユーザーの行動を指します。実際、Google Analytics 4ではページのスクロール情報なども取得してくれるようです。 スマートフォン時代に入り、ユーザーの行動は、以前ほどシンプルではなくなってきています。その中で、イベントを計測するようになったというのは理にかなっていると思います。 イベント計測は簡単ではない これだけ見ると、Google Analytics 4は大幅に進化したように思えますが、今まで使っている側からすると手放しでは喜べないところもあります。ご紹介する衣袋さんや森野さんや村山さんのツイートのように、わかりづらくなってしまった部分や、できないこともあるからです。 なので、今すぐ安易に飛びつかない方がいいというのは私自身も完全同意です。そもそも多くの中小規模サイトにとっては不要の機能だったり、以前からのWeb+Appプロパティを導入した人はわかると思うのですけど、少なくとも現状は決して使いやすいとはいえないからです。 ただ、先ほど申し上げた通りイベント計測型という点においては、これからのウェブを見渡せば理にかなっていると考えています。なぜなら、ユーザーの行動=イベントであり、ブラウザ上の行動分析の行き着く先は「イベント」の分析であるからです。 ちなみに我々のQA Heatmap Analyticsはイベントとページビューの両方を計測しています。従来GAと新GA4が合体したイメージに近いかも知れません。 データ分析の最大の敵は「インフラコスト」 さて、Google Analytics 4はイベント計測型に進化したわけですが、それならば、なぜわかりづらい部分や、使い勝手がわるい部分が出てしまったのでしょうか。 この件については、a2iの大内さんのコラムがとても参考になるのではないかと思っています。 要はどうにかして インフラコストを下げたい っていうことですよね。だからこそ、旧来のデータをそのまま引き継ぐわけにはいかなかったと。 大量のデータ処理はお金がかかる 今はAIの時代などいろいろ言われますけど、最終的にそれらは全て「データ処理」です。精度をあげようと思えば、良質な推測と設計のもと、大量のデータを保存し、そのデータを演算する必要があります。 これはディスク容量、メモリ、CPU(AIならGPU)パワーを大量に食いますから、いわゆる高スペックのゲーミングPCをたくさん買うようなもので、とてもお金がかかります。 これを無料で提供するというのは、そもそも一般の零細企業には不可能ですが、あのGoogleでさえも、厳しくなってきます。おそらくGoogle Analyticsは、世界の数億程度のサイトに入っていると想定しており、現状でもとてつもないデータ容量のはずです。 ▼Google Analyticsはサイト分析ツールとして圧倒的なシェアを誇っており、世界中のサイトの54.8%に導入されています。 https://w3techs.com/technologies/overview/traffic_analysis そんな全サイトで、今までのデータに加え、さらにその数十倍となるであろう全てのユーザーの行動データを詳細に長期間記録するというのは、さすがのGoogleといえどもちょっときついはずです。 そもそも、なぜGoogleアナリティクスは無料で提供されているのか? もともとはUrchinを買収して提供が始まったGoogleアナリティクスですが、一石二鳥ではないですけど、下記のような狙いだったと思っています。 Google側のメリット 世界中のサイトの傾向を把握、分析できる 世界中のサイトを通じて全世界のユーザーを把握(追跡)できる ユーザー側のメリット アクセス解析ツールで傾向がわかれば改善点がわかる … Continue reading ウェブサイト分析ソフトウェア開発の舞台裏(前編)