ウェブサイト分析ソフトウェア開発の舞台裏(前編)

ホーム » 開発者ブログ » ウェブサイト分析ソフトウェア開発の舞台裏(前編)

Koji Maruyama
Koji Maruyama

ウェブサイト分析ソフトウェア開発の舞台裏(前編)

こんにちは。QuarkAの丸山です。

QA Heatmap Analyticsは、もうすぐVer.0.9の録画再生機能がリリースされる予定です。
最近Google Analytics 4もリリースされたこともあるので、このあたりで「データ分析ソフトウェア開発の舞台裏」について書いてみたいと思います。

ウェブサイト分析はイベント計測型へ


もともとGoogle アナリティクスはUrchinというアクセス解析ソフトウェアを2005年にGoogleが買収したところから始まりました。もう15年も前の話です。

それから現在に至るまで、スマートフォンの登場などもあってやユーザー行動自体は大きく変化していますが、計測の仕組み自体はずっと当時の原則を守ったままでした。

しかしここに来て、Googleアナリティクス 4が登場しました。今までとの大きな違いはデバイスまたぎの計測(アプリ含む)に対応できるなどですが、従来のウェブサイト分析という範囲において大きな変化の一つは「ページへのアクセスではなく、イベントを計測するようになった」になったということです。

Google Analytics 4のイベントって何?

イベントについて耳慣れない方もいるかも知れません。より正確に表現するならば「イベントとは、ブラウザ上で取得もしくは設定できる何らかのアクション」ですが、これでは何のことやら?です。

ウェブサイト分析で使うイベントについて、おおよそのイメージでいえば「イベント=ユーザーの行動」と捉えていいと思います。

たとえば、ページを閲覧しただけでなく、ページをスクロールした、動画を再生したといったユーザーの行動を指します。実際、Google Analytics 4ではページのスクロール情報なども取得してくれるようです。

スマートフォン時代に入り、ユーザーの行動は、以前ほどシンプルではなくなってきています。その中で、イベントを計測するようになったというのは理にかなっていると思います。

イベント計測は簡単ではない

これだけ見ると、Google Analytics 4は大幅に進化したように思えますが、今まで使っている側からすると手放しでは喜べないところもあります。ご紹介する衣袋さんや森野さんや村山さんのツイートのように、わかりづらくなってしまった部分や、できないこともあるからです。

なので、今すぐ安易に飛びつかない方がいいというのは私自身も完全同意です。そもそも多くの中小規模サイトにとっては不要の機能だったり、以前からのWeb+Appプロパティを導入した人はわかると思うのですけど、少なくとも現状は決して使いやすいとはいえないからです。

ただ、先ほど申し上げた通りイベント計測型という点においては、これからのウェブを見渡せば理にかなっていると考えています。なぜなら、ユーザーの行動=イベントであり、ブラウザ上の行動分析の行き着く先は「イベント」の分析であるからです。

ちなみに我々のQA Heatmap Analyticsはイベントとページビューの両方を計測しています。従来GAと新GA4が合体したイメージに近いかも知れません。

データ分析の最大の敵は「インフラコスト」


さて、Google Analytics 4はイベント計測型に進化したわけですが、それならば、なぜわかりづらい部分や、使い勝手がわるい部分が出てしまったのでしょうか。

この件については、a2iの大内さんのコラムがとても参考になるのではないかと思っています。

要はどうにかして インフラコストを下げたい っていうことですよね。だからこそ、旧来のデータをそのまま引き継ぐわけにはいかなかったと。

大量のデータ処理はお金がかかる

今はAIの時代などいろいろ言われますけど、最終的にそれらは全て「データ処理」です。精度をあげようと思えば、良質な推測と設計のもと、大量のデータを保存し、そのデータを演算する必要があります。

これはディスク容量、メモリ、CPU(AIならGPU)パワーを大量に食いますから、いわゆる高スペックのゲーミングPCをたくさん買うようなもので、とてもお金がかかります。

これを無料で提供するというのは、そもそも一般の零細企業には不可能ですが、あのGoogleでさえも、厳しくなってきます。おそらくGoogle Analyticsは、世界の数億程度のサイトに入っていると想定しており、現状でもとてつもないデータ容量のはずです。

▼Google Analyticsはサイト分析ツールとして圧倒的なシェアを誇っており、世界中のサイトの54.8%に導入されています。

https://w3techs.com/technologies/overview/traffic_analysis

そんな全サイトで、今までのデータに加え、さらにその数十倍となるであろう全てのユーザーの行動データを詳細に長期間記録するというのは、さすがのGoogleといえどもちょっときついはずです。

そもそも、なぜGoogleアナリティクスは無料で提供されているのか?

もともとはUrchinを買収して提供が始まったGoogleアナリティクスですが、一石二鳥ではないですけど、下記のような狙いだったと思っています。

その目的は既に達成されたわけで、それにしては現状が高コスト体質という状態なのだと思います。

加えて、これからはiOSが採用しているITPなどプライバシーの問題が出てきますので、今のGoogle アナリティクスだけでは限界も出てきます。

ですからGoogle Analytics 4は現状のデータ構造を引き継がず、新しく設計されたというわけです。

ヒートマップもまた「膨大なイベントデータ」が必要


さて、ここでQA Heatmap Analyticsも採用しているヒートマップ関連の話になります。

ウェブ分析をしている人、特にLP改善などを行う人であれば、ヒートマップが強力なツールであることは疑いようがないと思います。

もしかしたら「なぜGoogleは無料のヒートマップツールを出さないのだろう?」と思っていた人もいるかも知れませんが、それは先ほどの理由と照らし合わせるとわかってきます。

ヒートマップというのは、ユーザーのアイトラッキングに近いことを行います。イメージでいうと、画面キャプチャの録画をずっと貯めているような感じで、おわかりのように、ものすごいデータ容量になります。我々の想定でいえば、そのデータ容量はおそらくGoogleアナリティクスが現状保持しているデータの数十倍になるはずです。

そうすると、そもそもGoogleはインフラコストを減らしたいわけですし、ヒートマップを追加でリリースしたところで彼らのメリットは特に増えないので、無料でヒートマップツールを出す理由は全くない(※)ということになります。

※唯一私が想定している手を出す理由はありますが、その場合は、Googleアナリティクスの製品群の一部に組み込むとしても、今までとは全く違う手を打ってくると思っています。

自社の解析サーバーを構築する?

もしGoogleがヒートマップやってくれないとすると、利用を諦めるか、どこか別のツールを使うしかありません。しかしヒートマップ描画を含むユーザー行動分析は高コストであり、他の会社がリリースしたとしても事情はまったく一緒。むしろGoogleよりお値段は高くなるはずです(実際、月額数万円〜と高いです)。

ヒートマップは、ユーザーの行動分析2.0と呼んでもいいくらい示唆を与えてくれるものであり、なんとかしたいところです。そう考えた時、クラウドベンダーが無理なら、自社のウェブ分析サーバーを構築し、そこにデータを貯めればいいのでは?という解決策が見えてきます。それならレンタルサーバー代だけですみます。

しかし自社専用の解析サーバーを構築するのは少なくともサーバーエンジニアのノウハウが必要であり、一般的には現実的でありません。ただ一つ例外があります。

WordPressのプラグインという解決策


WordPressのプラグインであれば、誰でも手軽にサーバーにソフトウェアをインストールすることができます。そこで開発されたのがQA Heatmap Analyticsプラグインになります。

とはいえ簡単ではない

理屈はそうなのですが、まともに動かすのは簡単ではなく、我々も相当苦労しました。

まずWordPressは様々なレンタルサーバーで稼働しているため、各ユーザーの環境が違います。CPUやメモリやディスク容量にもどのような制限がかかっているかわかりません。そのような環境で大量のデータ処理を行うには、様々な想定を行う必要があります。

また様々なプラグインをいれている人もいますから、まともに動くかも保証できません。よくWindowsのソフトウェアで、ウィルス対策ソフトが入っていてまともに動かないなどという話がありますが、それと同じ現象が発生します。サポートがとても大変です。

またWordPressのプラグインはオープンソースライセンス(GPL)ですので、ソースコードの公開義務があり、これをコピーした人にもソースコード公開の義務があります。これは一般的な商業ソフトウェアを想定した場合、まったく相容れないポリシーです。

次回後編

ということで、そんなWordPressで頑張って、データの正確性が求められるサイトデータ分析ソフトウェアを開発しようというのは、ちょっと変人かも知れません。そもそもWordPressのプラグインにQAと同じ行動データ分析ソフトウェアがない理由だと思います(我々が世界初です)。

ただ、これが中小企業でも気軽にヒートマップを含む行動データ分析を使えるようになる、唯一の解決策でもあったのですよね。ですから、我々としてはチャレンジをすることにしました。

その結果、お伝えしたように山あり谷あり。いろいろ苦労があり、予定よりだいぶ開発にかかったわけです(涙)。
さて、明日は後編として、開発者ブログらしく、QA Heatmap Analyticsの開発の舞台裏(苦労話)をお伝えしたいと思います。