Googleアナリティクスを使用する上で「ユーザーがどの流入経路(チャネル)で訪問したのか」という観点で解析をするケースはごく一般的なものだと思います。
ただ、各レポートごとにどのような仕様で参照元を判定しているのか、詳細に把握している方は少ないのではないでしょうか。
今回は私の今までの経験をフル動員して、この「参照元とは」という大きなテーマについてお話したいと思います。
※本稿でご紹介している内容を参考にご自身の環境に変更を加える際は自己責任でお願い致します。
記事の内容は2019年12月時点で確認している最新の情報をまとめて個人の見解として執筆しています。万が一記述内容に誤りがある場合はTwitterのDMなどでご連絡頂ければ幸いです。
Googleアナリティクスの参照元とは
用語について
参照元やメディアなどの用語については過去の記事で取り上げています。本稿では参照元を各レポートではどのように判定するのかというテーマで解説していくので、用語を確認したい場合は下記記事をご覧ください。
各レポート共通の原則
Googleアナリティクスではユーザーがサイトを訪問した際、発生したセッションごとに、訪問経路を参照元・メディア・チャネルといった情報で記録します。
ただし、レポートごとに異なる仕様で判定している為、あるセッションが別レポートでは異なる参照元だと定義されているケースがあります。
Googleアナリティクスの参照元の判定ルール
過去にさかのぼって参照元を判定する
- 集客 > ソーシャル > コンバージョン
- コンバージョン > マルチチャネル 配下
- アトリビューション 配下
これらのレポート群「以外」では共通の仕様でセッションの参照元情報を判定しています。
まず前提として、Googleアナリティクスではブラウザごとに保存されたCookie情報に紐づくユーザー識別子を定義し、一人ひとりのユーザーを区別しています。このCookie情報を参照し、過去にサイトを訪問した履歴があるかさかのぼって参照元を判定しています。
過去の訪問履歴がある場合どのように判定するのか
初めて訪問したセッションは参照元がそのまま表示されます。また、過去の訪問履歴と異なる参照元で発生した2回目以降のセッションも参照元がそのまま表示されます。
ただし、2回目以降のセッションがノーリファラーの参照元(ブックマークなど)でダイレクト流入してきたセッションの場合、直近のセッションと同じ参照元情報が引き継がれて表示される仕様になっています。
前項目で提示した図では3回目の訪問がこれに該当します。つまり、このセッションは2回目の訪問と同じ「aaa.com / referral」として記録されます。
「直接セッション」ディメンションによる確認
各レポートで確認できるセッションの内、直前のセッションの参照元を引き継いだセッションがどの程度あるのかは「直接セッション」ディメンションをセカンダリディメンションに適用することで推測することができます。
上図で表しているように、直接セッションでは
- 表示されている参照元から流入=No
- 直前のセッションの参照元を継承したダイレクト流入=Yes
- 直前のセッションと同じ参照元で連続して流入=Yes
という3つのパターンのセッションをYes/Noで区分しています。
つまり、②だけのセッションや③だけのセッションを抽出したくても、デフォルトのディメンション・指標やフィルタ機能などでは拾い上げることができません。
また、直接セッションはカスタムセグメントにも利用できないようです。
(direct) / (none)と表示されるセッションとは
ノーリファラー=(direct) / (none)と表示されるセッションは
- 過去にさかのぼっても判別できた参照元がないセッション
- 上記のセッション後、再度ノーリファラーで流入したセッション
の2つのパターンの合算です。
「参照元/メディア」✕「直接セッション」のディメンションに対して、システムセグメントの【新規ユーザー】と【リピーター】のセグメントを適用してセッションを計測すると上図のようになります。
つまり、
- すべてのノーリファラーセッションは直接セッションがYesとなる
- 内訳としては新規ユーザーと判定された過去の訪問履歴がないセッションと、ノーリファラーでしか流入したことがないリピーターのセッションの2つ
という計測が行われています。
本来の参照元ですべてのセッションを判定するには
もっとも実装が簡単なGTMを利用する判定方法をご紹介します。
GTMのユーザー定義変数で「JavaScript 変数」タイプを選択し【document.referrer】をグローバル変数名に入力したカスタム変数を作成します。
この変数はdocument.referrerで取得された参照元情報を値として格納するので、ノーリファラーの流入の場合は何も計測せず、外部リンクから流入してきた場合は参照元のURLを計測します。
この変数をセッションスコープのカスタムディメンションにセットして実装すれば、Googleアナリティクス独自の参照元を継承する仕様とは関係なく、document.referrerの情報ベースで各セッションの参照元を確認することができるようになります。
UTMパラメータがついたリンクからの流入
UTMパラメータがついているリンクから流入した場合、パラメータで定義された参照元情報が優先されます。ただ、この場合でも同じ参照元=リンクから連続してセッションが発生した場合は「直接セッション=Yes」となるので注意しましょう。
Google 広告とSearch Console レポート
集客レポート配下の「Google 広告」と「Search Console」のレポートは、GAと連携した各ツールから提供される情報を表示するレポートなので、各ツールに準拠した仕様となっています。利用できるディメンションと指標も異なります。
また、直接セッションのディメンションも利用することが出来ません。
例えばGoogle 広告のレポートでは外部ツール側のディメンション・指標と、GA側の行動・コンバージョンなどの指標が連携した計測結果を確認できます。セカンダリディメンションで呼び出せるのはカスタムディメンションや一部の連携されているディメンションです(デバイスカテゴリなど)
余談ですが、「参照元/メディア」をセカンダリディメンションにすると全て「google/cpc」になります。(そりゃそうだ)
ソーシャル レポート
集客 > ソーシャル レポートでは注意が必要です。
コンバージョン以外の配下レポートでは「直接セッション」ディメンションが利用できますが、コンバージョンのレポートでは同ディメンションを利用できません。
目標の完了数とコンバージョンの違い
Googleアナリティクスに目標を設定すると、各レポートでは「目標の完了数」で実績を確認することができるようになります。この指標は前述したGoogleアナリティクス独自の参照元判定で評価することが可能です。
一方で、コンバージョン > マルチチャネル などのレポートでは、その他のレポートとは大きく異なる集計仕様で参照元・コンバージョンを詳細に評価しています。
- 集客 > ソーシャル > コンバージョン
- コンバージョン > マルチチャネル 配下
これらのレポートでは、
- コンバージョン数
- アシストされたコンバージョン
- ラスト クリックまたは直接のコンバージョン
といった指標が利用できます。
特にマルチチャネル 配下レポートは「ユーザーがコンバージョンに至るまでの訪問(セッション)」をその他のレポートとは異なる独自の集計仕様で参照元の判定をして計測されています。
マルチチャネル 配下レポートの参照元判定ルール
マルチチャネルとは
Googleアナリティクスで「コンバージョン」配下で利用できるレポート群の一つが「マルチチャネル」です。
目標またはeコマースが計測された際、コンバージョンに至るまでにユーザーがサイトを訪問した経路(チャネル)を様々な観点で評価するためのレポートです。
所要期間やモデル比較ツールなど多彩なレポートがありますが、本稿ではユーザーが訪問した際の参照元の判定が他のレポートとどのように異なるのかという焦点でお話します。
過去にさかのぼって参照元を判定するがルールが異なる
集客など、マルチチャネル配下ではないレポートでは
- ノーリファラーの流入は過去の訪問履歴で参照元を判定できていれば継承する
- 同じ参照元で連続して流入した場合は、そのまま参照元が表示されるが直接セッションはYesとなる
といった仕様で集計されている。
過去にさかのぼる期間はCookieが保持されている期間です。
ではマルチチャネル配下レポートではどのように判定されるかというと
- ノーリファラーの流入は過去の参照元を引き継がず参照元情報をそのまま表示する
- 同じ参照元で連続して流入した場合は、ノーリファラーとなる
この2つの仕様で参照元を判定しています。
また、過去にさかのぼって判定する日数はCookie保持期限(デフォルトでは2年間)ではなく、1~90日の期間を「ルックバック ウィンドウ」で設定することができます。
各レポートで参照元・コンバージョンの計測が異なる例
具体例で各レポートごとの参照元とコンバージョンの評価の違いを見ていきましょう。
マルチチャネル以外のレポートの場合
ユーザーAが
- 初回訪問 = google / organic
- 2回目の訪問 = aaa.com / referral
- 3回目の訪問 = (direct) / (none)
というセッションを発生させ、3回目の訪問時に目標に設定した指標を達成した場合、aaa.com / referral のセッションで「目標の完了数」指標が計測される。
※3回目のセッションは、直接セッション=Yes
マルチチャネルレポートの場合
前項と同じユーザー・セッションを対象にした場合
- (direct) / (none) にコンバージョン数が1
- (direct) / (none) にラスト クリックまたは直接のコンバージョンが1
- google / organic と aaa.com / referral にアシストされたコンバージョンがそれぞれ1
という評価になります。
マルチチャネル配下ではノーリファラーのまま、参照元を引き継がずにセッションを評価する為です。
また、直前の訪問と同じ参照元でコンバージョンを達成したユーザーの場合は下記のようになります。
同じ参照元で連続して訪問したセッションでコンバージョンが発生した場合、判別できた参照元「aaa.com / referral」ではなく「(direct) / (none)」の参照元に上書きして該当セッションを評価します。
同じ参照元が続いた再訪問セッションの参照元判定は、UTMパラメータが設定されていたリンクでの流入であってもノーリファラーとなります。
マルチチャネル 配下レポートで、連続して同じ参照元から流入した際にノーリファラーにしない方法
完全に合致する参照元から連続して流入した場合、該当の再訪問セッションをノーリファラーに上書きするのがマルチチャネル 配下レポートの仕様です。
であれば、同じ参照元からの流入であっても、毎回異なるUTMパラメータが設定されていればノーリファラーに上書きはされずに計測させることが可能です。
UTMパラメータで参照元情報を定義した場合、参照元の判定時に優先される仕様です。
これを利用し、リンクをクリックした際にutm_termなどの別のUTMパラメータを追加し、値に乱数(ユーザー個人を特定しない情報にすること)を定義させれば、同じ参照元の同じリンクから連続して流入しコンバージョンを達成させてもノーリファラーに上書きされることはありません。
モバイルユーザーの行動で多発するGA独自の参照元判定
スマートフォンのブラウザ(SafariやChromeなど)で様々な検索をする際、複数のタブを利用することは決して珍しくないと思います。
また、検索した・もしくは途中のタブを一つ一つ丁寧に全部消した上でブラウザを閉じる方もいれば、タブを開きっぱなしでブラウザを閉じる方もいますよね。
例)私のiPhoneのsafariブラウザ
例えば、食事をするお店を探すタブや料理のレシピを探す場合は複数タブで比較検討するアクションをすることが多いです。
そして、気になる情報があるページ(タブ)は残しておき、後日にそのタブをもう一度開いて再閲覧します。
このような動きをGAで計測すると、2回目の訪問はノーリファラーセッションとなる為、GA独自の参照元判定によってレポートごとに参照元が定義されるケースとなります。
(direct) / (none) はITPの影響と決めつけない
2019年はITP2.1~2.3の影響でiPhoneのsafariブラウザのトラッキングに大きな制限がかかったことが話題になりました。
1日または7日の期間を超えてCookie情報を保持できない為、期間を超えて同じユーザーが再訪問した場合は別人という判定がGAなどの各ツールでなされる為です。継続したユーザー行動を追うことが難しくなりました。
GA側での大きな影響としては、前項目で私が挙げたような検索行動をするユーザーが7日以上経過しての再訪問をしていたとすると、(direct) / (none) の新規ユーザーが増え、コンバージョンの評価も(direct) / (none) が増えるといったものが考えられます。
もちろん、その影響も看過できないものではありますが、(direct) / (none) でラストコンバージョンを発生させているセッションは本稿でご紹介したような連続して同じ参照元から流入したユーザーによるものも混在していることを覚えておくと良いでしょう。
各レポートに対応する3種類のAPI
GAに関連したAPIを最後にご紹介したいと思います。
GAで利用できるディメンションと指標の一覧は Dimensions & Metrics Explorer で確認することができますが、どのレポートでどのディメンション・指標が利用できるのかは各APIのリファレンスを見ると参考になります。
GAの各レポートを利用する際のAPI
GAの画面左側に表示されている各レポートは、大きく分けると3つの仕様で計測されていることが対応するAPIから推測できます。
まず、特定のプロパティに対して現在発生しているユーザーアクティビティを数秒単位で取得できるリアルタイム レポートの実績を呼び出す「Realtime API V3」。
そしてコンバージョン > マルチチャネル レポート以外の実績を呼び出す「Reporting API V4」。
最後にコンバージョン経路データを取得する為のコンバージョン > マルチチャネル レポートの実績を呼び出す「Multi-Channel Funnels API V3」。
このようにGAで利用できる各レポートは3種類の対応するAPIが用意されています。
各レポートの処理の順序
GA/GTMタグで計測されたユーザーアクティビティをどのような順序で各レポートに格納しているか確認するために、目標設定したGAでコンバージョンを発生させるテストをしたところ
- リアルタイム レポート
- マルチチャネル レポート以外
- マルチチャネル レポート
という順序でした。
リアルタイム レポートはオーディエンス・集客などの各レポートで計測できるほど沢山の情報を処理はしていない為、秒単位での現状の計測を可能としています。そのため、まっさきに実績を確認できます。
その後、Googleのサーバーに格納された各実績がGA側の設定に準拠してマルチチャネルレポート以外の各レポートに計測結果を表示します。
Cookieに紐づくユーザー識別子=クライアントIDで確認できる過去のセッションを含めて評価するマルチチャネルは実績を格納するまでに最も時間がかかりました。
正しい情報を網羅的に把握するためには
「Googleアナリティクスの参照元とは?各レポートごとの計測仕様を紐解く」
という題で記事を書き上げましたが、GAで1セッションに対して1つの参照元が決定するまでに多くのフローがあることを少し感じてもらえたら嬉しいです。
ただ、私が取り上げた「紐」、つまり仕様はこれがすべてだとは思っていません。本稿は私が調べた範囲での調査結果をまとめたものなので、網羅できているとは口が裂けても言えません。あくまで一部を紐解いただけでしょう。
では、正しい情報を網羅的に把握するには、学ぶにはどうすれば良いか。と言えば、私は株式会社クロス・フュージョンの衣袋宏美さんの講義を受講することを強く推奨します。
Googleアナリティクスの仕様全容を正しく理解し、記事や講義などで情報を提供してくださっている為、まずは無料のものをすべて読破し、有料コンテンツ・セミナーも受講することをオススメします。
無料で公開されている記事の参考リンクはこちら
- リサーチ/データのリテラシー入門——調査統計の基礎知識 コーナーの記事一覧 | Web担当者Forum
- データをざくざく処理するためのグラフの読み方、使い方 コーナーの記事一覧 | Web担当者Forum
- 衣袋宏美のデータハックス コーナーの記事一覧 | Web担当者Forum
- 有名サイト、かってに解析! コーナーの記事一覧 | Web担当者Forum
- Googleアナリティクスとは/衣袋教授のGoogleアナリティクス入門講座 コーナーの記事一覧 | Web担当者Forum
- Googleアナリティクス セグメント100選 コーナーの記事一覧 | Web担当者Forum
- 衣袋教授の新・Googleアナリティクス入門講座 コーナーの記事一覧 | Web担当者Forum
有料の講座・研修の参考リンクはこちら
さいごに
今まで見ていたレポートに「直接セッション」「document.referrerのカスタムディメンション」などを追加したところで、突然今までとはまったく異なる判定でKPIを再評価することは難しいし、ステークホルダーに混乱をもたらすと私は考えています。
経営陣などの上位レイヤーが事業の成果を判断する為に、ステークホルダーがKPIを正しく評価するためには、基本的には従来どおりのKPIをどう見ていくかという進め方が良いでしょう。
ただ、その際はレポートごとに異なる仕様で判定するものが含まれる為、どのレポートのどの指標をKPIと定義するかのすり合わせが大事になってくると思います。
本稿でご紹介したような指標は、解析を担当するプレイヤーの方が各レポートを活用し仮説を設計し、施策を講じるために公開しました。
複雑な集計仕様をすべて網羅するのは、ステークホルダー全員でなくとも良いのです。ただ、GAや各ツールと向き合い成果を出すプレイヤーの方は、是非目を向けてみてください。
私も、自分なりの努力を愚直に積み重ね、ナレッジの発信を続けようと思います。成果を出すために活用するツールの仕様をどこまで深く理解すれば良いかは人によりますが、私は楽しみながら学んでいます。