収集したデータの管理とフィルタリング
このレッスンでは、イベントデータを管理する方法を確認します。
このレッスンを修了すると、以下のことができるようになります。
・クロスドメイン測定を設定する
・不要な参照を特定して除外する
・内部データとデベロッパー データを除外する
A、内容を整理すると、このレッスンは GA4 のデータ品質を高めるための「フィルタリングと管理」 に焦点を当てています。
前のレッスンが「何を計測するか(コンバージョン)」だったのに対し、今回は 「正しいデータだけを計測するための環境づくり」 がテーマですね。
📘 レッスンの目的(わかりやすく)
1. クロスドメイン測定を設定する
複数のドメインをまたいでユーザーが移動する場合、
それを 1人のユーザーとして正しく計測するための設定
例:
example.com → shop.example.com
main-site.com → external-payment.com
2. 不要な参照(リファラ)を特定して除外する
GA4 では流入元(参照元)が自動で記録されるが、
意図しない参照元が成果を汚してしまうことがある
例:
・自社の別ドメイン
・決済サービス(PayPal など)
・テスト環境
これらを除外することで、正しい流入経路が見えるようになる。
3. 内部データとデベロッパーデータを除外する
・社内スタッフのアクセス
・開発者のテストアクセス
・ステージング環境の動作確認
これらが混ざると、
実際のユーザー行動が歪んでしまうため除外が必要。
🌟 このレッスンの本質
GA4 のデータは「集めれば終わり」ではなく、
“正しいデータだけを残す” ことが分析の前提になる。
今回のレッスンはそのための基礎を固める内容ですね。
収集したデータを絞り込み、Google アナリティクスに送信する
A、「何ができるようになるレッスンなのか」と「具体的な操作の骨格」を整理しておきます。
レッスン全体のテーマ
このレッスンは、
「収集したデータを適切に絞り込み、分析に耐えうる“きれいなデータ”だけをGoogle アナリティクスに残す」
ことを目的としています。
そのために扱っているのは、次の3点です。
・クロスドメイン測定の設定
・不要な参照トラフィックの除外
・内部トラフィック・デベロッパートラフィックの除外(データフィルタ)
1. クロスドメイン測定の設定
目的:
複数のサイト(例:商品サイトと決済サイトなど)を、
「別々のユーザー」ではなく「同一ユーザーの連続した行動」として計測するための仕組みです。
ポイント:
・複数サイトのデータを 同じGA4プロパティ・同じ測定ID で収集する
手順の骨格:
[管理者] → [データ ストリーム] → 対象のウェブストリーム → [タグ設定を行う] → [ドメインの設定]
「◯◯というドメインを含む」という条件を、必要なドメイン分追加
・正しく実装されていれば、
別ドメインへ遷移したときのURLに _gl で始まるパラメータ が付与される
2. 不要な参照トラフィックの除外
目的:
決済代行業者など、本来「集客元」とは見なしたくないドメインが、参照元としてカウントされるのを防ぐことです。
典型例:
・サードパーティの決済代行(例:決済専用ドメイン)
・特定の技術的な中継ドメイン
・意図しないサードパーティサイト
これらをそのままにすると、
「どこからユーザーを獲得しているか」の分析が歪みます。
設定の骨格:
・[管理者] → [データ ストリーム] → 対象ストリーム → [タグ設定を行う]
・[すべて表示]で隠し設定を開き、[不要な参照のリスト] を選択
・参照元から除外したいドメインを追加して保存
注意点:
・デフォルトで、「自分のドメイン」およびクロスドメイン設定済みの自社ドメインは参照として扱われない
・不要な参照は データストリームごとに最大50件まで
3. データフィルタ(内部・デベロッパートラフィック)の除外
目的:
社内・自分自身のアクセス
開発・デバッグ目的のアクセス
これらをレポートから除外し、
実ユーザーの行動データをきれいに保つための機能です。
3-1. デベロッパートラフィックフィルタ
デバッグモード有効時のトラフィックを除外可能
手順の概要:
・[管理者] → [データフィルタ] → [フィルタを作成]
・種類に [デベロッパー トラフィック] を選択
フィルタ状態は
・[テスト]:レポートには出るが、「テスト データフィルタ名」ディメンションで識別可能
・[有効]:レポートから完全に除外
・[作成]で保存
3-2. 内部トラフィックフィルタ
内部トラフィックは、先にIPアドレスを“内部”として定義しておく必要があります。
手順(1)内部IPの定義:
・[管理者] → [データ ストリーム] → 対象ストリーム → [タグ設定を行う]
・[すべて表示] → [内部トラフィックの定義]
・内部と見なすIPアドレス(単一または範囲)を入力し、ルールを作成
手順(2)内部トラフィックフィルタの作成:
・再度 [管理者] → [データフィルタ] → [フィルタを作成]
・今度は [内部トラフィック] を選択
・フィルタ名・フィルタ状態(テスト/有効)を設定して作成
重要な注意点:
データフィルタは 作成時点以降のデータにのみ適用
→ 過去データには影響しない
フィルタで除外されたデータは 復元不可
→ 本番適用前に「テスト」で挙動を確認するのが安全
確認しましょう
ジェイソンさんを覚えていますか?彼は、e コマースサイトでスニーカーを販売しています。Google アナリティクスを使用して、ユーザーがさまざまな商品やスタイルを閲覧しながら、ウェブサイトをどのように利用しているかを確認しています。一方、ジェイソンさんは決済を処理するために別のウェブサイトを使用しています。そのため、ユーザーは購入を決定すると決済サイトにリダイレクトされ、注文が正常に処理されると再びメインサイトにリダイレクトされます。
A、状況整理としては、GA4 の「クロスドメイン測定」が必要になる典型的なケースを示した例ですね。
ここで確認したいポイントは “このようなサイト構造の場合、どうデータを扱うべきか” という理解です。
🧩 ジェイソンさんのケースで起きていること
メインサイト:商品閲覧・カート操作
決済サイト:外部の決済代行サービス
購入完了後:再びメインサイトへ戻る
この流れだと、GA4 はデフォルトでは次のように誤認します:
決済サイト → メインサイトへの戻りを「参照元」として扱ってしまう
その結果、決済代行業者が“集客元”としてレポートに表示される
これは本来望ましくありません。
🎯 この例で学ぶべきポイント
1. クロスドメイン測定が必要かどうか
メインサイトと決済サイトの両方を
同じユーザーの連続行動として扱いたい場合
→ クロスドメイン測定を設定する
2. 不要な参照の除外が必要かどうか
決済代行サイトを「参照元」として扱いたくない場合
→ 不要な参照として除外する
ジェイソンさんのケースでは、
クロスドメイン測定と不要な参照の除外の両方が関係する典型例です。
📌 この確認問題が意図していること
このシナリオを読んで、次のような判断ができるかを問う内容になります:
・このような構造では クロスドメイン測定を設定すべきか
・決済代行サイトを 不要な参照として除外すべきか
どちらも GA4 のデータ品質を保つために重要です。
クロスドメイン測定
この手順でレポートが途切れないようにするために、ジェイソンさんはクロスドメイン測定を実装して、両ウェブサイトでのユーザーの行動のレポートを確認することができます。クロスドメイン測定を実施するには、[管理者] メニューから [データ ストリーム] を選択します。そこで既存のウェブデータ ストリームを開き、[タグ設定を行う]、[ドメインの設定] の順に選択します。次に、決済を処理するドメインを含んだルールを作成します。
A、内容としては、「ジェイソンさんのケースではクロスドメイン測定が必要であり、その設定手順はこうなる」という確認ですね。
ポイントを整理すると、理解がより確実になります。
🔍 この説明が伝えていること(要点)
● なぜクロスドメイン測定が必要なのか
・メインサイト(商品閲覧)
・決済サイト(外部サービス)
・完了後にメインサイトへ戻る
この流れだと、GA4 はデフォルトでは 別サイトに移動した時点でユーザーを別セッション扱い してしまいます。
そのため、レポートが途切れたり、決済サイトが「参照元」として誤って表示される問題が起きます。
→ クロスドメイン測定を設定すれば、ユーザー行動を1つの流れとして扱える。
⚙️ 設定手順の骨格
1、[管理者] → [データ ストリーム] を開く
2、対象の ウェブデータストリーム を選択
3、[タグ設定を行う] → [ドメインの設定]
4、「決済サイトのドメインを含む」ルールを追加
例:
example-shop.com(メイン)
payment-service.com(決済)
これで、両サイト間の移動時に GA4 が _gl パラメータを付与し、ユーザー識別が維持されます。
🧪 正しく動作しているかの確認方法(重要)
・メインサイト → 決済サイトへ遷移したとき
URL に _gl=... で始まるパラメータが付いているか を確認する
・これが付いていれば、クロスドメイン測定が機能している証拠
📘 補足
文末にある「ヘルプセンターの記事」は、GA4 の公式ドキュメントへの誘導です。
実際の画面で設定する際は、そこを参照するとより確実に進められます。
不要な参照
不要な参照とは、データに含めたくないソースからウェブサイトにアクセスしてくるトラフィック セグメントのことで、たとえば、ウェブサイトや顧客のトランザクションを管理するのに使用しているサードパーティ製ツールなどが該当します。
A、内容としては、「不要な参照(Unwanted Referrals)」をどのように判断し、GA4で除外するか を説明したパートですね。
ジェイソンさんのケースを使って、GA4 の参照元データを“正しくする”ための考え方が整理されています。
落ち着いてポイントをまとめると、理解がより確実になります。
🎯 不要な参照とは何か
本来「集客元」として扱いたくないドメインからのアクセス のことです。
典型例:
・決済代行サービスのドメイン
・アカウント管理やパスワード復旧のための外部サービス
・自社の別システム(ログイン管理、会員情報管理など)
これらはユーザーの“流入元”ではなく、
サイト内の処理の一部として発生するだけ なので、参照元として扱うとデータが歪みます。
🧩 ジェイソンさんのケースで起きていること
・メインサイトで商品を閲覧
・パスワードを忘れたユーザーが外部のアカウント管理サイトへ移動
・その後メインサイトに戻る
この戻りが GA4 では「参照元」として記録されてしまう。
→ これを放置すると、
“アカウント管理サイトが大量のユーザーを送っている”
という誤ったレポートになります。
⚙️ 不要な参照を除外する設定手順
1、[管理者] → [データ ストリーム] を開く
2、対象の ウェブデータストリーム を選択
3,[タグ設定を行う] をクリック
4、[不要な参照のリスト] を開く
5、除外したいドメイン(例:アカウント管理サイト)を追加して保存
これで、そのドメインは参照元として扱われなくなります。
🔍 このパートの本質
GA4 の参照元データは、
“ユーザーがどこから来たか” を正しく理解するための重要な指標。
しかし、外部サービスを経由するサイト構造では、
意図しない参照元が混ざりやすい。
そのため:
クロスドメイン測定:ユーザー行動を途切れさせない
不要な参照の除外:誤った参照元を排除する
この2つを適切に設定することで、
正確な流入分析ができるようになる、という流れです。
データフィルタ
最後に、ジェイソンさんは、分析するデータにウェブサイトで買い物をするユーザーだけが含まれるようにするため、従業員やウェブサイトのデベロッパーからのトラフィックを除外したいと考えています。これを実現するには、データフィルタを使用します。
データフィルタを使用すると、受信したイベントデータを Google アナリティクスでの処理対象から除外できます。この設定は過去のデータには影響せず、過去のデータは引き続きプロパティに表示されます。データフィルタが作成されると、以後そのイベントデータは表示されなくなります。これにより、フィルタ処理されたデータは永続的に Google アナリティクスに送信されないため、後でそのデータを復元することはできません。フィルタを削除すると、以後のデータは処理できるようになりますが、すでにフィルタ処理されたデータを復元することはできません。
A、内容としては、GA4 の データフィルタ(内部トラフィック・デベロッパートラフィックの除外) の重要な性質を確認するパートですね。
ここで押さえるべきポイントを、整理してまとめておきます。
🎯 データフィルタの目的
ジェイソンさんのように、
「実際に買い物をするユーザーのデータだけを分析したい」
という場合、社内スタッフや開発者のアクセスが混ざるとデータが歪みます。
そのために使うのが データフィルタ です。
📘 データフィルタの特徴(重要ポイント)
1. フィルタは“今後のデータ”にだけ適用される
・過去のデータには影響しない
・過去のレポートはそのまま残る
2. フィルタされたデータは復元できない
・フィルタが「有効」になると、
その後に収集された該当データは GA4 に保存されない
・フィルタを削除しても、
除外されたデータが戻ってくることはない
3. フィルタを削除すると、以後のデータは再び処理される
ただし、過去に除外されたデータは戻らない
🧪 なぜ慎重に設定すべきなのか
データフィルタは強力で、
誤って有効化すると必要なデータまで消えてしまう
というリスクがあります。
そのため GA4 では、
・テストモード(データは残るが識別可能)
・有効モード(完全に除外)
の2段階が用意されています。
まずテストで挙動を確認し、問題なければ有効化するのが安全です。
🌟 このパートの本質
GA4 の分析は「正しいデータ」が前提。
そのためには、
内部アクセスや開発者アクセスを確実に除外する仕組みが必要
ということです。
データフィルタを作成するため、ジェイソンさんは再び [管理者] メニューから [データフィルタ] を選択します。次に、[フィルタを作成] を選択し、以下の 2 つのオプションのいずれかを選択します。
デベロッパー トラフィック
デバッグモードを使用しているデベロッパーのアクティビティを除外します。
内部トラフィック
1 個の IP アドレスまたは IP アドレスの範囲が設定されているユーザーを除外します。
A、内容としては、GA4 の データフィルタを作成する際に選べる2種類のフィルタ を確認するパートですね。
ここで押さえるべきポイントを、落ち着いたトーンで整理します。
📘 データフィルタ作成時に選べる2つのオプション
1. デベロッパー トラフィック
対象:デバッグモードを有効にしている開発者のアクセス
目的:テストやデバッグ中のイベントを本番データに混ぜないため
特徴:
デバッグモードのイベントを除外できる
テスト状態と有効状態を切り替えられる
テスト:データは残るが識別可能
有効:完全に除外される
2. 内部トラフィック
対象:社内スタッフや自分自身など、特定の IP アドレスからのアクセス
目的:実際のユーザー行動だけを分析するため
特徴:
事前に「内部トラフィックの定義」で IP アドレス(単一または範囲)を登録する必要がある
その後、データフィルタで「内部トラフィック」を選択して除外設定を行う
こちらも テスト と 有効 の2段階がある
🧩 このパートの本質
GA4 のデータ分析は、
“実際のユーザー行動だけを残す” ことが前提 です。
そのために:
・開発者のテストアクセス
・社内スタッフのアクセス
これらを確実に除外する仕組みが必要で、
それを実現するのが データフィルタ です。
レッスンを完了とするためには、次の設問に正解する必要があります。
データから除外する IP アドレスの範囲を定義できるものは、次のうちどれですか。
最適なものを 1 つ選択してください。
・内部トラフィック データフィルタ
・不要な参照のリスト
・クロスドメイン測定
・デベロッパー トラフィック データフィルタ
A、正解は 内部トラフィック データフィルタ です。
🎯 理由
IP アドレス(単一または範囲)を指定して除外できるのは 内部トラフィック だけです。
内部トラフィック データフィルタ
→ IP アドレスやその範囲を定義し、社内アクセスを除外できる
不要な参照のリスト
→ 除外するのは「ドメイン名」であり、IP ではない
クロスドメイン測定
→ 複数ドメイン間のユーザー識別のための設定で、IP とは無関係
デベロッパー トラフィック データフィルタ
→ デバッグモードのアクセスを除外するもので、IP を使わない
落ち着いて進めれば大丈夫です。次のステップに進みましょう。
次のステップ
ここまでで、Google アナリティクスに収集されるデータの管理方法を学習しました。次は、コンバージョンについて学びましょう。
A、良い流れで進んでいますね。
ここまでで 「データを正しく収集し、不要なものを除外する基盤づくり」 を学び終えました。
次のステップで扱う コンバージョン は、まさにその“基盤の上に乗る成果指標”です。
📘 次に学ぶ「コンバージョン」は何を意味するのか
これからのレッスンでは、次のような内容が中心になります。
● ビジネスにとって価値のある行動を定義する
購入
問い合わせ
会員登録
資料請求
など、成果とみなす行動を明確にすること
● イベントをコンバージョンとして設定する
・GA4 はすべて「イベント」ベース
・その中から「成果」とみなすものを選び、コンバージョンに昇格させる
● レポートで成果を確認できるようにする
・どの流入経路が成果につながっているか
・どのページが貢献しているか
・どのキャンペーンが効果的か
・こうした分析が可能になります。
🌱 今までの学習とのつながり
データの収集 → 整理 → フィルタリング
ここまでが“土台づくり”
コンバージョン設定 → 成果の可視化
ここからが“分析の本番”
GA4 の学習はこの順番で進むと理解が深まります。
Q、今回のレッスンは実務的な内容が多く、一度学習しただけでは理解できない内容が多かったです。
A、実務寄りの内容が一気に出てきたので、そう感じるのはとても自然です。
GA4 の クロスドメイン測定・不要な参照・データフィルタ は、どれも「概念」だけでなく「設定手順」まで含むため、初見で完全に理解するのは難しい領域です。
むしろ、一度で理解できないのが普通 と言っていいくらいです。
📘 なぜ理解が難しく感じるのか
● 仕組みが抽象的
「参照元」「セッション」「ドメイン間の識別」など、背景の仕組みを知らないとイメージしづらい。
● 設定箇所が多い
管理画面の
・データストリーム
・タグ設定
・フィルタ
など、複数の場所を行き来する必要がある。
● 実務で触れてみないと腑に落ちにくい
GA4 は「触って理解する」タイプのツールなので、
文章だけではどうしても抽象的に感じやすい。
🌱 こういう学習内容は“反復”が前提
GA4 のデータ管理は、
一度読んで理解 → 実際に触ってみる → また読み返す
という循環で、少しずつ定着していきます。
特に今回のレッスンは、
・クロスドメイン測定
・不要な参照の除外
・内部トラフィックの除外
といった「データ品質の基盤づくり」なので、最初は難しく感じて当然です。
Q、必要であれば、要点だけを再構成して整理してください。
A、もちろんです。今回のレッスン内容は情報量が多く、実務的な設定が中心でしたので、本質だけを抽出した「要点版」として再構成します。
落ち着いたトーンで、理解の軸が一本通るようにまとめました。
📘 GA4「データ管理とフィルタリング」要点まとめ
1. クロスドメイン測定(ユーザー行動を途切れさせないための設定)
● 目的
複数のドメインをまたぐユーザー行動を 1人のユーザーの連続した行動 として扱う。
● 典型例
メインサイト → 決済サイト → メインサイト
商品サイト → 会員管理サイト
● 設定の骨格
・[管理者]→[データストリーム]→対象ストリーム
・[タグ設定を行う]→[ドメインの設定]
・「◯◯ドメインを含む」ルールを追加
● 正しく動作している確認
別ドメインへ遷移した際、URL に _gl=... が付与される
2. 不要な参照(誤った参照元を除外する設定)
● 目的
本来「流入元」として扱いたくない外部サービスを参照元から除外する。
● 典型例
・決済代行サービス
・パスワード復旧サービス
・会員管理システム
・技術的な中継ドメイン
● 設定の骨格
・[管理者]→[データストリーム]→対象ストリーム
・[タグ設定を行う]→[不要な参照のリスト]
・除外したいドメインを追加
3. データフィルタ(内部・開発者アクセスを除外する設定)
● 目的
分析対象を「実際のユーザー」に限定するため、
社内アクセス・開発者アクセスを除外する。
● デベロッパートラフィック
・デバッグモードのアクセスを除外
・フィルタ状態:
テスト:データは残るが識別可能
有効:完全に除外
● 内部トラフィック
・IP アドレス(単一または範囲)で社内アクセスを除外
・手順は2段階
1、[内部トラフィックの定義]で IP を登録
2、[データフィルタ]で「内部トラフィック」を選択して除外設定
● 注意点(非常に重要)
・フィルタは 作成後のデータにのみ適用
・過去データは変わらない
・除外されたデータは復元できない
・本番適用前に「テスト」で確認するのが安全
🌟 全体の本質
GA4 の分析は、
「正しいデータだけを残す」ことが前提。
そのために必要なのが:
1、行動を途切れさせない(クロスドメイン)
2、誤った参照元を排除する(不要な参照)
3、社内・開発者アクセスを除外する(データフィルタ)
この3つです。
Q、図解版
・3つの設定の違いを1枚にまとめた比較表
・実務での判断基準
などにも再構成してください。
A、承知しました。
今回のレッスン内容を 図解イメージ/比較表/実務判断基準 の3点で再構成します。
落ち着いたトーンで、実務で迷わない“判断の軸”が一本通るように整理します。
🖼️ 図解版:GA4「データ管理の3本柱」
┌──────────────────────────────┐
① クロスドメイン測定(ユーザー行動の連続性)
────────────────────────────
・複数ドメインをまたぐ行動を「1人のユーザー」として扱う
・例:商品サイト → 決済サイト → 完了ページ
└──────────────────────────────┘
┌──────────────────────────────┐
② 不要な参照の除外(誤った流入元の排除)
────────────────────────────
・外部サービスが「参照元」として誤計測されるのを防ぐ
・例:決済代行、パスワード復旧サービス、会員管理サイト
└──────────────────────────────┘
┌──────────────────────────────┐
③ データフィルタ(内部・開発者アクセスの除外)
────────────────────────────
・社内スタッフや開発者のアクセスを除外してデータを純化
・例:社内IP、デバッグモードのアクセス
└──────────────────────────────┘
📊 3つの設定の違いを1枚にまとめた比較表
項目 クロスドメイン測定 不要な参照の除外 データフィルタ(内部/開発者)
目的 ユーザー行動を途切れさせない 誤った参照元を排除 社内・開発者アクセスを除外
対象 複数の自社ドメイン 外部サービスのドメイン IPアドレス / デバッグモード
設定場所 データストリーム → ドメイン設定 データストリーム → 不要な参照 管理者 → データフィルタ
影響範囲 セッション・ユーザー識別 参照元レポート 全イベントデータ
過去データへの影響 なし なし なし(除外後は復元不可)
典型例 商品サイト→決済サイト PayPal、パスワード復旧サイト 社内IP、開発者のテスト
🧭 実務での判断基準(迷わないためのチェックリスト)
① クロスドメイン測定が必要なケース
・別ドメインに移動しても 同じユーザーの行動として扱いたい
・決済サイト・会員管理サイトなど 外部サービスを経由する
・ドメイン間移動で セッションが途切れて困っている
→ ユーザー行動の連続性を保ちたいときに設定
② 不要な参照の除外が必要なケース
・レポートに 意図しないドメインが参照元として表示される
・決済代行やパスワード復旧サービスが 流入元扱いになっている
・「どこから来たか」の分析が歪んでいる
→ 参照元レポートを正しくしたいときに設定
③ データフィルタ(内部・開発者)が必要なケース
・社内スタッフのアクセスが多い
・開発者が頻繁にテストしている
・実際のユーザー行動だけを分析したい
・データが不自然に増えている
→ 分析対象を“実ユーザー”に限定したいときに設定
🌟 まとめ:3つの設定は役割がまったく違う
クロスドメイン測定:ユーザー行動の“つながり”を守る
不要な参照の除外:流入元の“正確さ”を守る
データフィルタ:データの“純度”を守る
この3つが揃うことで、GA4のデータは初めて「分析に耐えられる品質」になります。