VLOPのDSAデータを横断的に見るということ：データが語らないこと

2日前に公開したVLOPダッシュボードは30サービスを単一のビューに統合しています。これは真に有用です、このデータがインタラクティブな形式でプラットフォームをまたいで集計可能になったのは初めてであり、2025年下半期のレポートは委員会の統一テンプレートに初めて完全に準拠したものです。ただし、限界はデータと同様に重要であり、その一部はこの特定のダッシュボードの特性ではなく、DSA透明性報告がどのように機能しているかという構造的な問題です。

カテゴリ定義は標準化されていない

最も重要な限界：TikTokが「ヘイトスピーチ」と呼ぶものとMetaが「ヘイトスピーチ」と呼ぶものは、DSAではなく各プラットフォーム独自のコンテンツポリシーによって定義されています。規制はプラットフォームにコンテンツカテゴリ別の報告を求め、カテゴリのリストを指定しています。しかし各カテゴリにどのコンテンツが該当するかは定義しておらず、それはプラットフォームポリシーに委ねられています。

つまり、ヘイトスピーチポリシーの定義が狭いプラットフォームは、より広い定義のプラットフォームより低い数値を示すことになります。たとえ同等の量のコンテンツをモデレートしていても。ダッシュボード上のプラットフォーム間の件数比較は、プラットフォーム定義カテゴリ同士の比較であり、一貫した基礎となる概念の比較ではありません。

DSAオブザーバトリーは1月に、以前の報告が精度要件を実質的に意味のないものにしていると論じました。委員会の統一テンプレート（2025年下半期のレポートが初めて準拠した）は自動検知ツールの精度と再現率の指標を追加しており、この特定のギャップに対処しています。精度と再現率は生の削除件数より真に情報量が多いものです。ただし各プラットフォーム独自のカテゴリ定義内での精度と再現率は、カテゴリ自体が一貫して定義されていないため、プラットフォーム間比較可能性の問題を解決しません。

データは第三者監査なしの自己申告

ダッシュボード上のすべての数値はプラットフォームによる自己申告です。DSAは現在、透明性レポートデータの第三者検証を求めていません、外部の監査機関が数値の正確性、報告期間をまたいだカテゴリ分類方法の一貫性、またはデータ抽出プロセスの信頼性を確認するわけではありません。

これは数値が誤りだということを意味しません。プラットフォームには法的コンプライアンス義務があり、レポートは公開前に内部の法務・ポリシーチームによってレビューされます。しかし、データは自己申告の運用データとして扱うべきであることを意味します。プラットフォーム内のトレンドやパターンを理解するのに有用であり、絶対量の精確な測定としては信頼性が低く、外部の参照点と照合して検証することはできません。

集計方法が異なる

Googleは指定された6サービスを別々に報告しています。検索、マップ、Play、ショッピング、YouTube、そして6番目のサービスエントリ。Metaはフェイスブックとインスタグラムを合算した集計数値を報告しています。他のプラットフォームはプラットフォームレベルで報告しています。

これは数値の読み取り方に影響します。単一サービスのGoogleのエントリは、集計で報告するプラットフォームの数値より小さく見えます。ダッシュボード上でのGoogleの6エントリ合計がMetaの単一合算エントリと比較すべき数値ですが、ダッシュボードは誤ってGoogle検索単体をTikTokのプラットフォーム全体の合計と比較することも可能にしており、それは意味のある比較ではありません。フィルタリングを慎重に行うことが重要です。

ダッシュボードを信頼性高く使うには

ダッシュボードが最も有用なのは、単一プラットフォーム内での件数トレンドの時系列追跡です。これは一貫した方法論とカテゴリ定義内でのような条件同士の比較であり、数値は、別プラットフォームの同カテゴリの数値と同じ意味を持たないとしても、あるプラットフォームについて報告期間をまたいで同じ意味を持ちます。

エコシステムの大まかな形状を理解するためにも有用です。どのカテゴリがプラットフォームをまたいで最も多くの通知を生成しているか、どのプラットフォームが他と比べて実質的に多くの異議申し立てを処理しているか、政府命令の状況が地理的にどのように見えるか。これらは桁違いの差のレベルで見えるパターンであり、カテゴリ定義の乖離はそれほど影響しません。

絶対件数の精確なプラットフォーム間比較や、どのプラットフォームがより多くまたはより良くモデレートしているかという規範的な結論の導出には、あまり適しません。そうした結論は、DSA報告にはまだ存在しないカテゴリ定義と監査基準を必要とします。残存する構造的な問題（自己申告データ、一貫性のないカテゴリ定義）は、データが支持できることの真の制約であり、数値を実際より比較可能なものとして扱うと誤解を招く結論が生まれます。