构建VLOP跨平台DSA视图：数据无法告诉你的事

我两天前发布的VLOP仪表盘将30项服务汇聚在同一视图中。这具有切实的价值，这是这套数据首次能够以交互式格式跨平台聚合，而H2 2025报告也是首批完整遵循委员会统一模板的报告。但局限性与数据本身同等重要，其中部分是DSA透明度报告机制本身的结构性问题，而非本仪表盘的特有缺陷。

类别定义并未标准化

最重要的局限：TikTok所称的"仇恨言论"与Meta所称的"仇恨言论"，是由各平台自身的内容政策界定的，而非由DSA统一规定。DSA要求平台按内容类别报告，并规定了类别列表，但并未界定哪些内容属于各类别，这由平台政策自行决定。

这意味着仇恨言论政策定义较窄的平台，其数量会低于定义较宽的平台，即便两者实际审核的内容量相当。仪表盘中的跨平台数量比较，是各平台自定义类别之间的比较，而非对同一底层构念的比较。

DSA观察站在1月份曾指出，此前的报告已使准确性要求实际上流于形式。委员会统一报告模板，H2 2025报告首次完整遵循，新增了自动化检测工具的精确率（precision）和召回率（recall）指标，填补了这一具体缺口。精确率和召回率确实比原始删除数量更具信息量。但各平台自身类别定义内的精确率和召回率，仍无法解决跨平台可比性问题，因为类别本身并非以一致方式界定。

数据为自我申报，不经第三方审计

仪表盘中的每一个数字均由平台自我申报。DSA目前不要求对透明度报告数据进行第三方核实，没有外部审计机构确认数字的准确性、分类方法在各报告期内的一致性，或数据提取流程的可靠性。

这并不意味着数字有误。平台承担法律合规义务，报告在发布前经过内部法务和政策团队审核。但这意味着数据应被视为自我申报的运营数据：适合用于理解单一平台内部的趋势和规律，作为绝对数量的精确测量则可靠性较低，且无法与外部参照点进行核实。

汇总方式存在差异

Google将其六项被认定服务分别报告：搜索、地图、Play、购物、YouTube，以及第六项服务条目。Meta则合并报告Facebook和Instagram的汇总数据。其他平台在平台层面汇总报告。

这影响着数字的解读方式。Google任何单项服务的数字，都会小于那些汇总报告的平台的对应数字。仪表盘中Google六项条目的总和，才是与Meta单一合并条目相对应的可比数字，但仪表盘也允许将Google搜索单项与TikTok的平台整体总量进行比较，而这并非一个有意义的比较。谨慎使用筛选条件至关重要。

如何可靠地使用本仪表盘

仪表盘最适合用于追踪单一平台在同一时期内的数量变化趋势。这是在一致的方法论和类别定义框架内的同类比较，对于特定平台，各报告期的数字含义相同，即便与其他平台在同一类别下的数字含义不同。

它也适合用于了解整个生态系统的大致轮廓：哪些类别在各平台产生的通知最多，哪些平台正在处理的申诉量远高于其他平台，政府命令在地域上的分布状况如何。这些规律在数量级差异层面是可见的，此时类别定义的分歧影响相对有限。

它不适合用于对绝对数量进行精确的跨平台比较，也不适合据此得出哪个平台审核更多或更好的规范性结论。这类结论需要DSA报告中尚不存在的类别定义标准化和审计标准。仍然存在的结构性问题，自我申报数据、类别定义不统一，是数据能够支持哪些结论的真实约束，将数字视为比实际情况更具可比性，只会得出具有误导性的结论。