写作
构建VLOP跨平台DSA视图:数据无法告诉你的事
我两天前发布的VLOP仪表盘将30项服务汇聚在同一视图中。这具有切实的价值——这是这套数据首次能够以交互式格式跨平台聚合,而H2 2025报告也是首批完整遵循委员会统一模板的报告。但局限性与数据本身同等重要,其中部分是DSA透明度报告机制本身的结构性问题,而非本仪表盘的特有缺陷。
类别定义并未标准化
最重要的局限:TikTok所称的"仇恨言论"与Meta所称的"仇恨言论",是由各平台自身的内容政策界定的,而非由DSA统一规定。DSA要求平台按内容类别报告,并规定了类别列表,但并未界定哪些内容属于各类别——这由平台政策自行决定。
这意味着仇恨言论政策定义较窄的平台,其数量会低于定义较宽的平台,即便两者实际审核的内容量相当。仪表盘中的跨平台数量比较,是各平台自定义类别之间的比较,而非对同一底层构念的比较。
DSA观察站在1月份曾指出,此前的报告已使准确性要求实际上流于形式。委员会统一报告模板——H2 2025报告首次完整遵循——新增了自动化检测工具的精确率(precision)和召回率(recall)指标,填补了这一具体缺口。精确率和召回率确实比原始删除数量更具信息量。但各平台自身类别定义内的精确率和召回率,仍无法解决跨平台可比性问题,因为类别本身并非以一致方式界定。
数据为自我申报,不经第三方审计
仪表盘中的每一个数字均由平台自我申报。DSA目前不要求对透明度报告数据进行第三方核实——没有外部审计机构确认数字的准确性、分类方法在各报告期内的一致性,或数据提取流程的可靠性。
这并不意味着数字有误。平台承担法律合规义务,报告在发布前经过内部法务和政策团队审核。但这意味着数据应被视为自我申报的运营数据:适合用于理解单一平台内部的趋势和规律,作为绝对数量的精确测量则可靠性较低,且无法与外部参照点进行核实。
汇总方式存在差异
Google将其六项被认定服务分别报告:搜索、地图、Play、购物、YouTube,以及第六项服务条目。Meta则合并报告Facebook和Instagram的汇总数据。其他平台在平台层面汇总报告。
这影响着数字的解读方式。Google任何单项服务的数字,都会小于那些汇总报告的平台的对应数字。仪表盘中Google六项条目的总和,才是与Meta单一合并条目相对应的可比数字——但仪表盘也允许将Google搜索单项与TikTok的平台整体总量进行比较,而这并非一个有意义的比较。谨慎使用筛选条件至关重要。
如何可靠地使用本仪表盘
仪表盘最适合用于追踪单一平台在同一时期内的数量变化趋势。这是在一致的方法论和类别定义框架内的同类比较——对于特定平台,各报告期的数字含义相同,即便与其他平台在同一类别下的数字含义不同。
它也适合用于了解整个生态系统的大致轮廓:哪些类别在各平台产生的通知最多,哪些平台正在处理的申诉量远高于其他平台,政府命令在地域上的分布状况如何。这些规律在数量级差异层面是可见的,此时类别定义的分歧影响相对有限。
它不适合用于对绝对数量进行精确的跨平台比较,也不适合据此得出哪个平台审核更多或更好的规范性结论。这类结论需要DSA报告中尚不存在的类别定义标准化和审计标准。仍然存在的结构性问题——自我申报数据、类别定义不统一——是数据能够支持哪些结论的真实约束,将数字视为比实际情况更具可比性,只会得出具有误导性的结论。