写作
关于产品管理、人工智能、合规与语言的思考。
我发布的VLOP仪表盘将30项服务汇聚在同一视图中,但理解其局限性与理解数据本身同等重要。最关键的一点:各平台的类别定义并未标准化。TikTok所称的"仇恨言论"与Meta所称的"仇恨言论",是由各平台自身政策界定的,而非由DSA统一规定,因此跨平台的数量比较,本质上是在比较各自内部定义的不同基准。其次,这些数据均为自我申报,现行框架下不要求第三方审计。此外,部分平台的数据汇总方式有所不同——Google将6项服务分别报告,而其他平台则在平台层面汇总——这会影响单项服务数据的解读。值得一提的是,DSA观察站在1月份曾指出,删除数量和申诉数据无法说明内容审核是否准确或适度,Article 15.1(e)的"准确性指标"要求此前形同虚设——但该文章发表于首批统一格式报告发布之前。本仪表盘所依据的H2 2025报告遵循新模板,该模板已纳入精确率(precision)和召回率(recall)指标,这一具体缺口已得到填补。自我申报数据与类别定义不统一的结构性问题仍然存在。该仪表盘最适合用于追踪单一平台内部的数量变化趋势;跨平台的规范性比较则需审慎对待。
我发布了一个新的交互式仪表盘,汇聚了2025年下半年欧盟《数字服务法》(DSA)各大超大型在线平台(VLOP)及超大型在线搜索引擎(VLOSE)的透明度报告数据。该仪表盘整合了来自30项服务的数据,涵盖Google(6项产品)、X、TikTok、Meta(Facebook和Instagram)、Pinterest、全球速卖通、亚马逊、领英、Snapchat、Booking.com、SHEIN、Temu、Zalando、Wikimedia(6项服务)等,形成单一跨平台视图。内容涵盖DSA四大核心报告类别:通知(Notices)、自主处置措施(违法内容与违规内容分项呈现)、政府命令(Government Orders)以及申诉(Appeals)。支持按平台、服务、内容类别和关键词筛选,所有数据均在浏览器本地处理。
以下是真正沉淀下来的几种用法。需求提取:将法规或监管指引文本输入模型,让其列举所有需报告的数据要素,再与现有数据基础设施的输出进行比对——尤其适用于新法律(如加州AB 587)与现行法律(如欧盟DSA Article 15)在范围上存在交叉但不完全重合的情况。差距分析:以结构化表格管理跨法域的合规要求,利用模型识别新指引发布后的变更之处。草稿审查:在提交法务审核前,将接近定稿的报告草稿与法定清单逐项比对,排查遗漏。这些用法都不能替代专业判断,但能显著压缩从"出现新监管要求"到"明确需要构建什么"之间的时间。
仪表盘上线后,以下三点是我认为最值得深入探索的发现。首先,诽谤类请求的国家分布与政府批评类请求截然不同——法国、德国、印度等大型民主国家在诽谤类请求中占主导(法院积极发出删除令),而政府批评类请求则集中于较少数国家。其次,删除率并非固定不变,而是在13个报告期间持续波动——你可以观察到特定国家或产品的合规立场在不同时期的收紧与放松。第三,请求方类型至关重要——法院命令与警方请求在操作层面的分量不同,且两者的比例构成也在逐年变化。以上所有内容,只需在仪表盘上调整一两个筛选条件即可一览无遗。
我基于Google公开的政府内容删除请求数据,搭建了一个多年度趋势分析仪表盘——将Google原本按报告期分散呈现的数据,整合为可连贯探索的时间序列视图。数据集覆盖2019年至2025年上半年共13个报告期,涉及160个国家/地区、42个Google产品及22类删除原因。2014年至2024年间,我曾担任Google透明度报告大中华区版块的主要作者,对这套数据有着深入了解。每种筛选组合——国家、请求方、产品、原因——均可生成对应的时间趋势图,并附有删除率变化的专项图表。所有数据均在浏览器本地加载处理。
两项法律均要求社交媒体公司就内容审核发布透明度报告,但其覆盖范围和数据要求存在差异,并对报告基础设施产生实质影响。AB 587侧重政策披露:平台须提交服务条款,并说明其在10类内容(包括仇恨言论、骚扰和外国政治干预)上的执行情况,每半年向加州检察长提交报告。S895则更具运营操作性:每季度向纽约州检察长提交报告,涵盖被处理内容数量、被封禁账号数量及已处理申诉数量,并按内容类别细分。实践层面的结论是:AB 587需要叙述性说明和政策映射,S895需要结构化的运营数据。两者的重叠程度足以共享审核周期,但底层数据要求的差异足以需要维护独立的数据管道。
两份州级社交媒体透明度报告现已完成申报——Roblox的加利福尼亚州AB 587(2025年下半年)与纽约州S895(2025年Q4)报告。两项法规在覆盖范围上有所重叠,但具体要求各有侧重:AB 587侧重于内容审核政策及其执行情况的披露,S895则要求提供针对特定账号与内容所采取措施的更细粒度数据。并行推进两份申报,意味着既要维护各自独立的数据轨道,又要在法务、政策与工程团队之间共享跨职能审核资源——这也成为构建更稳健报告基础设施的有效契机。
欧盟《数字服务法》(DSA)的透明度报告要求常被简化为"发布一份内容审核报告",但实际的法定义务远比这具体。Article 15要求所有中介服务提供者发布年度透明度报告,涵盖收到的成员国主管机构命令数量、依据Article 16收到的通报数量、自主发起的内容审核措施,以及自动化工具的使用情况。对于VLOP和VLOSE,Article 42进一步追加了要求:每六个月报告一次(而非每年)、按内容类别和语言提供详细分类数据、决策时间线数据、申诉相关信息,以及政府命令数据。仅处理通报的平台与VLOP的报告要求之间存在显著差距,这对数据基础设施影响深远:VLOP需要专门构建的报告系统,而非临时性的数据导出。
Roblox发布了其2025年下半年欧盟《数字服务法》(DSA)透明度报告。我全程主导了这份报告的交付工作——梳理Article 15条款下的数据要求,构建横跨法务、政策与工程团队的跨职能生产工作流,并推动按时发布。报告涵盖2025年7月1日至12月31日期间Roblox在欧盟服务中的内容审核活动,包括收到的通知及所采取的措施。同期,Roblox还同步发布了《网络恐怖主义内容条例》(TCO)透明度报告。