← 博客

我如何在合规产品管理工作中使用大语言模型

AI/大语言模型 合规产品管理 产品管理

在内容政策与监管合规领域深耕多年,我对"AI将自动化X"这类说法素来持审慎态度。我的实际发现更为具体:在合规产品管理工作中,有若干特定任务能借助大语言模型显著压缩时间,也有若干任务完全不适用、不应轻信。这一区别至关重要。

需求提取

最可靠的用法是解析法规条文。每当新法律或监管指引出台,产品经理的首要任务是准确理解其具体要求——特别是须捕获哪些数据、须维护哪些类别,以及输出须采用何种格式。

具体流程:将法规或指引文件的全文输入模型,要求其列举所有须报告的数据要素。对每个要素,询问其描述是否与现有数据基础设施的输出相对应。然后将这一输出与平台数据系统实际生成的内容进行比对,并由熟悉这些系统的领域专家共同参与核验。

这一方法奏效,是因为法规文本措辞精确,解析时无需深度情境判断。模型执行的是结构化信息提取——提炼需求列表并加以组织整理——这是其擅长且可靠的任务。其局限在于对模糊定义的解读,这仍然需要法律判断。模型会对模糊要求的含义给出看似自信的答案,但该答案是否与监管机构对同一措辞的解读一致,并不确定。

真正的价值在新法规与现行法规存在交叉时得到充分体现。加州AB 587出台时,我们已在依据欧盟DSA Article 15进行申报。两者的类别框架有部分重叠,但并不完全对应——AB 587的"虚假信息或错误信息"在DSA中没有直接对应项,而DSA的Article 16通知机制在加州法规中也没有对应机制。将两份法规文本分别进行提取,再与现有数据基础设施做结构化对比,能精确识别出差距所在:哪些数据我们已有,哪些需要补充,哪些需要先做定义决策才能启动数据工作。

跨法域差距分析

相关的一个用法,是在监管指引持续演进的过程中维护跨法域需求对照表。DSA委员会于2024年发布了统一报告模板;当H2 2025版本更新了自动化检测工具的精确率与召回率要求时,我需要准确了解相较于H1模板具体发生了哪些变化,以及是否影响我们已有的生产内容。

工作流程:按法域维护一张结构化需求表——DSA Article 15、DSA Article 42、AB 587、S895等——并设置具体数据要求和当前基础设施状态两列。每当新指引发布,将新文本与现有表格对比,标记出变更之处。模型负责完成比对;产品经理的判断在于评估被标记的变更是否需要工程工作、定义决策或无需处理。

这比凭记忆将完整的更新指引文件与旧版本逐一对照更高效,也更可靠——模型能捕捉到密集监管文本中容易遗漏的内容,尤其是埋藏在脚注中的测量方法或报告节奏的变化。

对照法定清单进行草稿审查

在任何监管报告提交法务审核之前,我都会将接近定稿的草稿与相关法定清单进行逐项比对。提示词很直接:这是报告草稿,这是相关法规,请识别法规中有哪些内容在报告中未被涉及,并标记报告中与法规要求存在明显冲突的内容。

这一步骤能捕捉长篇文档中容易遗漏的疏漏——某个子条款要求的披露在修订过程中被删掉了,或者法规中某个类别在报告里被无意合并进了另一个类别。这类错误往往在法务审核中才被发现,进而需要全面修订,而此时距申报截止日期已所剩无几。

这并不能取代法务审核。模型会漏掉依赖具体情境的解读,也无法发现实质性准确性问题——它能告诉你报告包含了申诉部分,但无法判断申诉数量是否有误。不过,作为一道预检关卡,它能有效降低法务审核时暴露结构性遗漏(而非实质性问题)的概率。

不适用的场景

任何需要对监管意图进行判断的任务——监管机构实际上可能执法的内容是什么、特定披露方式是否满足措辞存在歧义的要求——效果都不理想。模型会生成听起来很有把握的答案,但这一答案是否与监管机构对同一措辞的解读一致,并不确定;而在合规工作中,这种差异至关重要。

同样,任何需要了解具体执法历史、近期委员会指引或训练截止日期之后的待定法规的任务,都不可靠。模型不知道自己不知道什么,而监管合规是一个基于过期信息采取行动会带来真实风险的领域。

真正有效的模式:将大语言模型用于结构化文本任务——提取、比对、清单核查——这些任务的输入和输出定义明确,领域专家可以验证其输出结果。不要用它来回答某项要求在执法情境中意味着什么,或监管机构将如何回应特定的披露方式。这些问题需要的是模型不具备、也无法可靠模拟的专业判断。

esc