T-SBIAORG 0002-2025 基于大语言模型的药物警戒个例安全性报告人工智能辅助信息提取规范

ICS11.120.10 CCS C 10 团体标准 T/SBIAORG 0002—2025 2025‑05‑08发布 2025‑05‑09实施上海市生物医药行业协会中国标准出版社发布出版基于大语言模型的药物警戒个例安全性报告人工智能辅助信息提取规范 Specifications of AI‑assisted data extraction for individual case safety reports in pharmacovigilance based on large language models 全国团体标准信息平台 ⅠT/SBIAORG 0002—2025 目次前言…………………………………………………………………………………………………………… Ⅲ 1范围………………………………………………………………………………………………………… 1 2规范性引用文件 …………………………………………………………………………………………… 1 3术语和定义 ………………………………………………………………………………………………… 1 4总体考量 …………………………………………………………………………………………………… 2 5大语言模型在个例安全性报告信息提取场景下的系统实施 …………………………………………… 2 6系统使用和质量控制 ……………………………………………………………………………………… 4 7数据安全和隐私保护 ……………………………………………………………………………………… 6 8利益相关方沟通 …………………………………………………………………………………………… 7 参考文献 ………………………………………………………………………………………………………… 8 中国标准出版社全国团体标准信息平台 T/SBIAORG 0002—2025 前言本文件按照 GB/T1.1—2020《标准化工作导则第 1部分：标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由上海市药品和医疗器械不良反应监测中心提出。本文件由上海市生物医药行业协会归口。本文件起草单位：上海市药品和医疗器械不良反应监测中心、上海罗氏制药有限公司、上海商汤科技开发有限公司、上海复宏汉霖生物制药有限公司、上海复星医药（集团）股份有限公司、江苏恒瑞医药股份有限公司。本文件主要起草人：许晋、胡骏、巢艾伦、杨依晗、栾国琴、黄天娇、袁博、步伐、浦义虎、韩澎、黎洋。 Ⅲ中国标准出版社全国团体标准信息平台 1T/SBIAORG 0002—2025 基于大语言模型的药物警戒个例安全性报告人工智能辅助信息提取规范 1范围本文件规定了应用大语言模型技术处理药物警戒个例安全性报告数据的考量点与要求。本文件适用于药品上市许可持有人、境外上市许可持有人的境内责任人、药品经营企业等组织和机构。此外，也能为药品监管部门、医疗机构及相关技术开发商和服务提供商，在开发、实施和使用基于大语言模型的药物警戒数据处理系统时提供参考。 2规范性引用文件本文件没有规范性引用文件。 3术语和定义下列术语和定义适用于本文件。 3.1 药物警戒 pharmacovigilance 对药品不良反应及其他与用药有关的有害反应进行监测、识别、评估和控制。［来源：《中华人民共和国药品管理法》，第十二条］ 3.2 大语言模型 large language model ；LLM 生成式人工智能的一种，专注于文本生成的模型。［来源：《欧洲药品管理局在监管科学及药品监管活动中使用大型语言模型的指导原则》，第二部分］ 3.3 生成式人工智能技术 generative artificial intelligence 具有文本、图片、音频、视频等内容生成能力的模型及相关技术。［来源：《生成式人工智能服务管理暂行办法》，第二十二条］ 3.4 微调fine‑tuning 为提升人工智能模型的预测精确度，一种先以大型广泛领域数据集训练，再以小型专门领域数据集继续训练的附加训练技术。［来源：GB/T41867—2022，3.2.31］ 3.5 多模态数据 multi‑modal data 多种形态的数据。注：包含结构化数据（例如业务系统数据等）、半结构化数据（例如XML文件、JSON文件等）和非结构化数据（例如文本、语音和图像视频等）。［来源：GB/T42135—2022，3.1］中国标准出版社全国团体标准信息平台 2T/SBIAORG 0002—2025 3.6 知识knowledge 通过学习、实践或探索所获得的认识、判断或技能。［来源：GB/T23703.2—2010，2.1］ 3.7 知识库 knowledge base 用于知识管理的一种特殊的数据库，以便于有关领域知识的采集、整理及提取。 3.8 词元token 文档中非空的连续字形或音素序列。［来源：ISO24611：2012，3.21］ 3.9 提示词 prompt 提示语使用大模型进行微调或下游任务处理时，插入到输入样本中的指令或信息对象。［来源：GB/T45288.1—2025，3.5］ 3.10 提示工程 prompt engineering 人工智能中执行任务的描述文本被嵌入到输入中的一个概念。 4总体考量在大语言模型系统的开发、部署、验证和质量控制的全生命周期中，应遵循以下原则，以确保安全、负责和有效地使用 LLM系统。 a）人工审查和监督（Human Oversight ）：确保LLM系统在整个开发和使用过程中始终有人工审查和监督。 b）可问责（Accountability ）：建立明确的责任分配和归属制度。 c）透明性（Transparency ）：保持系统的透明度，并能够向相关方提供准确和及时的信息，包括系统的功能、操作流程、使用情况和局限性等。 d）可解释性（Explainability ）：提供LLM决策过程的可理解解释，包括完整的日志和记录等，以便在必要时进行审查和分析，确保系统操作的可追溯性。 e）风险管理（Risk Management ）：采用基于风险的方法来管理 LLM应用，将LLM系统纳入药物警戒质量管理系统，持续识别、评估并减轻潜在的风险。 f）数据保护和隐私保护（Data Protection and Privacy Protection ）：加强数据保护和隐私保护，确保个人数据和敏感信息的处理符合《中华人民共和国个人信息保护法》《中华人民共和国数据安全法》《中华人民共和国网络安全法》及数据跨境等相关法律法规要求。 g）治理（Governance ）：建立有效的治理框架，以监督和规范 LLM系统的使用。 h）持续学习（Continuously Learning ）：鼓励组织和用户持续学习和适应合理合规使用 LLM系统，以使LLM的使用价值最大化。 5大语言模型在个例安全性报告信息提取场景下的系统实施 5.1模型部署和架构设计 5.1.1大语言模型的选择 5.1.1.1宜选择与应用场景匹配的大语言模型。例如，个例报告源文件可能较长，宜优先考虑在长文本中国标准出版社全国团体标准信息平台 3T/SBIAORG 0002—2025 能力具有优势的大语言模型，大语言模型支持的上下文词元（Token）宜不低于 128K；个例报告信息提取的规则较多，应优先选取在逻辑推理方面能力较强的大模型；个例报告源文件包含文本、图片、语音等多种格式，宜考虑在多模态数据处理能力具有优势的大语言模型；宜综合应用场景复杂度、技术成熟度、成本预算等因素选择合适的商业版大语言模型或者开源版大语言模型。 5.1.1.2宜选择支持持续预训练微调和微调定制化的大语言模型，以更好地匹配药物警戒应用场景。 5.1.1.3宜考虑组织或用户对模型部署的具体需求，选择符合需求的大语言模型。 5.1.1.4宜选择具备持续学习和更新能力的大语言模型，以满足未来业务的可持续发展。 5.1.2模型调优调优的候选技术手段可包括提示工程、知识库管理、模型微调等，旨在提高大模型输出结果的准确率。 a）提示工程：采用在提示词中加入少量示例，加入思维链引导模型推理，拆分提取任务（如先提取怀疑用药，再提取怀疑用药的属性信息，包括开始日期、适应症等），提示语结构优化等基于提示语的调优手段，提升大语言模型对任务的理解，降低大语言模型逻辑推理复杂度，从而提高输出结果的准确率。 b）知识库管理：对于需要补充参考语料（与任务相关的额外背景信息、领域知识或示例等）进行提取的信息，可将补充语料放入外部知识库中。宜参考补充制药企业遵循的政策法规要求，如《药物警戒质量管理规范》《个例药品不良反应收集和报告指导原则》《个例安全性报告 E2B（R3）区域实施指南》等，以及领域知识，如MedDRA （Medical Dictionary for Regulatory Activities ）、 CTCAE（Common Terminology Criteria for Adverse Events ）等。 c）模型微调：模型微调通常