说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
ICS11.120.10 CCS C 10 团 体 标 准 T/SBIAORG 0002—2025 2025‑05‑08发布 2025‑05‑09实施 上海市生物医药行业协会 中 国 标 准 出 版 社发 布 出 版基于大语言模型的药物警戒个例安全性 报告人工智能辅助信息提取规范 Specifications of AI‑assisted data extraction for individual case safety reports in pharmacovigilance based on large language models 全国团体标准信息平台 ⅠT/SBIAORG 0002—2025 目 次 前言…………………………………………………………………………………………………………… Ⅲ 1范围………………………………………………………………………………………………………… 1 2规范性引用文件 …………………………………………………………………………………………… 1 3术语和定义 ………………………………………………………………………………………………… 1 4总体考量 …………………………………………………………………………………………………… 2 5大语言模型在个例安全性报告信息提取场景下的系统实施 …………………………………………… 2 6系统使用和质量控制 ……………………………………………………………………………………… 4 7数据安全和隐私保护 ……………………………………………………………………………………… 6 8利益相关方沟通 …………………………………………………………………………………………… 7 参考文献 ………………………………………………………………………………………………………… 8 中国标准出版社 全国团体标准信息平台 T/SBIAORG 0002—2025 前 言 本文件按照 GB/T1.1—2020《标准化工作导则 第 1部分:标准化文件的结构和起草规则 》的规定 起草。 请注意本文件的某些内容可能涉及专利 。本文件的发布机构不承担识别专利的责任 。 本文件由上海市药品和医疗器械不良反应监测中心提出 。 本文件由上海市生物医药行业协会归口 。 本文件起草单位 :上海市药品和医疗器械不良反应监测中心 、上海罗氏制药有限公司 、上海商汤科技 开发有限公司 、上海复宏汉霖生物制药有限公司 、上海复星医药 (集团)股份有限公司 、江苏恒瑞医药股份 有限公司 。 本文件主要起草人 :许晋、胡骏、巢艾伦、杨依晗、栾国琴、黄天娇、袁博、步伐、浦义虎、韩澎、黎洋。 Ⅲ中国标准出版社 全国团体标准信息平台 1T/SBIAORG 0002—2025 基于大语言模型的药物警戒个例安全性 报告人工智能辅助信息提取规范 1范围 本文件规定了应用大语言模型技术处理药物警戒个例安全性报告数据的考量点与要求 。 本文件适用于药品上市许可持有人 、境外上市许可持有人的境内责任人 、药品经营企业等组织和机 构。此外,也能为药品监管部门 、医疗机构及相关技术开发商和服务提供商 ,在开发、实施和使用基于大 语言模型的药物警戒数据处理系统时提供参考 。 2规范性引用文件 本文件没有规范性引用文件 。 3术语和定义 下列术语和定义适用于本文件 。 3.1 药物警戒 pharmacovigilance 对药品不良反应及其他与用药有关的有害反应进行监测 、识别、评估和控制 。 [来源: 《中华人民共和国药品管理法 》 ,第十二条 ] 3.2 大语言模型 large language model ;LLM 生成式人工智能的一种 ,专注于文本生成的模型 。 [来源: 《欧洲药品管理局在监管科学及药品监管活动中使用大型语言模型的指导原则 》 ,第二部分 ] 3.3 生成式人工智能技术 generative artificial intelligence 具有文本 、图片、音频、视频等内容生成能力的模型及相关技术 。 [来源: 《生成式人工智能服务管理暂行办法 》 ,第二十二条 ] 3.4 微调fine‑tuning 为提升人工智能模型的预测精确度 ,一种先以大型广泛领域数据集训练 ,再以小型专门领域数据集 继续训练的附加训练技术 。 [来源:GB/T41867—2022,3.2.31] 3.5 多模态数据 multi‑modal data 多种形态的数据 。 注:包含结构化数据 (例如业务系统数据等 ) 、半结构化数据 (例如XML文件、JSON文件等)和非结构化数据 (例如 文本、语音和图像视频等 ) 。 [来源:GB/T42135—2022,3.1]中国标准出版社 全国团体标准信息平台 2T/SBIAORG 0002—2025 3.6 知识knowledge 通过学习 、实践或探索所获得的认识 、判断或技能 。 [来源:GB/T23703.2—2010,2.1] 3.7 知识库 knowledge base 用于知识管理的一种特殊的数据库 ,以便于有关领域知识的采集 、整理及提取 。 3.8 词元token 文档中非空的连续字形或音素序列 。 [来源:ISO24611:2012,3.21] 3.9 提示词 prompt 提示语 使用大模型进行微调或下游任务处理时 ,插入到输入样本中的指令或信息对象 。 [来源:GB/T45288.1—2025,3.5] 3.10 提示工程 prompt engineering 人工智能中执行任务的描述文本被嵌入到输入中的一个概念 。 4总体考量 在大语言模型系统的开发 、部署、验证和质量控制的全生命周期中 ,应遵循以下原则 ,以确保安全 、负 责和有效地使用 LLM系统。 a)人工审查和监督 (Human Oversight ) :确保LLM系统在整个开发和使用过程中始终有人工审查 和监督。 b)可问责(Accountability ) :建立明确的责任分配和归属制度 。 c)透明性(Transparency ) :保持系统的透明度 ,并能够向相关方提供准确和及时的信息 ,包括系统 的功能、操作流程 、使用情况和局限性等 。 d)可解释性 (Explainability ) :提供LLM决策过程的可理解解释 ,包括完整的日志和记录等 ,以便 在必要时进行审查和分析 ,确保系统操作的可追溯性 。 e)风险管理 (Risk Management ) :采用基于风险的方法来管理 LLM应用,将LLM系统纳入药物警 戒质量管理系统 ,持续识别 、评估并减轻潜在的风险 。 f)数据保护和隐私保护 (Data Protection and Privacy Protection ) :加强数据保护和隐私保护 ,确保 个人数据和敏感信息的处理符合 《中华人民共和国个人信息保护法 》 《中华人民共和国数据安全 法》 《中华人民共和国网络安全法 》及数据跨境等相关法律法规要求 。 g)治理(Governance ) :建立有效的治理框架 ,以监督和规范 LLM系统的使用 。 h)持续学习 (Continuously Learning ) :鼓励组织和用户持续学习和适应合理合规使用 LLM系统, 以使LLM的使用价值最大化 。 5大语言模型在个例安全性报告信息提取场景下的系统实施 5.1模型部署和架构设计 5.1.1大语言模型的选择 5.1.1.1宜选择与应用场景匹配的大语言模型 。例如,个例报告源文件可能较长 ,宜优先考虑在长文本中国标准出版社 全国团体标准信息平台 3T/SBIAORG 0002—2025 能力具有优势的大语言模型 ,大语言模型支持的上下文词元 (Token)宜不低于 128K;个例报告信息提取 的规则较多 ,应优先选取在逻辑推理方面能力较强的大模型 ;个例报告源文件包含文本 、图片、语音等多 种格式,宜考虑在多模态数据处理能力具有优势的大语言模型 ;宜综合应用场景复杂度 、技术成熟度 、成 本预算等因素选择合适的商业版大语言模型或者开源版大语言模型 。 5.1.1.2宜选择支持持续预训练微调和微调定制化的大语言模型 ,以更好地匹配药物警戒应用场景 。 5.1.1.3宜考虑组织或用户对模型部署的具体需求 ,选择符合需求的大语言模型 。 5.1.1.4宜选择具备持续学习和更新能力的大语言模型 ,以满足未来业务的可持续发展 。 5.1.2模型调优 调优的候选技术手段可包括提示工程 、知识库管理 、模型微调等 ,旨在提高大模型输出结果的准 确率。 a)提示工程 :采用在提示词中加入少量示例 ,加入思维链引导模型推理 ,拆分提取任务 (如先提取 怀疑用药 ,再提取怀疑用药的属性信息 ,包括开始日期 、适应症等 ) ,提示语结构优化等基于提示 语的调优手段 ,提升大语言模型对任务的理解 ,降低大语言模型逻辑推理复杂度 ,从而提高输出 结果的准确率 。 b)知识库管理 :对于需要补充参考语料 (与任务相关的额外背景信息 、领域知识或示例等 )进行提 取的信息 ,可将补充语料放入外部知识库中 。宜参考补充制药企业遵循的政策法规要求 ,如《药 物警戒质量管理规范 》 《个例药品不良反应收集和报告指导原则 》 《个例安全性报告 E2B(R3)区 域实施指南 》等,以及领域知识 ,如MedDRA (Medical Dictionary for Regulatory Activities )、 CTCAE(Common Terminology Criteria for Adverse Events )等。 c)模型微调 :模型微调通常
T-SBIAORG 0002-2025 基于大语言模型的药物警戒个例安全性报告人工智能辅助信息提取规范
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2025-09-01 01:36:16
上传分享
举报
下载
原文档
(569.3 KB)
分享
友情链接
ISO 20903 2019 Surface chemical analysis Auger electron spectroscopy and X-ray photoelectron spectroscopy Methods used to determine peak intensities and information required when reporting results.p.pdf
ISO 9455-3 2019 Soft soldering fluxes — Test methods — Part 3 Determination of acid value, potentiometric and visual titration methods.pdf
ISO 18609 2000 Animal and vegetable fats and oils Determination of unsaponifiable matter Method using hexane extraction.pdf
ISO 5611-11 2015 Cartridges, type A, for indexable inserts — Part 11 Style W.pdf
ISO 6882 1981 Asparagus — Guide to refrigerated transport.pdf
ISO 20494 2017 Paper — Requirements for stability for general graphic applications.pdf
ISO TS 23374-2 2023 Intelligent transport systems — Automated valet parking s.pdf
ISO 9276-4 2001 Representation of results of particle size analysis — Part 4 Characterization of a classification process.pdf
ISO 5123-1984Documentation. Headers for microfiche of monographs and serials first edition.pdf
ISO 787-13 2019 General methods of test for pigments and extenders — Part 13 Determination of water-soluble sulphates, chlorides and nitrates.pdf
GB-T 17312-1998 声级计的无规入射和扩散场校准.pdf
GB 9706.263-2020 医用电气设备 第2-63部分 口外成像牙科X射线机基本安全和基本性能专用要求.pdf
GB-T 25473-2010 焊接、切割及类似工艺用管路减压器.pdf
GB-T 4880.1-2005 语种名称代码 第1部分 2字母代码.pdf
GB-T 36052-2018 表面化学分析 扫描探针显微镜数据传送格式.pdf
GB-T 33732-2017 纺织品 抗渗水性的测定 冲击渗透试验.pdf
GB-T 41939-2022 橡胶中镁含量的测定 原子吸收光谱法.pdf
GB-T 4458.1-2002 机械制图 图样画法 视图.pdf
GB-T 24825-2022 LED模块用直流或交流电子控制装置 性能规范.pdf
GB-T 8014.1-2005 铝及铝合金阳极氧化 氧化膜厚度的测量方法 第1部分 测量原则.pdf
1
/
3
11
评价文档
赞助1.5元 点击下载(569.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。