SDTM/KB · VOL.01 · 2026

SDTM AI 知识库 — 用户手册 v1.0

1. 这是什么 (项目背景)

如果你日常需要查 CDISC 临床试验数据制表标准 (SDTM) 的某个变量定义、Core 属性或 codelist, 翻 SDTMIG v3.4 PDF + NCI EVS Browser 常常要十几分钟. 本项目把这些资料整理好, 部署到 4 个 AI 平台 (Claude Projects / ChatGPT GPTs / Gemini Gems / NotebookLM), 你只需用自然语言提问, 1 分钟就能拿到带 spec 引用的答案.

技术背景: SDTM (Study Data Tabulation Model) 含 63 个域 + 上千变量 + 大量 CT (Controlled Terminology). 我们把 CDISC SDTMIG v3.4 + v2.0 model + CDISC CT 整理成 295 个 Markdown 源, 加上提示词工程喂给 4 个 AI 平台. 不熟悉 RAG / system prompt / Core (Req/Exp/Perm) / Extensible / 反虚构探针 等术语? 见 ./GLOSSARY.zh.md (1 页速查).

2. 工作成果概览 (技术亮点)

我们用 17 道代表性 SDTM 问题给每个平台做了完整评测, 含 3 道”故意问错”反虚构题 (测 AI 能否识破假前提, 而不是顺着错前提编). 4 平台得分如下:

平台17 题得分版本强项
Claude Projects17/17 (100%)v2.6精确变量 + 多步推理
ChatGPT GPTs16.5/17 (97%)v2.2 LIVE全量 + 可团队/Store 共享
Gemini Gems16/17 (94%)v7.1 LIVE长上下文 + 大范围探索
NotebookLM15/17 (88%)Custom modein-KB-only 反虚构

亮点: v3.4 新域 (GF / CP / BE / BS) + Timing + CT Extensible + SUPPQUAL scope + 跨域死亡日级对齐 + 3 道反虚构题 (LBCLINSIG / Trial-Level SAE Aggregate / PF 已废域); 每份产出都过 4 条内部质量规则 + 累计 28 个独立 reviewer 验证. 完整 baseline 见 ./CHANGELOG.md; 完整题库见 ../../SMOKE_V4.md §3. 不懂术语见 ./GLOSSARY.zh.md.

3. 我该用哪个平台? (决策树)

想做的事推荐平台理由
精确变量 + 多步推理 (Core + C-code + 跨变量)Claude Projects1.29M tokens 全量, smoke 满分
团队/部门内分享, 或发布 GPT StoreChatGPT GPTs组织内分享免审核, Store 走 review
长上下文 + 一次性大范围探索 / 跨域模式Gemini Gems1M 窗口, 4 文件深度合并
100% 反虚构 (拒答优于编造) + 强 citationNotebookLMin-KB-only, 不在 42 sources 内宁可 PUNT

简版: 不知道选什么 → Claude Projects. 拉同事一起用 → ChatGPT GPTs. 担心幻觉 → NotebookLM. 详细对比见 ../README.md “四平台分工” 表.

4. 4 平台访问入口

4.1 Claude Projects (推荐入门)

4.2 ChatGPT GPTs

4.3 Gemini Gems

4.4 NotebookLM

5. 5 分钟快速试用 (3 题热身)

打开常用平台 (建议先 Claude Projects), 依次问 3 题, 答案对照 ./DEMO_QUESTIONS.md Expected:

  1. D0 (热身): “AESER 是 SDTMIG v3.4 哪个域什么变量? Core? 绑哪个 CT C-code?” 预期: AE 域 / Serious Event / Exp / C66742 NY {Y/N/U/NA}.
  2. D1 (新域): 复制 DEMO_QUESTIONS.md D1 题面 (EGFR / Exon 19 / dbSNP). 预期 Domain=GF, 答出 GFGENSR / GFPVRID / GFGENREF / GFINHERT.
  3. D5 (前提纠错): “SUPPTS 是 SDTM 标准里什么? QORIG 必填吗?” 预期: 主动识破 “SUPPTS 不在 SDTMIG v3.4” → 走 TSVAL1-TSVALn = PASS+.

判 PASS/FAIL: 核心事实 (域 / 变量 / Core / C-code) 都中 = PASS; 主动识破错前提 = PASS+; 沿错前提编 = FAIL.

6. 完整 demo 包 (10 题)

10 题完整版在 ./DEMO_QUESTIONS.md (三语题面 + 英文判据). 5 分钟入门 = D0/D1/D5; 30 分钟全跑 = D0→D9 (含 3 道 AHP D6 LBCLINSIG / D7 SAE Aggregate / D8 PF 已废 + 跨域终极 D9 AE/MH/CE + DS 死亡日级对齐). 跑完对照 §2 baseline (17/17 / 16.5/17 / 16/17 / 15/17) 看实例是否到位.

7. 已知限制 (高频问题)

完整版见 ./KNOWN_LIMITATIONS.en.md, 中文摘要:

8. 反馈渠道

发现错误 / 幻觉 / 答非所问: (1) 截图 + 留底完整问题原文 + AI 回答; (2) 附平台 + 版本号 (例 “ChatGPT GPT v2.2 LIVE 2026-04-24”) + 期望答案 (引 SDTMIG v3.4 章节号或 CDISC CT C-code); (3) 邮件 Bojiang Zhang / 公司 issue tracker / 部门群 @Bojiang Zhang. 汇总到 ./CHANGELOG.md 走下个 minor release.

9. 后续路径

短期 (v1.0 维护): 收反馈修 SDTM 错点, 季度 v1.x minor. 中期 (Phase 7 自建 RAG): 摆脱 4 平台容量约束, 295 文件全量 + QS codelist 全展开. 长期: 跟 SDTMIG v3.5+ 同步 + ADaM / Define-XML 扩展.


v1.0 — 2026-04-27 — 维护者: Bojiang Zhang