SDTM AI 知识库 — 用户手册 v1.0

1. 这是什么 (项目背景)

如果你日常需要查 CDISC 临床试验数据制表标准 (SDTM) 的某个变量定义、Core 属性或 codelist, 翻 SDTMIG v3.4 PDF + NCI EVS Browser 常常要十几分钟. 本项目把这些资料整理好, 部署到 4 个 AI 平台 (Claude Projects / ChatGPT GPTs / Gemini Gems / NotebookLM), 你只需用自然语言提问, 1 分钟就能拿到带 spec 引用的答案.

技术背景: SDTM (Study Data Tabulation Model) 含 63 个域 + 上千变量 + 大量 CT (Controlled Terminology). 我们把 CDISC SDTMIG v3.4 + v2.0 model + CDISC CT 整理成 295 个 Markdown 源, 加上提示词工程喂给 4 个 AI 平台. 不熟悉 RAG / system prompt / Core (Req/Exp/Perm) / Extensible / 反虚构探针等术语? 见 ./GLOSSARY.zh.md (1 页速查).

2. 工作成果概览 (技术亮点)

我们用 17 道代表性 SDTM 问题给每个平台做了完整评测, 含 3 道”故意问错”反虚构题 (测 AI 能否识破假前提, 而不是顺着错前提编). 4 平台得分如下:

平台	17 题得分	版本	强项
Claude Projects	17/17 (100%)	v2.6	精确变量 + 多步推理
ChatGPT GPTs	16.5/17 (97%)	v2.2 LIVE	全量 + 可团队/Store 共享
Gemini Gems	16/17 (94%)	v7.1 LIVE	长上下文 + 大范围探索
NotebookLM	15/17 (88%)	Custom mode	in-KB-only 反虚构

亮点: v3.4 新域 (GF / CP / BE / BS) + Timing + CT Extensible + SUPPQUAL scope + 跨域死亡日级对齐 + 3 道反虚构题 (LBCLINSIG / Trial-Level SAE Aggregate / PF 已废域); 每份产出都过 4 条内部质量规则 + 累计 28 个独立 reviewer 验证. 完整 baseline 见 ./CHANGELOG.md; 完整题库见 ../../SMOKE_V4.md §3. 不懂术语见 ./GLOSSARY.zh.md.

3. 我该用哪个平台? (决策树)

想做的事	推荐平台	理由
精确变量 + 多步推理 (Core + C-code + 跨变量)	Claude Projects	1.29M tokens 全量, smoke 满分
团队/部门内分享, 或发布 GPT Store	ChatGPT GPTs	组织内分享免审核, Store 走 review
长上下文 + 一次性大范围探索 / 跨域模式	Gemini Gems	1M 窗口, 4 文件深度合并
100% 反虚构 (拒答优于编造) + 强 citation	NotebookLM	in-KB-only, 不在 42 sources 内宁可 PUNT

简版: 不知道选什么 → Claude Projects. 拉同事一起用 → ChatGPT GPTs. 担心幻觉 → NotebookLM. 详细对比见 ../README.md “四平台分工” 表.

4. 4 平台访问入口

4.1 Claude Projects (推荐入门)

访问: 等 Bojiang Zhang 加 organization 邀请, 邮件链接加入.
URL: claude.ai → Projects → “SDTM Knowledge Base” (Bojiang Zhang 单发具体 URL).
套餐: Claude Pro / Team / Enterprise.
适合: 精确变量 Core+CT 绑定 / 跨变量推理 (PCTPT 五件套) / 错前提纠错 (SUPPTS).
不适合: 实时联网 FDA/Pinnacle 21 (手动核 cdisc.org); 超大批量域对比.

4.2 ChatGPT GPTs

访问: Bojiang Zhang 分享 Custom GPT 到 organization, “添加到我的 GPTs”.
URL: chatgpt.com → 顶部下拉 → “SDTM Knowledge Base”.
套餐: ChatGPT Plus / Team / Enterprise (Free 不可).
适合: 全量域查询 / 团队共享 / 想发布 GPT Store 走 OpenAI review.
不适合: 多步推理略弱于 Claude; Free 账号找不到入口.

4.3 Gemini Gems

访问: Bojiang Zhang 分享 (Workspace) 或自部署 (个人).
URL: gemini.google.com → Gems → “SDTM Knowledge Base”.
套餐: Gemini Advanced 个人 / Google Workspace.
适合: 一次性塞大量上下文 / 跨域模式比对 / 长会话.
不适合: 个人账号不能直接团队共享 (要 Workspace).

4.4 NotebookLM

访问: Bojiang Zhang 邀请加入 notebook, 或自建 (50-source cap).
URL: notebooklm.google.com → “SDTM Knowledge Base”.
套餐: NotebookLM Pro / Google Workspace.
适合: 强反虚构 (审计/合规) / inline citation 反查 / 拒答优于编造.
不适合: 不在 42 source 内的题 (实时 Pinnacle 21 / breaking news) 它会拒答 — 设计如此, 非 bug.

5. 5 分钟快速试用 (3 题热身)

打开常用平台 (建议先 Claude Projects), 依次问 3 题, 答案对照 ./DEMO_QUESTIONS.md Expected:

D0 (热身): “AESER 是 SDTMIG v3.4 哪个域什么变量? Core? 绑哪个 CT C-code?” 预期: AE 域 / Serious Event / Exp / C66742 NY {Y/N/U/NA}.
D1 (新域): 复制 DEMO_QUESTIONS.md D1 题面 (EGFR / Exon 19 / dbSNP). 预期 Domain=GF, 答出 GFGENSR / GFPVRID / GFGENREF / GFINHERT.
D5 (前提纠错): “SUPPTS 是 SDTM 标准里什么? QORIG 必填吗?” 预期: 主动识破 “SUPPTS 不在 SDTMIG v3.4” → 走 TSVAL1-TSVALn = PASS+.

判 PASS/FAIL: 核心事实 (域 / 变量 / Core / C-code) 都中 = PASS; 主动识破错前提 = PASS+; 沿错前提编 = FAIL.

6. 完整 demo 包 (10 题)

10 题完整版在 ./DEMO_QUESTIONS.md (三语题面 + 英文判据). 5 分钟入门 = D0/D1/D5; 30 分钟全跑 = D0→D9 (含 3 道 AHP D6 LBCLINSIG / D7 SAE Aggregate / D8 PF 已废 + 跨域终极 D9 AE/MH/CE + DS 死亡日级对齐). 跑完对照 §2 baseline (17/17 / 16.5/17 / 16/17 / 15/17) 看实例是否到位.

7. 已知限制 (高频问题)

完整版见 ./KNOWN_LIMITATIONS.en.md, 中文摘要:

L1 — QS codelist 不全: 296 个长尾 questionnaire codelist (PROMIS/EORTC) 因容量约束未全展开 (Claude ~55.8%), 其余落 NCI EVS Browser 链接.
L2 — 巨型 codelist 走 stub: LBTESTCD (2536 term) 等 6 表只存 stub + 指针, 不会编 term.
L3 — 实时联网: NotebookLM 严格 in-KB-only, breaking news / 最新 Pinnacle 21 不知道 (PUNT). 其他 3 平台可联网需手动开启.
Claude: 容量 77% 接近 Pro 软上限, 加新文件需先降级低优先.
ChatGPT: 20-file 硬上限 (当前 9), 长尾 chunk 表格中段可能 miss.
Gemini: 个人账号不能直接团队共享 (要 Workspace); v7.1 system prompt 必须完整粘贴.
NotebookLM: 50-source cap (当前 42); Q9/Q11/Q12 三题主动 PUNT 是正确安全行为.

8. 反馈渠道

发现错误 / 幻觉 / 答非所问: (1) 截图 + 留底完整问题原文 + AI 回答; (2) 附平台 + 版本号 (例 “ChatGPT GPT v2.2 LIVE 2026-04-24”) + 期望答案 (引 SDTMIG v3.4 章节号或 CDISC CT C-code); (3) 邮件 Bojiang Zhang / 公司 issue tracker / 部门群 @Bojiang Zhang. 汇总到 ./CHANGELOG.md 走下个 minor release.

9. 后续路径

短期 (v1.0 维护): 收反馈修 SDTM 错点, 季度 v1.x minor. 中期 (Phase 7 自建 RAG): 摆脱 4 平台容量约束, 295 文件全量 + QS codelist 全展开. 长期: 跟 SDTMIG v3.5+ 同步 + ADaM / Define-XML 扩展.

v1.0 — 2026-04-27 — 维护者: Bojiang Zhang