用語集 — SDTM AI ナレッジベース
1 ページの早見表です。不明な用語があればこちらに戻ってご確認ください。SDTM 業界 / AI プラットフォーム / プロジェクト内部の 3 カテゴリに分類しています。
1. SDTM 業界用語
| 用語 | 日本語 | 説明 |
|---|---|---|
| SDTM | 臨床試験データ表記モデル | Study Data Tabulation Model。CDISC 標準のひとつで、臨床試験データをどのように表(ドメイン / 変数 / コードリスト)として整理するかを定めています。 |
| SDTMIG v3.4 | SDTM 実装ガイド v3.4 | SDTM Implementation Guide。SDTM モデルを「どのドメインにどの変数があり、それぞれの Core 属性は何か」という形で具体化した仕様書です。本プロジェクトで使用している v3.4 は 2021 年版の主流仕様です。 |
| CDISC | 臨床データ交換標準協会 | Clinical Data Interchange Standards Consortium。SDTM / ADaM / CDASH などの一連の標準を管理しており、FDA への提出には必須の組織です。 |
| Domain(ドメイン) | ドメイン(領域) | SDTM では臨床データをテーマ別に 63 のドメインに分類しています。例:AE(Adverse Events)/ DM(Demographics)/ LB(Lab)/ EX(Exposure)。各ドメインは 1 枚のテーブルに対応します。 |
| Variable(変数) | 変数 | ドメイン内の 1 列を指します。例:AE ドメインには AESER(Serious Event フラグ)/ AETERM(報告原文)/ AEDECOD(MedDRA デコード)などがあります。 |
| Core 属性 | Req / Exp / Perm | 各変数の「入力必須レベル」を表します。Req(Required、必須)/ Exp(Expected、原則記載、欠損時は注記が必要)/ Perm(Permissible、任意)。例:USUBJID Core=Req、AESER Core=Exp、AESEV Core=Perm。 |
| CT(Controlled Terminology) | 規制用語 / 制御用語集 | CDISC が定める「その変数に入力できる値の一覧」です。例:AESER には Y/N/U/NA の 4 値のみ使用可能で、“yes” や “はい” は使えません。 |
| C-code | NCI 用語コード | 各コードリストを一意に識別する NCI EVS の C-code です。例:NY コードリスト = C66742、AESEV コードリスト = C66769。これらの C-code は SDTMIG / NCI EVS Browser / Pinnacle 21 など各所で共通して使われます。 |
| Extensible | 拡張可能 | コードリストにスポンサー独自の値を追加できるかどうかを示すフラグです。Extensible=Yes(例:LBNRIND は 4 標準値 + スポンサー追加可)対 Non-Extensible(例:NY は Y/N/U/NA の厳格な 4 値のみで追加不可)。 |
| Codelist | コードリスト(コード表) | 名前付きの値セットです。例:LBNRIND コードリストには {HIGH/LOW/NORMAL/ABNORMAL} の 4 標準値があります。「CT」と同義で使われます。 |
| SUPPQUAL / SUPP— | 補足ドメイン | SDTM の標準変数では収まりきらないデータを格納する際に使用します。SUPPQUAL ドメインに IDVAR / IDVARVAL / QNAM / QVAL の 4 点セットで補足します。各標準ドメインに対応する SUPP— が存在します(例:AE ↔ SUPPAE / LB ↔ SUPPLB)。 |
| NSV | 非標準変数 | Non-Standard Variable。主ドメインには収録できず、SUPPQUAL にのみ格納する変数を指します。SUPP— は NSV を格納するためのコンテナです。 |
| RELREC / RELSPEC / RELSUB | 関係ドメイン 3 点セット | SDTM のドメイン間関連付けの仕組みです。RELREC = レコードレベル(例:1 件の AE と 1 件の EX を関連付け)/ RELSPEC = 検体レベル / RELSUB = 被験者レベル。 |
| MedDRA | 医薬品規制活動のための医療用語集 | 国際的に使われる医学用語辞書です。AE ドメインの AEDECOD / AEHLT / AEHLGT などの変数は MedDRA に準拠しています。CDISC CT には属しませんが、AE ドメインでは強く依存しています。 |
| NCI EVS | NCI エンタープライズ語彙サービス | National Cancer Institute Enterprise Vocabulary Services。CDISC CT の公式公開サイトで、browser.evs.nci.nih.gov からアクセスできます。マイナーなコードリストはここでリアルタイムに確認できます。 |
| Pinnacle 21 | 標準準拠チェックツール | SDTM データセットと標準仕様の適合を自動チェックする業界標準ツールで、「SDTM 向けのリンター」のようなものです。本プロジェクトは Pinnacle 21 に直接接続しておらず、実際の検証には cdisc.org または対応ツールでの確認が必要です。 |
| ISO 8601 | 日付・時刻の国際標準 | 国際標準の日付・時刻フォーマットです(例:2026-04-27T13:45Z、2026-04-27、--MM-DD)。SDTM のすべての —DTC 変数には ISO 8601 形式での入力が必須です。 |
2. AI プラットフォーム / RAG 用語
| 用語 | 日本語 | 説明 |
|---|---|---|
| System Prompt / Instructions | システムプロンプト / インストラクション | AI に渡す「操作マニュアル」で、役割 / 優先順位 / ガードルール / アンカーなどを定義します。ChatGPT では Instructions / Custom Instructions、Claude では System Prompt、Gemini では Gem instructions、NotebookLM では Custom mode と呼ばれます。 |
| Custom mode | NotebookLM カスタムモード | NotebookLM Chat の 3 モードのひとつ(Default / Learning Guide / Custom)。システムプロンプトを設定できる唯一の入口で、上限は 10K 文字です。本デプロイでは Custom mode に instructions.md を設定しています。 |
| RAG | 検索拡張生成 | Retrieval-Augmented Generation。AI は質問を受けると、まずナレッジベースから関連する断片を検索し、その断片に基づいて回答を生成します。「記憶頼み」ではありません。4 つのプラットフォームすべてが RAG を使用しており、NotebookLM は最も厳格な in-KB-only RAG を採用しています。 |
| Indexing | インデックス化 | ナレッジベースをアップロードすると、AI がまず「全体を読み込んでチャンクに分割しベクトルインデックスを構築」します。この処理が完了して初めてチャットが可能になります。処理時間はプラットフォームにより異なります(Gemini 約 1〜3 分 / ChatGPT 約 5〜15 分 / Claude / NotebookLM 約 2〜10 分)。 |
| in-KB-only | ナレッジベース内に限定 | NotebookLM の設計原則で、回答はアップロードされたソースのみから生成されます。Web 検索やパラメータによる推測回答は行いません。ナレッジベース外の質問は回答を拒否します(PUNT)。 |
| PUNT | 回答拒否 | NotebookLM の用語で「わかりません、アップロードされたソースに情報がありません」を意味します。PUNT はバグではなくフィーチャーです — 情報を捏造するよりも誠実な応答です。 |
| Hallucination / 幻覚 / 虚構 | AI による捏造(ハルシネーション) | AI が知識の空白部分に、もっともらしく見えるが実際には誤った情報を作り出すことです。本プロジェクトが重点的に防いでいる問題です。 |
| Anti-hallucination Probe(AHP)/ 反虚構プローブ | 「意図的に誤りを含む」テスト問題 | 評価問題に意図的に誤った前提を含めます(例:「PF ドメインにはどのような変数がありますか?」と聞くが、PF はすでに廃止済み)。AI が誤った前提に乗らず主体的に識別できるかを確認します。本プロジェクトでは各プラットフォームに 3 問の AHP を使用しています。 |
| PASS+ | 誤前提を主体的に指摘した場合の加点 | 評価用語です。PASS = 核心的な事実に正答 / PASS+ = 正答 + 問題中の誤った前提を主体的に指摘。AHP 問題では PASS+ を最も重視します。 |
| Smoke test | スモークテスト(煙テスト) | 「電源を入れて基本的な動作を確認する」類の予備テストです。完全なカバレッジは求めず、主要機能が正常に動作することだけを確認します。本プロジェクトではデプロイ後に D0/D1/D5 の 3 問を実施することをスモークテスト通過の基準とします。 |
| token | LLM の処理単位(トークン) | LLM が内部でテキストを分割する単位です(日本語 1 文字 ≒ 0.5〜1 トークン、英語 1 単語 ≒ 1〜2 トークン)。Claude Project の容量は約 3〜4M トークン、Gemini は 1M コンテキストウィンドウです。 |
| Context window | コンテキストウィンドウ | LLM が一度に「記憶」できるトークンの最大数です。超過した場合は古い内容が失われます。Gemini の 1M は約 1,000 ページを一度に処理できることを意味し、Claude は約 200K〜1M です。 |
3. プロジェクト内部用語
| 用語 | 意味 |
|---|---|
| 17 問 / 内部完全問題集 | 各プラットフォームの評価に使用する SDTM 問題セットです。共通問題 14 問 + 反虚構プローブ 3 問で構成されています。../../SMOKE_V4.md §2 をご参照ください。 |
| D0〜D9 / Demo | 同僚向けの 10 問クイックデモセットです。本ディレクトリの ./DEMO_QUESTIONS.md にあります。内部の 17 問とは別物であり、問題番号に対応関係はありません。 |
| 4 条の品質ルール | プロジェクト内部の成果物・レビュープロセスに関する規律です(例:「改変率 50% 超は独立サンプリングレビュー必須」「失敗記録は削除しない」「最終稿には必ず振り返りを記載」「レビューは自己審査禁止」)。同僚は詳細まで把握する必要はありません。 |
| LIVE | プラットフォームのデプロイ完了 + 完全な 17 問実施済み + 品質ゲート通過済み、実際に使用可能な状態です。現在 4 つのプラットフォームすべてが LIVE です。 |
| baseline | プロジェクト内部で公式に測定した「そのプラットフォームでこの問題セットを実施した場合に期待されるスコア」です。自分でデプロイして同じ問題を実施した場合、同様のスコアが再現できるはずです(±2 点の誤差は許容範囲です)。 |
さらに詳しく知りたい場合
| テーマ | パス |
|---|---|
| 完全なテスト問題集 + 各プラットフォームの問題別回答 | ../../SMOKE_V4.md + 各プラットフォームの dev/evidence/smoke_v4_answers/ |
| 完全な制限事項一覧 | ./KNOWN_LIMITATIONS.en.md |
| プロジェクト方法論 | ../../claude_projects/docs/RETROSPECTIVE_V2.md(Claude v2 最終状態の振り返り)+ ../../notebooklm/docs/RETROSPECTIVE.md(NotebookLM 振り返り) |
| 4 プラットフォームの横断的振り返り | ../../retrospectives/PHASE5_RETROSPECTIVE.md(v1.0 FINAL) |
⚠️ 注記: 本節における
../../...またはdev/evidence/...形式のパスは、プロジェクト内部の成果物 (Bojiang Zhang が保管) を指しており、本 release パックには含まれていません。詳細が必要な場合は Bojiang Zhang までご連絡ください。
v1.1 — 2026-04-27 — メンテナー: Bojiang Zhang