案例
典型任务与文献案例
按建模类型与数据模态组织的“任务地图”,帮助你快速判断你的数据适合做什么、能得到什么结论。
任务地图
先把“结局类型 + 数据模态”对齐,再谈模型
同样是 AI 建模,不同结局类型与数据模态会带来完全不同的数据要求、评估指标与审稿关注点。
二分类 / 多分类
诊断判定、分型分期、风险分层与预警。关键是结局定义一致、时间窗明确,并解释误判代价。
常用指标:AUC、F1、校准曲线、混淆矩阵
常见补充:阈值策略、决策曲线(可选)
生存 / 时间结局
复发/转移/死亡等时间事件结局。删失机制与随访方案是审稿重点,通常需要敏感性分析支持结论。
常用指标:C-index、时间依赖 AUC、校准
常见补充:时间窗变体、删失假设敏感性分析
连续指标预测
预测生理/检验指标、量表评分、资源消耗等连续结局。分布偏态与极端值解释是常见审稿点。
常用指标:MAE/RMSE、R²、残差分析
常见补充:分布变换、分层误差与解释性分析
多模态融合
结构化 + 影像/病理/组学/文本联合建模。重点是数据对齐、样本匹配与“成本/收益”解释。
常用输出:消融对比、关键特征解释、稳定性评估
常见补充:模态缺失处理与敏感性分析
数据模态
我们支持哪些数据类型
从“院内真实世界数据”启动:结构化数据即可开始;也支持影像、病理、组学、文本等多源数据按项目组合。
结构化数据
病历、检验、生理生化、用药与处置、随访记录等;是临床科研最常见、最容易启动的输入形态。
影像 / 病理
影像组学特征、病理图像衍生特征等,可与结构化数据融合;也可做成本/收益的特征消融分析。
组学 / 文本 / 设备
多组学、病程文本、可穿戴/监护设备等;重点在对齐时间窗与批次效应/漂移风险控制。
规范与参考
方法学合规:让审稿关注点更可控
我们会把建模流程与写作口径对齐到常见规范与审稿关注点,并把关键材料按“可复核”标准交付。
对齐顶级期刊常见写作与补充材料要求(以公开规范与审稿关注点为准)。
报告规范与风险评估
TRIPOD+AI:模型报告口径更清晰
PROBAST:偏倚与适用性评估思路
常见审稿补分析诉求
不同阈值/不同时间窗下的稳健性
亚组分析与分层解释(避免过拟合叙事)
模型校准与不确定性刻画