AI 建模类论文的审稿关注点,往往集中在两件事:你是否报告得足够透明,以及别人能否复核你的结论。这份清单把常见写作与补充材料要点按模块拆开,便于你在项目一开始就把“交付标准”定下来。
如果你希望把这些材料按“可发表级”一次交付,我们的交付方式会把图表导出、原始数据与流程记录一起打包(见 XeleFlow 交付标准)。
1) 研究问题与结局定义
- 研究目标(预测/分层/诊断/预后等)与使用场景
- 结局定义与判定标准(含时间窗/随访规则)
- 纳排标准与样本获取流程
2) 数据与预处理
- 数据来源(病历/检验/影像/病理/组学/随访等)与时间跨度
- 缺失处理策略(缺失机制假设、插补/删失策略)
- 异常值/分布漂移检查与处理
- 防止信息泄露的规则(时间顺序、变量可获得性)
3) 建模策略
- 候选模型/算法与选择理由(兼顾可解释性)
- 特征工程与特征筛选策略(是否做稳定性筛选)
- 超参数搜索与验证策略(避免“调参泄露”)
4) 评估口径(区分度 + 校准 + 不确定性)
建议至少覆盖:
- 区分度:AUC / C-index / F1 等(按任务类型)
- 校准:校准曲线、Brier 等
- 不确定性:置信区间/波动范围(交叉验证/自助法)
- (可选)阈值策略与临床可用性口径(例如净获益等)
5) 解释性与稳健性
- 解释性:SHAP、PDP/ICE、关键变量方向与一致性
- 稳健性:亚组分析、敏感性分析(时间窗/阈值/人群变体)
- 偏倚与适用性讨论:哪些结论适用、哪些不适用
6) 补充材料与可复现交付(强烈建议提前规划)
为了避免“想补图但补不出来”,建议交付时具备:
- 图表:PNG + SVG/PDF(可编辑)
- 图表原始数据:用于二次绘图
- 关键参数与中间结果:保证可追溯、可复跑
- 方法描述与结果口径:能直接用于写作
下一步:把你的数据概况发来
你只需要提供脱敏概况(目标/结局/样本/变量清单),我们就可以给出免费可行性评估与建模路线建议(见 联系)。