Paper List
-
Mapping of Lesion Images to Somatic Mutations
This paper addresses the critical bottleneck of delayed genetic analysis in cancer diagnosis by predicting a patient's full somatic mutation profile d...
-
Reinventing Clinical Dialogue: Agentic Paradigms for LLM‑Enabled Healthcare Communication
This paper addresses the core challenge of transforming reactive, stateless LLMs into autonomous, reliable clinical dialogue agents capable of longitu...
-
Binary Latent Protein Fitness Landscapes for Quantum Annealing Optimization
通过将序列映射到二元潜在空间进行基于QUBO的适应度优化,桥接蛋白质表示学习和组合优化。
-
Controlling Fish Schools via Reinforcement Learning of Virtual Fish Movement
证明了无模型强化学习可以利用虚拟视觉刺激有效引导鱼群,克服了缺乏精确行为模型的问题。
基于病例相似性搜索的放射学印象多模态检索增强草稿生成
Independent AI Researcher, Austin, Texas, USA
30秒速读
IN SHORT: 通过将印象草稿基于检索到的历史病例,并采用明确引用和基于置信度的拒绝机制,解决放射学报告生成中的幻觉问题。
核心创新
- Methodology Multimodal fusion of CLIP-based image and text embeddings improves retrieval performance from Recall@5=0.633 (image-only) to 0.956 (fusion).
- Methodology Citation-constrained draft generation with explicit case identifiers ensures traceability and reduces unsupported claims.
- Biology Demonstrates that textual impression semantics provide complementary clinical information beyond visual appearance alone for chest X-ray interpretation.
主要结论
- 多模态融合(α=0.5)在临床相关发现上实现了Recall@5=0.956,显著优于仅图像检索(Recall@5=0.633)。
- 部署的系统实现了平均引用覆盖率为0.867,平均top-1检索相似度为0.980,展示了强大的证据基础。
- 基于置信度的拒绝机制通过相似度阈值防止对分布外输入生成报告,增强了临床安全性。
摘要: 随着深度学习和大型语言模型的兴起,自动化放射学报告生成受到越来越多的关注。然而,完全生成式方法经常出现幻觉和缺乏临床基础的问题,限制了其在真实工作流程中的可靠性。本研究提出了一种多模态检索增强生成系统,用于胸部X光印象的基于事实的草稿生成。该系统结合了对比图像-文本嵌入、基于病例的相似性检索和引用约束的草稿生成,以确保与历史放射学报告的事实一致性。使用MIMIC-CXR数据集的精选子集构建了多模态检索数据库。图像嵌入使用CLIP编码器生成,而文本嵌入则从结构化的印象部分提取。使用FAISS索引实现了融合相似性框架,用于可扩展的最近邻检索。检索到的病例用于构建基于事实的提示以生成印象草稿,并通过安全机制强制执行引用覆盖和基于置信度的拒绝。实验结果表明,与仅使用图像的检索相比,多模态融合显著提高了检索性能,在临床相关发现上实现了Recall@5超过0.95。基于事实的草稿生成流程产生了具有明确引用可追溯性的可解释输出,相比传统生成方法提高了可信度。这项工作突显了检索增强多模态系统在可靠临床决策支持和放射学工作流程增强方面的潜力。