Med-Gemini,基于 Gemini 架构的先进多模态医学模型

来自Google和DeepMind的团队前几天发表了论文《Capabilities of Gemini Models in Medicine》。这篇论文介绍了 Med-Gemini,这是一系列基于 Gemini 架构的先进多模态医学模型。Med-Gemini 通过自我训练、网络搜索集成和专门针对医疗数据的编码器增强了医学人工智能应用。在 14 个医学基准测试中,Med-Gemini 展示了卓越的性能,超越了所有可比较测试中的 GPT-4 模型。特别是在 MedQA(USMLE)上,通过使用不确定性引导的搜索策略,Med-Gemini 达到了 91.1% 的准确率,显示出在复杂诊断任务上的优越性。

Med-Gemini 的关键能力包括高级文本推理、多模态理解和长文本处理,这些能力通过应用展示,如医学文本总结、转诊信生成和医学视频问答。此外,Med-Gemini 在多项任务中超越了人类专家,显示出在实际医学应用中的潜力。

Med-Gemini 的设计包括了与网络搜索结合的自我训练,通过动态整合外部信息来提高临床推理和准确性。它还具有针对处理专业医学数据的多模态微调功能。尽管 Med-Gemini 在医学人工智能领域取得了重大进展,但文章强调,在将这些模型部署到实际医疗环境中之前,需要进一步进行严格评估,因为它们属于安全关键性质。

Dialogue example of Med-Gemini

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注