每个人的健康和保健之旅都是独特的,AI可以帮助创造更个性化的健康体验以匹配这种独特性。Google Research正在研究如何通过微调Gemini模型用于个人健康和保健,以解锁消费者的新洞见和互动。想象一下,一个不仅能理解您可穿戴设备中的健康数据,还能为您提供个性化洞见和建议的AI,就像一个虚拟健康教练。
Google Research的两篇新研究论文深入探讨了这一点:
- 《迈向个人健康大语言模型 (PH-LLM)》:通过微调Gemini模型,创建了PH-LLM,能够生成与人类专家相媲美的个性化睡眠和健身建议。
- 《利用大语言模型代理将可穿戴数据转化为个人健康洞见》:该代理系统利用代码生成和信息检索来分析您的可穿戴数据,提供详细的健康模式洞见。
这些进展展示了AI如何帮助我们更好地理解健康数据,并做出更明智的健康决策。期待继续研究生成性AI如何实现新的健康体验。
迈向个人健康大语言模型 (PH-LLM)
Towards a Personal Health Large Language Model
作者: Justin Cosentino, Anastasiya Belyaeva, Xin Liu 等
摘要: 本文介绍了一种新的模型——个人健康大语言模型(PH-LLM),这是在Gemini模型基础上微调,用于理解和推理个人健康数据,特别是睡眠和健身方面的数据。为了系统地评估PH-LLM,我们创建并整理了三个新的基准数据集,用于测试从睡眠模式、体力活动和生理反应中生成个性化见解和建议、专业领域知识以及自我报告的睡眠质量结果的预测。通过广泛的人类和自动评估,我们观察到Gemini Ultra 1.0和PH-LLM在健身方面的表现与专家没有显著差异,而在睡眠方面专家仍然更胜一筹,但PH-LLM通过微调在使用相关领域知识和个性化信息方面有显著改进。
一、引言
大语言模型(LLMs)在生成语言方面非常多才多艺,并且在各个领域表现出色。然而,移动和可穿戴设备提供了丰富、连续和纵向的个人健康监测数据,这些数据通常未能整合到临床任务中。本文介绍了个人健康大语言模型(PH-LLM),这是在Gemini模型基础上微调,用于处理睡眠和健身方面的数值时间序列个人健康数据。
二、研究方法
- 基础模型选择: 在多个候选模型中,Gemini Ultra 1.0在专业考试问题上的表现最为出色,因此选择该模型作为基础模型。
- 微调PH-LLM: 使用来自睡眠和健身数据的案例研究数据对Gemini Ultra 1.0进行微调,生成PH-LLM模型。使用1:1的睡眠和健身提示-响应对混合物进行模型训练。
- 患者报告结果的预测: 使用多层感知器(MLP)适配器将可穿戴设备数据投影到PH-LLM的潜在标记空间,通过这一过程训练PH-LLM预测自我报告的睡眠质量结果。
三、数据集创建
- 教练建议: 创建了详细的案例研究数据集,包括个人健康行为的长文本问题,这些问题涉及睡眠和健身两大领域。案例研究由领域专家设计,包括可穿戴传感器数据和专家分析。
- 专业考试: 收集了睡眠医学和健身领域的多个选择题,用于评估PH-LLM的专业知识。
- 患者报告结果: 通过Google Digital Wellbeing Study数据集,使用20个可穿戴设备测量值和16个二进制结果,评估PH-LLM预测自我报告结果的能力。
四、结果
- 长文本案例研究: PH-LLM在生成个性化见解和建议方面接近专家表现,特别是在健身方面。微调PH-LLM在使用相关领域知识和个性化信息方面有显著改进。
- 专业考试表现: PH-LLM在睡眠医学考试中正确回答了79%的问题,在健身考试中正确回答了88%的问题,均超过了获得继续医学教育学分的要求。
- 患者报告结果的预测: PH-LLM使用适配器显著优于零样本和少样本文本方法,在12个二进制特征中表现最佳。
五、讨论
PH-LLM在个人健康领域展示了其广泛的知识库和能力,能够在安全关键的个人健康领域实现显著改进。进一步的发展和评估仍然必要,但这些结果表明将生理数据情境化以应用于个人健康应用具有巨大潜力。
六、结论
PH-LLM通过微调Gemini模型,实现了对个人健康数据的深度理解和个性化建议生成,为个人健康管理提供了新的工具和方法。这一研究为未来的大语言模型在健康领域的应用奠定了基础。
利用大语言模型代理将可穿戴数据转化为个人健康洞见
Transforming Wearable Data into Health Insights using Large Language Model Agents
作者: Mike A. Merrill, Akshay Paruchuri, Naghmeh Rezaei, Geza Kovacs 等
摘要: 尽管可穿戴健康追踪器的普及及睡眠和运动对健康的重要性,将这些数据转化为可操作的个性化洞见仍然具有挑战性。本文介绍了个人健康洞见代理(PHIA),这是一个利用先进的代码生成和信息检索工具来分析和解释来自可穿戴设备的行为健康数据的代理系统。我们创建了两个基准问答数据集,共包含超过4000个健康洞见问题。基于650小时的人类和专家评估,我们发现PHIA能准确回答超过84%的事实数值问题和83%以上的众包开放式问题。这项工作对推动人口行为健康具有重要意义,可能会帮助个人解释其可穿戴数据,并引领一个由数据驱动的个性化健康方案的新纪元。
一、引言
个人健康数据,通常由可穿戴设备收集,具有多维度、连续和纵向的特点,可以捕捉生理和行为的详细观察,而不仅限于临床环境。研究表明,体力活动和睡眠模式对健康有显著影响,可穿戴设备的数据有潜力揭示个性化健康洞见并促进积极的行为变化。然而,将这些数据转化为智能响应和洞见的过程复杂且需要高水平的分析能力。大语言模型(LLM)的出现,为实现这种个性化分析提供了新的可能。
二、研究方法
- 基础模型选择: 本研究选择了Gemini Ultra 1.0模型作为基础模型,该模型在专业考试问题上表现优异。
- 微调PHIA: 使用来自睡眠和健身数据的案例研究数据对Gemini Ultra 1.0进行微调,生成PHIA模型。PHIA使用代码生成进行可穿戴数据分析。在执行阶段,代理通过Python在定制的沙箱运行环境中处理可穿戴的表格数据。这种交互利用了Pandas Python库,这是一种流行的基于代码的数据分析工具。与直接使用大语言模型进行数值推理相比,通过代码生成得出的数值结果是事实性的,并且可靠地保持算术精度。此外,这种方法可以帮助降低泄露用户原始数据的风险,因为语言模型只会遇到分析结果,而这些结果通常是汇总信息或趋势。
- 患者报告结果的预测: 使用多层感知器(MLP)适配器将可穿戴设备数据投影到PHIA的潜在标记空间,通过这一过程训练PHIA预测自我报告的睡眠质量结果。
三、数据集创建
- 健康洞见问题集: 创建了详细的问答数据集,包括个人健康行为的长文本问题,涵盖睡眠和健身两个主要领域。
- 专业考试题: 收集了睡眠医学和健身领域的多项选择题,用于评估PHIA的专业知识。
- 高保真合成可穿戴用户数据: 从30000名真实用户数据中生成56名合成用户数据,包含日统计数据和离散活动事件数据。
四、结果
- 长文本案例研究: PHIA在生成个性化见解和建议方面接近专家表现,尤其是在健身方面。微调后的PHIA在使用相关领域知识和个性化信息方面有显著改进。
- 专业考试表现: PHIA在睡眠医学考试中正确回答了79%的问题,在健身考试中正确回答了88%的问题,均超过了继续医学教育学分的要求。
- 患者报告结果的预测: PHIA使用适配器显著优于零样本和少样本文本方法,在12个二进制特征中表现最佳。
五、讨论
PHIA展示了其在个人健康领域的广泛知识库和能力,能够在关键的个人健康领域实现显著改进。进一步的发展和评估仍然必要,但这些结果表明将生理数据情境化以应用于个人健康应用具有巨大潜力。
六、结论
PHIA通过微调Gemini模型,实现了对个人健康数据的深度理解和个性化建议生成,为个人健康管理提供了新的工具和方法。这一研究为未来大语言模型在健康领域的应用奠定了基础。