Physics-IQ(物理智商?)基准数据集:测试生成性视频模型在理解物理原则方面的能力
论文Do generative video models learn physical principles […]
Physics-IQ(物理智商?)基准数据集:测试生成性视频模型在理解物理原则方面的能力 Read More »
论文Do generative video models learn physical principles […]
Physics-IQ(物理智商?)基准数据集:测试生成性视频模型在理解物理原则方面的能力 Read More »
幻觉(Hallucinations,即事实性不准确的回答)依然困扰着大型语言模型(LLMs)。尤其是在面对更复
FACTS Grounding:用于评估大型语言模型(LLMs)基于长文档生成事实性(factuality )准确回答能力的基准测试 Read More »
论文Let Your Graph Do the Talking: Encoding Structured Da
GraphToken:实现图推理(graph reasoning)能力显著提升 Read More »
论文A theory of appropriateness with applications to gene
适宜性(appropriateness)理论及其在生成式人工智能中的应用 Read More »
在谷歌地图(Google Maps)和谷歌街景(Google Street View)上,时不时地会有一些意外
谷歌街景(Google Street View)立功了,帮助警察侦破了一起谋杀案 Read More »
论文Towards Democratization of Subspeciality Medical Expe
AMIE(Articulate Medical Intelligence Explorer):基于大语言模型(LLM)的心血管领域医疗人工智能系统 Read More »