人工智能AI

BEHAVIOR-1K 是一个面向“人类真实需求”的具身智能/家用机器人基准:它把 1,000 个日常家庭活动(清洁、烹饪、整理等)形式化为可评测的长时程任务,并提供成套模拟、数据与工具,用来训练与评估移动操作(mobile manipulation)智能体。任务来源于大规模人类 Read more
论文NucleoBench: A Large-Scale Benchmark of Neural Nucleic Acid Design Algorithms构建了目前规模最大的核酸设计基准 NucleoBench。 论文作者为Joel Shor,Erik Strand,Cory Read more
一、体贴的AI “需不需要...”,“要不要,或是...”,“如果你希望...,我可以...”,“继续说,我给你加...”,AI辅助编程时,AI真是循循善诱,温柔体贴啊。用的是ChatGPT 5-Thinking。 二、网站文章的访问量反映出当前AI研究的热点 这些天,这篇笔记“ Read more
一、让AI给一段代码排个序 自己吭哧吭哧手工排序可能要花5分钟,让AI排一下,几秒钟就Ok了。 开发IDE用studio.firebase.google.com,内嵌的AI自然是Google Gemini了。 二、看OpenAI Codex更新介绍 Codex 的演进:最初随 C Read more
论文Why Language Models Hallucinate试图给出一个从统计学习角度“可证明”的解释:为什么语言模型会产生“幻觉”(hallucination)——即“看似合理但事实上为假的内容”。作者首先把注意力聚焦于“合理性”的文本空间,承认现实中还存在明显无意义的输 Read more
关于AI辅助编程: 1)千万不要低估AI的能力; 2)向AI提需求不要畏手畏脚,大胆地提,前提是把需求和问题尽可能说细、说清楚。输入的需求可以是多模态; 3)你要有能力检查AI的输出。 On AI-assisted programming: Read more
一、研究背景与动机 生成式人工智能(Generative AI)近年来在图像合成、自然语言处理、分子设计等多个领域取得显著进展,例如GAN、VAE、Diffusion Model 和 LLM 等模型。随着这些模型规模不断扩大,其在推理阶段的能耗、延迟和计算资源需求也急剧上升,限制 Read more
论文Small Language Models are the Future of Agentic AI系统性阐述一个重要观点:在智能体(Agentic AI)系统快速发展背景下,小语言模型(SLMs)不仅足够强大,而且更适合、更经济,因此将成为智能体AI未来的主流。这一立场基于 Read more
星舰Starship IFT 10中,大气reentry时,可以看到flap的根部已被烧蚀了部分,但其姿态和飞行控制,仍能让其到达预定地点并splashdown。谈谈其可能用到的飞行和姿态控制技术。ChatGPT 5 Thinking的回答如下: 下面按“发生了什么—它是怎么稳住 Read more
一、智能体的总体技术架构 一个面向桥梁养护的智能体系统,可分为以下几个主要技术子系统: 这六部分协同构建智能体核心能力:“理解 + 预测 + 推理 + 建议”。 二、技术模块详细分析与实现路径 1. 垂类大模型(桥梁养护领域) 目标:为理解、总结、归纳桥梁养护问题,提供自然语言问 Read more
🔍 Genie 3 主要特性与技术突破 • 实时互动与高视觉质量 • 场景记忆与一致性 • 可提示的世界事件(Promptable World Events) • 可用于训练智能体(Embodied Agents) ⚠️ Genie 3 的局限性 ✨ 应用前景与价值评估 Read more
论文SensorLM: Learning the Language of Wearable Sensors提出了一个名为 SensorLM 的模型,该模型能够通过自然语言理解可穿戴传感器数据。 论文作者为Yuwei Zhang, Kumar Ayush, Siyuan Qiao, Read more