NSA(Native Sparse Attention)机制:原生可训练的稀疏注意力架构,通过硬件对齐优化和算法创新实现高效长序列建模
论文Native Sparse Attention: Hardware-Aligned and Nativel...
Read MoreUltraMem:利用大规模的超稀疏内存层(Ultra-Sparse Memory Layer)显著提升Transformer模型性能
论文Ultra-Sparse Memory Network提出了一种名为UltraMem的新型神经网络架构,解...
Read MoreToken Statistics Transformer:通过引入TSSA(Token Statistics Self-Attention)注意力模块,显著降低Transformer的计算复杂度和内存需求
论文Token Statistics Transformer: Linear-Time Attention v...
Read More采用非对称数字系统(ANS)和波列树(Wavelet Trees)的无损压缩方法,对近似最近邻搜索(ANNS)中的向量ID和图结构进行优化
论文Lossless Compression of Vector IDs for Approximate Ne...
Read MoreDINO-WM:基于预训练视觉特征,可实现零样本(Zeor-shot)规划的世界模型(World Model )
近年来,机器人技术和具身人工智能(AI)领域取得了显著进展,特别是在模仿学习(Imitation Learni...
Read More生成式AI(Generative AI,GenAI)导致人类批判性思维(Critical Thinking)能力下降?
论文The Impact of Generative AI on Critical Thinking: Sel...
Read MoreEmbodiedBench:专门用于评估视觉驱动具身智能体(Vision-Driven Embodied Agents)的基准测试框架
近年来,具身智能体(Embodied Agents)在人工智能研究中受到了越来越多的关注。这些智能体需要具备理...
Read More核热推进器(nuclear thermal propulsion , NTP)测试
据悉,美国国家航空航天局(NASA)与通用原子公司(General Atomics)正在合作测试用于航天的核热...
Read MoreOpenAI o3-mini 系统说明(OpenAI o3-mini System Card)
OpenAI o3-mini是 OpenAI 研发的一款增强推理能力的语言模型,其核心训练方法采用大规模强化学...
Read More利用混合整数线性优化(Mixed-Integer Linear Programming, MILP)改进 PINNs初始权重,提高训练收敛速度和精度
物理信息神经网络(Physics-Informed Neural Networks,PINNs)是一种新兴的深...
Read More心理测量学(Psychometrical Methodology)技术可用于优化大语言模型LLM的基准测试
论文Improving LLM Leaderboards with Psychometrical Method...
Read MoreASAP框架:有效解决仿真与现实世界之间的动力学不匹配问题,实现人形机器人在现实世界中的高效全身运动控制
论文ASAP: Aligning Simulation and Real-World Physics for...
Read More优化空间布局、提升输电和储能能力、增强电力需求响应,以及充分利用技术学习效应,有效加速能源转型和促进碳减排
论文Accelerating the energy transition towards photovolta...
Read MoreMind Evolution:结合基因搜索算法与LLM的生成能力,利用进化策略在自然语言空间中高效搜索解决方案
论文Evolving Deeper LLM Thinking提出了一种创新的进化搜索策略——Mind Evol...
Read MoreGated DeltaNet架构:结合门控机制和Delta更新规则,提升线性Transformer在长序列建模和信息检索任务中的表现
论文Gated Delta Networks: Improving Mamba2 with Delta Rul...
Read More基于现场可编程门阵列(FPGA)机器学习(ML)加速器的研究现状及发展趋势
论文A survey on FPGA-based accelerator for ML models对基于现场...
Read MorePhysics-IQ(物理智商?)基准数据集:测试生成性视频模型在理解物理原则方面的能力
论文Do generative video models learn physical principles...
Read MorerStar-Math:有效提升小型语言模型(Small Language Models, SLMs)在数学推理任务中的表现
论文rStar-Math: Small LLMs Can Master Math Reasoning with...
Read More智能代理(Agents)+用户偏好模拟(Sims)+助理(Assistants)=新型智能代理生态系统
论文Agents Are Not Enough认为,仅具有代理能力不足以解决问题,构建一个包含智能代理、用户偏...
Read More复值循环神经网络(Complex-Valued Recurrent Neural Network,cv-RNN):从数学层面理解神经网络的决策过程
论文Image segmentation with traveling waves in an exactly...
Read MoreFACTS Grounding:用于评估大型语言模型(LLMs)基于长文档生成事实性(factuality )准确回答能力的基准测试
幻觉(Hallucinations,即事实性不准确的回答)依然困扰着大型语言模型(LLMs)。尤其是在面对更复...
Read More