Star Attention算法:有效提升大型语言模型(LLM)在长序列推理任务中的效率
论文《Star Attention: Efficient LLM Inference over Long Se […]
Star Attention算法:有效提升大型语言模型(LLM)在长序列推理任务中的效率 Read More »
论文《Star Attention: Efficient LLM Inference over Long Se […]
Star Attention算法:有效提升大型语言模型(LLM)在长序列推理任务中的效率 Read More »
浮点计算的演变是硬件与软件协同进化的结果,推动了科学研究和人工智能的进步。未来,混合精度计算、仿真、能效设计及
浮点运算(Floating-Point Computations)的演化 Read More »
论文《Hymba: A Hybrid-head Architecture for Small Language
Hymba:用于小型语言模型的混合头架构(Hybrid-head Architecture) Read More »
论文DexMimicGen: Automated Data Generation for Bimanual D
DexMimicGen:通过模仿学习实现双手灵巧操作的数据自动生成 Read More »
论文SANA: Efficient High-Resolution Image Synthesis with
SANA:一种用于生成高分辨率(最高可达4096×4096)的文本到图像生成框架 Read More »
论文FACTS About Building Retrieval Augmented Generation-b
“FACTS”框架:基于检索增强生成(RAG)的聊天机器人构建框架 Read More »