Meta

REFRAG (REpresentation For RAG) ：解决RAG处理大量外部知识时遇到的速度慢和内存占用大问题

发表评论 / Tech / NullThought

论文REFRAG: Rethinking RAG based Decoding介绍了一种名为 REFRAG ( […]

REFRAG (REpresentation For RAG) ：解决RAG处理大量外部知识时遇到的速度慢和内存占用大问题 Read More »

TensorGRaD：为神经算子的训练引入结构感知的张量级梯度压缩机制，兼具低秩与稀疏结构建模能力

发表评论 / Tech, 科学 / NullThought

论文TensorGRaD: Tensor Gradient Robust Decomposition for

TensorGRaD：为神经算子的训练引入结构感知的张量级梯度压缩机制，兼具低秩与稀疏结构建模能力 Read More »

无归一化Transformer：用Dynamic Tanh (DyT)取代层归一化（Layer Normalization, LN）

发表评论 / Tech, 科学 / NullThought

论文Transformers without Normalization的研究证明了Transformer可以

无归一化Transformer：用Dynamic Tanh (DyT)取代层归一化（Layer Normalization, LN） Read More »

在JEPA （Joint Embedding Predictive Architecture，联合嵌入预测架构）模型的潜在空间中进行规划，可在新环境布局泛化、轨迹拼接和数据效率方面获得良好效果

发表评论 / Tech / NullThought

论文Learning from Reward-Free Offline Data: A Case for Pl

在JEPA （Joint Embedding Predictive Architecture，联合嵌入预测架构）模型的潜在空间中进行规划，可在新环境布局泛化、轨迹拼接和数据效率方面获得良好效果 Read More »

采用非对称数字系统（ANS）和波列树（Wavelet Trees）的无损压缩方法，对近似最近邻搜索（ANNS）中的向量ID和图结构进行优化

发表评论 / Tech, 科学 / NullThought

论文Lossless Compression of Vector IDs for Approximate Ne

采用非对称数字系统（ANS）和波列树（Wavelet Trees）的无损压缩方法，对近似最近邻搜索（ANNS）中的向量ID和图结构进行优化 Read More »

DINO-WM：基于预训练视觉特征，可实现零样本（Zeor-shot）规划的世界模型（World Model ）

发表评论 / Tech / NullThought

近年来，机器人技术和具身人工智能（Embodied AI）领域取得了显著进展，特别是在模仿学习（Imitati

DINO-WM：基于预训练视觉特征，可实现零样本（Zeor-shot）规划的世界模型（World Model ） Read More »