用于深度学习推理的整数量化(Integer Quantization):原理与经验评估
对于深度学习推理的整数量化(Quantization),这篇论文《用于深度学习推理的整数量化:原理与经验评估》 […]
用于深度学习推理的整数量化(Integer Quantization):原理与经验评估 Read More »
对于深度学习推理的整数量化(Quantization),这篇论文《用于深度学习推理的整数量化:原理与经验评估》 […]
用于深度学习推理的整数量化(Integer Quantization):原理与经验评估 Read More »
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backb
MambaVision:一种新型混合Mamba-Transformer视觉Backbone Read More »
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 G
PaliGemma:一种可有效进行任务迁移的视觉语言模型(VLM) Read More »
细胞存储(cell storage)指的是将细胞样本保存起来,以便在未来需要时可以取出使用。这项技术在医疗、研
关于细胞存储(cell storage) Read More »
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限
测试时训练层Test-Time Training(TTT),一种新的序列建模层 Read More »
论文《MobileLLM:优化适用于设备上使用的十亿参数以下语言模型》(MobileLLM: Optimizi
MobileLLM:优化适用于设备上使用的十亿参数以下语言模型 Read More »