Apple 基础模型 (AFM)
Apple 在其 2024 年全球开发者大会上介绍了 Apple Intelligence,这是一种集成在 i […]
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backb
MambaVision:一种新型混合Mamba-Transformer视觉Backbone Read More »
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限
测试时训练层Test-Time Training(TTT),一种新的序列建模层 Read More »