关于卷积网络的一篇老论文:Inception架构
论文Going Deeper with Convolutions发表于2014年,论文的研究验证了通过稠密组件 […]
关于卷积网络的一篇老论文:Inception架构 Read More »
论文Going Deeper with Convolutions发表于2014年,论文的研究验证了通过稠密组件 […]
关于卷积网络的一篇老论文:Inception架构 Read More »
论文Language-Guided Image Tokenization for Generation提出的T
TexTok:基于文本条件引导的图像分词框架。在编码器(Tokenizer)与解码器(Detokenizer)中均引入图像对应的文字描述嵌入,作为语义条件,指导图像的压缩与重建 Read More »
FireSat计划的核心目标是利用人工智能(AI)和卫星技术实现早期野火探测,以在火灾扩散前进行有效干预。该项
野火监测卫星系统FireSat技术原理分析 Read More »
论文Transformers without Normalization的研究证明了Transformer可以
无归一化Transformer:用Dynamic Tanh (DyT)取代层归一化(Layer Normalization, LN) Read More »
论文SANA-Sprint: One-Step Diffusion with Continuous-Time
SANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,实现高速文生图(text-to-image , T2I) Read More »
近年来,机器人技术和具身人工智能(Embodied AI)领域取得了显著进展,特别是在模仿学习(Imitati
DINO-WM:基于预训练视觉特征,可实现零样本(Zeor-shot)规划的世界模型(World Model ) Read More »