Diffusion Transformer (DiT)
扩散模型在图像生成上长期以卷积式 U-Net 为主干,但论文Scalable Diffusion Models […]
Diffusion Transformer (DiT) Read More »
扩散模型在图像生成上长期以卷积式 U-Net 为主干,但论文Scalable Diffusion Models […]
Diffusion Transformer (DiT) Read More »
论文Going Deeper with Convolutions发表于2014年,论文的研究验证了通过稠密组件
关于卷积网络的一篇老论文:Inception架构 Read More »
论文Language-Guided Image Tokenization for Generation提出的T
TexTok:基于文本条件引导的图像分词框架。在编码器(Tokenizer)与解码器(Detokenizer)中均引入图像对应的文字描述嵌入,作为语义条件,指导图像的压缩与重建 Read More »
FireSat计划的核心目标是利用人工智能(AI)和卫星技术实现早期野火探测,以在火灾扩散前进行有效干预。该项
野火监测卫星系统FireSat技术原理分析 Read More »
论文Transformers without Normalization的研究证明了Transformer可以
无归一化Transformer:用Dynamic Tanh (DyT)取代层归一化(Layer Normalization, LN) Read More »
论文SANA-Sprint: One-Step Diffusion with Continuous-Time
SANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,实现高速文生图(text-to-image , T2I) Read More »