YouTube-SL-25:一个大规模的开放领域多语言手语平行语料库
论文YouTube-SL-25: A Large-Scale, Open-Domain Multilingua...
Read More一个典型的无监督深度学习成功研究案例:Unsupervised representation learning on high-dimensional clinical data improves genomic discovery and prediction
高维临床数据(HDCD)在生物银行(Biobank)级别的数据集中越来越多,但在遗传学研究中的应用仍具有挑战性...
Read MoreGBRL, Gradient Boosting Reinforcement Learning, 梯度增强强化学习
摘要 论文Gradient Boosting Reinforcement Learning介绍了梯度增强强化学...
Read MoreDoRA: Weight-Decomposed Low-Rank Adaptation(权重分解低秩适配)
论文DoRA: Weight-Decomposed Low-Rank Adaptation(权重分解低秩适配)...
Read More用于深度学习推理的整数量化(Integer Quantization):原理与经验评估
对于深度学习推理的整数量化(Quantization),这篇论文《用于深度学习推理的整数量化:原理与经验评估》...
Read MoreMambaVision:一种新型混合Mamba-Transformer视觉Backbone
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backb...
Read MorePaliGemma:一种可有效进行任务迁移的视觉语言模型(VLM)
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 G...
Read More四个顶级实践,帮助企业架构(EA)和技术创新(TI)领导者为人工智能(AI)项目增值
Gartner于2023年4月发布题为《4 Top Practices That Help EA/TI Lea...
Read More测试时训练层Test-Time Training(TTT),一种新的序列建模层
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限...
Read More化学中的LLMs,Large Language Models and Autonomous Agents in Chemistry
论文《A Review of Large Language Models and Autonomous Age...
Read More达索系统(Dassault Systèmes)宣布与Mistral AI合作
近日,达索系统(Dassault Systèmes)宣布与 Mistral AI 建立合作关系,以尖端的人工智...
Read More