通过令牌选择(Token Selection),实现Transformer的内存高效微调
微调是利用预训练的大型模型在特定下游任务上获得最佳性能的一种有效方法,特别是对于大型语言模型(LLMs)和其他...
Read More用蒸馏(Distilling)让复杂推理(System 2)“转换”为快速、直觉化推理(System 1)
论文Distilling System 2 into System 1(《将系统2蒸馏到系统1》)研究了一种将...
Read MoreDeepMind正式宣布学术界的科学家可以下载AlphaFold3代码并进行非商业用途的使用
Nature发表文章AI protein-prediction tool AlphaFold3 is now...
Read More比尔·盖茨谈气候变化、能源、全球健康和教育,以及人工智能如何帮助改变这些领域
近日,里德(Reid Hoffman)和阿里亚与比尔·盖茨一起讨论了他主要关注的领域:气候变化、能源、全球健康...
Read MoreDexMimicGen:通过模仿学习实现双手灵巧操作的数据自动生成
论文DexMimicGen: Automated Data Generation for Bimanual D...
Read More











