通过裁剪(Pruning)和知识蒸馏(Knowledge Distillation)实现紧凑的语言模型
论文《通过裁剪和知识蒸馏实现紧凑的语言模型》(Compact Language Models via Prun […]
通过裁剪(Pruning)和知识蒸馏(Knowledge Distillation)实现紧凑的语言模型 Read More »
论文《通过裁剪和知识蒸馏实现紧凑的语言模型》(Compact Language Models via Prun […]
通过裁剪(Pruning)和知识蒸馏(Knowledge Distillation)实现紧凑的语言模型 Read More »
Miles Cranmer是剑桥大学助理教授,他于2024年4月在Simons Foundation发表的演讲
Miles Cranmer的演讲:用神经网络发现科学真知 Read More »
论文《MobileLLM:优化适用于设备上使用的十亿参数以下语言模型》(MobileLLM: Optimizi
MobileLLM:优化适用于设备上使用的十亿参数以下语言模型 Read More »