DeepSeek-R1技术报告概述 发表评论 / Tech / NullThought 近年来,大规模语言模型(LLMs)的快速发展使其在推理、代码生成、科学计算等任务上展现出越来越强的能力,逐步缩 […] DeepSeek-R1技术报告概述 Read More »
rStar-Math:有效提升小型语言模型(Small Language Models, SLMs)在数学推理任务中的表现 发表评论 / Tech, 科学 / NullThought 论文rStar-Math: Small LLMs Can Master Math Reasoning with rStar-Math:有效提升小型语言模型(Small Language Models, SLMs)在数学推理任务中的表现 Read More »
DeepSeek-V3技术报告概述 发表评论 / Tech / NullThought 一、简介 近年来,大型语言模型(LLM)取得了飞速发展,向通用人工智能(AGI)迈进的步伐越来越快。DeepS DeepSeek-V3技术报告概述 Read More »
让大模型扮演猴子 发表评论 / Tech, 科学 / NullThought 论文Large Language Monkeys: Scaling Inference Compute wit 让大模型扮演猴子 Read More »