可视化查看deepseek R1蒸馏(llama-8B)模型结构
可视化查看了一下deepseek R1蒸馏(llama-8B)模型(ONNX格式)的结构。 模型360层,op […]
可视化查看deepseek R1蒸馏(llama-8B)模型结构 Read More »
可视化查看了一下deepseek R1蒸馏(llama-8B)模型(ONNX格式)的结构。 模型360层,op […]
可视化查看deepseek R1蒸馏(llama-8B)模型结构 Read More »
ChatGPT的输出文本中,中文常出现“旨在”,英文“Delve”一词有较高的出现频率,这是其特有的AI味儿。
不同大模型有其特有的AI味儿—大模型的“癖好”或特质(idiosyncrasy) Read More »
论文Learning from Reward-Free Offline Data: A Case for Pl
用ChatGPT o3-mini-high分析Deepseek刚开源的FlashMLA。上传FlashMLA工
用ChatGPT o3-mini-high分析Deepseek刚开源的FlashMLA Read More »
论文Genome modeling and design across all domains of life
Evo 2:涵盖所有生命领域基因组数据集的生物学基础模型 Read More »
ChatGPT输出的中文内容,常喜欢用“旨在”这词儿。故每次用AI辅助写作时,只要有“旨在”,俺都要将其改掉,
AI味儿浓郁的词,中文如“旨在”,英文如“Delve” Read More »