基于神经特征函数匹配(Neural Characteristic Function Matching, NCFM)方法的数据集蒸馏:GPU 内存使用量减少300倍以上,处理速度提升20倍
深度神经网络(DNN)在各种任务上取得了巨大成功,其中一个关键因素是大规模训练数据的可用性。然而,在存储受限的 […]
深度神经网络(DNN)在各种任务上取得了巨大成功,其中一个关键因素是大规模训练数据的可用性。然而,在存储受限的 […]
一、引言GPT-4.5 是 OpenAI 迄今为止最大、最具知识性的 AI 模型,其目标是相较于前代模型(如
OpenAI GPT-4.5 系统说明(OpenAI GPT-4.5 System Card) Read More »
可视化查看了一下deepseek R1蒸馏(llama-8B)模型(ONNX格式)的结构。 模型360层,op
可视化查看deepseek R1蒸馏(llama-8B)模型结构 Read More »
ChatGPT的输出文本中,中文常出现“旨在”,英文“Delve”一词有较高的出现频率,这是其特有的AI味儿。
不同大模型有其特有的AI味儿—大模型的“癖好”或特质(idiosyncrasy) Read More »
SpaceX发布了星舰Starship第七次飞行测试(IFT7)的调查报告。报告称谐波响应(harmonic
谐波响应(harmonic response)导致星舰Starship在第七次飞行测试(IFT7)中解体? Read More »
论文Learning from Reward-Free Offline Data: A Case for Pl