Anthropic基于circuit tracing揭示LLM内部机制
✅ 首次在超大模型(Claude 3.5)中系统性实施circuit tracing分析; ✅ 揭示模型行为不...
Read More六代战机F-47综合分析报告(ChatGPT Deep Research)
报告由ChatGPT Deep Research分析得出,耗时11分钟,综合检索了43个信息源。以下具体信息仅...
Read More1661年至1912年,中英美日四国历史并行时间线图(政治、军事、经济、教育事件)
听一个历史讲座视频时,临时起意,想了解清朝同年代英、美、日的一些重要历史事件。于是乎让ChatGPT Deep...
Read More无归一化Transformer:用Dynamic Tanh (DyT)取代层归一化(Layer Normalization, LN)
论文Transformers without Normalization的研究证明了Transformer可以...
Read MoreSANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,实现高速文生图(text-to-image , T2I)
论文SANA-Sprint: One-Step Diffusion with Continuous-Time...
Read More基于神经特征函数匹配(Neural Characteristic Function Matching, NCFM)方法的数据集蒸馏:GPU 内存使用量减少300倍以上,处理速度提升20倍
深度神经网络(DNN)在各种任务上取得了巨大成功,其中一个关键因素是大规模训练数据的可用性。然而,在存储受限的...
Read MoreOpenAI GPT-4.5 系统说明(OpenAI GPT-4.5 System Card)
一、引言GPT-4.5 是 OpenAI 迄今为止最大、最具知识性的 AI 模型,其目标是相较于前代模型(如...
Read More


-1024x439.png)








