人工智能AI

大语言模型与图灵测试

大语言模型与图灵测试

近年来,大规模预训练语言模型(LLM)的对话能力突飞猛进。2025年,Jones和Bergen发表论文《Lar...
Read More

Anthropic基于circuit tracing揭示LLM内部机制

✅ 首次在超大模型(Claude 3.5)中系统性实施circuit tracing分析; ✅ 揭示模型行为不...
Read More
Gemini Robotics模型体系

Gemini Robotics模型体系

一、研究背景与技术动机 近年来,大型多模态模型(Multimodal Foundation Models)的发...
Read More

六代战机F-47综合分析报告(ChatGPT Deep Research)

报告由ChatGPT Deep Research分析得出,耗时11分钟,综合检索了43个信息源。以下具体信息仅...
Read More
1661年至1912年,中英美日四国历史并行时间线图(政治、军事、经济、教育事件)

1661年至1912年,中英美日四国历史并行时间线图(政治、军事、经济、教育事件)

听一个历史讲座视频时,临时起意,想了解清朝同年代英、美、日的一些重要历史事件。于是乎让ChatGPT Deep...
Read More
野火监测卫星系统FireSat技术原理分析

野火监测卫星系统FireSat技术原理分析

FireSat计划的核心目标是利用人工智能(AI)和卫星技术实现早期野火探测,以在火灾扩散前进行有效干预。该项...
Read More
浅谈神经网络的归一化(Normalization)

浅谈神经网络的归一化(Normalization)

在神经网络中,归一化(Normalization) 是一种用于调整和标准化神经元激活值的方法,主要目的是 加速...
Read More
神鞭/大辫子→新玩意儿/枪

神鞭/大辫子→新玩意儿/枪

时代变了,大辫子派不上用场。适应时代,改用枪。 神鞭傻二说得好:“辫剪了,神留着。祖宗的东西再好,该割的时候就...
Read More
AI辅助编程,需求尽量定义清楚

AI辅助编程,需求尽量定义清楚

AI辅助编程,把需求定义清楚,尽可能定义到细节,可让效率大增。需求定义多花10分钟,大概率会在后续编程调试中节...
Read More
基于神经特征函数匹配(Neural Characteristic Function Matching, NCFM)方法的数据集蒸馏:GPU 内存使用量减少300倍以上,处理速度提升20倍

基于神经特征函数匹配(Neural Characteristic Function Matching, NCFM)方法的数据集蒸馏:GPU 内存使用量减少300倍以上,处理速度提升20倍

深度神经网络(DNN)在各种任务上取得了巨大成功,其中一个关键因素是大规模训练数据的可用性。然而,在存储受限的...
Read More
OpenAI GPT-4.5 系统说明(OpenAI GPT-4.5 System Card)

OpenAI GPT-4.5 系统说明(OpenAI GPT-4.5 System Card)

一、引言GPT-4.5 是 OpenAI 迄今为止最大、最具知识性的 AI 模型,其目标是相较于前代模型(如...
Read More
“大事不决看英国”,凯末尔说过这句话吗?

“大事不决看英国”,凯末尔说过这句话吗?

综合ChatGPT, Gemini和Deepseek的回答,应该是没有说过。 尽管查无实据,但这句话本身的有道...
Read More

可视化查看deepseek R1蒸馏(llama-8B)模型结构

可视化查看了一下deepseek R1蒸馏(llama-8B)模型(ONNX格式)的结构。 模型360层,op...
Read More