人工智能AI

AI辅助编程，需求尽量定义清楚

AI辅助编程，需求尽量定义清楚

2025-03-10NullThoughtIT,TechAI,AI时代老码农

AI辅助编程，把需求定义清楚，尽可能定义到细节，可让效率大增。需求定义多花10分钟，大概率会在后续编程调试中节...

基于神经特征函数匹配（Neural Characteristic Function Matching, NCFM）方法的数据集蒸馏：GPU 内存使用量减少300倍以上，处理速度提升20倍

基于神经特征函数匹配（Neural Characteristic Function Matching, NCFM）方法的数据集蒸馏：GPU 内存使用量减少300倍以上，处理速度提升20倍

2025-03-03NullThoughtTechAI,工程,数学,蒸馏（Distillation）

深度神经网络（DNN）在各种任务上取得了巨大成功，其中一个关键因素是大规模训练数据的可用性。然而，在存储受限的...

OpenAI GPT-4.5 系统说明（OpenAI GPT-4.5 System Card）

OpenAI GPT-4.5 系统说明（OpenAI GPT-4.5 System Card）

2025-03-02NullThoughtTechAI,AI安全,ChatGPT,OpenAI,大语言模型LLM

一、引言GPT-4.5 是 OpenAI 迄今为止最大、最具知识性的 AI 模型，其目标是相较于前代模型（如...

“大事不决看英国”，凯末尔说过这句话吗？

“大事不决看英国”，凯末尔说过这句话吗？

2025-03-02NullThought杂谈AI,ChatGPT,Deepseek,OpenAI,历史,政治,谷歌

综合ChatGPT, Gemini和Deepseek的回答，应该是没有说过。尽管查无实据，但这句话本身的有道...

可视化查看deepseek R1蒸馏（llama-8B）模型结构

2025-03-01NullThoughtTechAI,Deepseek,大语言模型LLM,蒸馏（Distillation）

可视化查看了一下deepseek R1蒸馏（llama-8B）模型（ONNX格式）的结构。模型360层，op...

不同大模型有其特有的AI味儿—大模型的“癖好”或特质（idiosyncrasy）

不同大模型有其特有的AI味儿—大模型的“癖好”或特质（idiosyncrasy）

2025-02-27NullThoughtTechAI,大语言模型LLM

ChatGPT的输出文本中，中文常出现“旨在”，英文“Delve”一词有较高的出现频率，这是其特有的AI味儿。...

在JEPA （Joint Embedding Predictive Architecture，联合嵌入预测架构）模型的潜在空间中进行规划，可在新环境布局泛化、轨迹拼接和数据效率方面获得良好效果

在JEPA （Joint Embedding Predictive Architecture，联合嵌入预测架构）模型的潜在空间中进行规划，可在新环境布局泛化、轨迹拼接和数据效率方面获得良好效果

2025-02-25NullThoughtTechAI,AI模型泛化,Meta

论文Learning from Reward-Free Offline Data: A Case for Pl...

用ChatGPT o3-mini-high分析Deepseek刚开源的FlashMLA

用ChatGPT o3-mini-high分析Deepseek刚开源的FlashMLA

2025-02-24NullThoughtIT,TechAI,ChatGPT,Deepseek,NVIDIA,OpenAI

用ChatGPT o3-mini-high分析Deepseek刚开源的FlashMLA。上传FlashMLA工...

Evo 2：涵盖所有生命领域基因组数据集的生物学基础模型

Evo 2：涵盖所有生命领域基因组数据集的生物学基础模型

2025-02-21NullThoughtTech,科学AI,Transformer模型,医疗/生物医药,多模态

论文Genome modeling and design across all domains of life...

AI味儿浓郁的词，中文如“旨在”，英文如“Delve”

2025-02-20NullThoughtTech,杂谈AI,ChatGPT,OpenAI

ChatGPT输出的中文内容，常喜欢用“旨在”这词儿。故每次用AI辅助写作时，只要有“旨在”，俺都要将其改掉，...

NSA（Native Sparse Attention）机制：原生可训练的稀疏注意力架构，通过硬件对齐优化和算法创新实现高效长序列建模

NSA（Native Sparse Attention）机制：原生可训练的稀疏注意力架构，通过硬件对齐优化和算法创新实现高效长序列建模

2025-02-19NullThoughtTechAI,Deepseek,Transformer模型,大语言模型LLM

论文Native Sparse Attention: Hardware-Aligned and Nativel...

UltraMem：利用大规模的超稀疏内存层（Ultra-Sparse Memory Layer）显著提升Transformer模型性能

UltraMem：利用大规模的超稀疏内存层（Ultra-Sparse Memory Layer）显著提升Transformer模型性能

2025-02-19NullThoughtTechAI,Transformer模型,大语言模型LLM

论文Ultra-Sparse Memory Network提出了一种名为UltraMem的新型神经网络架构，解...

Token Statistics Transformer：通过引入TSSA（Token Statistics Self-Attention）注意力模块，显著降低Transformer的计算复杂度和内存需求

Token Statistics Transformer：通过引入TSSA（Token Statistics Self-Attention）注意力模块，显著降低Transformer的计算复杂度和内存需求

2025-02-19NullThoughtTech,科学AI,Transformer模型

论文Token Statistics Transformer: Linear-Time Attention v...

采用非对称数字系统（ANS）和波列树（Wavelet Trees）的无损压缩方法，对近似最近邻搜索（ANNS）中的向量ID和图结构进行优化

采用非对称数字系统（ANS）和波列树（Wavelet Trees）的无损压缩方法，对近似最近邻搜索（ANNS）中的向量ID和图结构进行优化

2025-02-19NullThoughtTech,科学AI,Meta,数学

论文Lossless Compression of Vector IDs for Approximate Ne...

DINO-WM：基于预训练视觉特征，可实现零样本（Zeor-shot）规划的世界模型（World Model ）

DINO-WM：基于预训练视觉特征，可实现零样本（Zeor-shot）规划的世界模型（World Model ）

2025-02-19NullThoughtTechAI,Meta,Transformer模型,代理型AI/Agentic AI/AI代理/AI智能体/AI Agent,机器人,计算机视觉（CV）

近年来，机器人技术和具身人工智能（Embodied AI）领域取得了显著进展，特别是在模仿学习（Imitati...

生成式AI（Generative AI，GenAI）导致人类批判性思维（Critical Thinking）能力下降？

2025-02-17NullThoughtTechAI,人文,微软

论文The Impact of Generative AI on Critical Thinking: Sel...