人工智能AI

TimesFM：跨领域零样本预测的时序基础模型

TimesFM：跨领域零样本预测的时序基础模型

2025-02-05NullThoughtTechAI,AI模型泛化,Transformer模型,工程,谷歌

论文A decoder-only foundation model for time-series forec...

Mind Evolution：结合基因搜索算法与LLM的生成能力，利用进化策略在自然语言空间中高效搜索解决方案

Mind Evolution：结合基因搜索算法与LLM的生成能力，利用进化策略在自然语言空间中高效搜索解决方案

2025-01-25NullThoughtTechAI,大语言模型LLM,谷歌

论文Evolving Deeper LLM Thinking提出了一种创新的进化搜索策略——Mind Evol...

Gated DeltaNet架构：结合门控机制和Delta更新规则，提升线性Transformer在长序列建模和信息检索任务中的表现

Gated DeltaNet架构：结合门控机制和Delta更新规则，提升线性Transformer在长序列建模和信息检索任务中的表现

2025-01-24NullThoughtTechAI,NVIDIA,Transformer模型,大语言模型LLM

论文Gated Delta Networks: Improving Mamba2 with Delta Rul...

人工智能（AI）设计的药物有望在2025年年底前进入临床试验

2025-01-22NullThoughtTech,科学AI,医疗/生物医药,谷歌

诺贝尔奖得主、Google DeepMind首席执行官Demis Hassabis于1月21日（周二）表示，他...

基于现场可编程门阵列（FPGA）机器学习（ML）加速器的研究现状及发展趋势

基于现场可编程门阵列（FPGA）机器学习（ML）加速器的研究现状及发展趋势

2025-01-22NullThoughtTechAI,Transformer模型,物联网,电子电气,集成电路

论文A survey on FPGA-based accelerator for ML models对基于现场...

Physics-IQ（物理智商？）基准数据集：测试生成性视频模型在理解物理原则方面的能力

Physics-IQ（物理智商？）基准数据集：测试生成性视频模型在理解物理原则方面的能力

2025-01-22NullThoughtTech,科学AI,物理,谷歌

论文Do generative video models learn physical principles...

rStar-Math：有效提升小型语言模型（Small Language Models, SLMs）在数学推理任务中的表现

rStar-Math：有效提升小型语言模型（Small Language Models, SLMs）在数学推理任务中的表现

2025-01-16NullThoughtTech,科学AI,Deepseek,微软,数学,蒸馏（Distillation）

论文rStar-Math: Small LLMs Can Master Math Reasoning with...

智能代理（Agents）+用户偏好模拟（Sims）+助理（Assistants）=新型智能代理生态系统

智能代理（Agents）+用户偏好模拟（Sims）+助理（Assistants）=新型智能代理生态系统

2025-01-16NullThoughtTechAI,代理型AI/Agentic AI/AI代理/AI智能体/AI Agent,微软

论文Agents Are Not Enough认为，仅具有代理能力不足以解决问题，构建一个包含智能代理、用户偏...

复值循环神经网络（Complex-Valued Recurrent Neural Network，cv-RNN）：从数学层面理解神经网络的决策过程

复值循环神经网络（Complex-Valued Recurrent Neural Network，cv-RNN）：从数学层面理解神经网络的决策过程

2025-01-14NullThoughtTech,科学AI,数学,计算机视觉（CV）

论文Image segmentation with traveling waves in an exactly...

AI伴侣（AI Companions）改变大众的生活

2025-01-14NullThoughtTechAI,微软,社会

微软AI部门CEO Mustafa Suleyman近期在Time撰文AI Companions Will C...

FACTS Grounding：用于评估大型语言模型（LLMs）基于长文档生成事实性（factuality ）准确回答能力的基准测试

2025-01-13NullThoughtTechAI,大语言模型LLM,谷歌

幻觉（Hallucinations，即事实性不准确的回答）依然困扰着大型语言模型（LLMs）。尤其是在面对更复...

PCNDE框架（Physics-constrained coupled neural differential equations，物理约束神经微分方程）：实现较高精度和计算效率的1D血流模型

PCNDE框架（Physics-constrained coupled neural differential equations，物理约束神经微分方程）：实现较高精度和计算效率的1D血流模型

2025-01-10NullThoughtTech,科学AI,医疗/生物医药,物理

论文Physics-constrained coupled neural differential equat...

TabPFN（Tabular Prior-data Fitted Network），这是一种基于生成式Transformer模型的表格数据基础模型

TabPFN（Tabular Prior-data Fitted Network），这是一种基于生成式Transformer模型的表格数据基础模型

2025-01-09NullThoughtTech,科学AI,Transformer模型,工程

论文Accurate predictions on small data with a tabular fou...

浅谈In-Context Learning (ICL)，“上下文学习” 、 “情境学习”或者“内在学习”

2025-01-09NullThoughtTechAI,大语言模型LLM

In-Context Learning (ICL) 可翻译为 “上下文学习” 、 “情境学习”或者“内在学习”...

GraphToken：实现图推理（graph reasoning）能力显著提升

GraphToken：实现图推理（graph reasoning）能力显著提升

2025-01-08NullThoughtTechAI,大语言模型LLM,工程,谷歌

论文Let Your Graph Do the Talking: Encoding Structured Da...

NVIDIA推出Cosmos世界基础模型（World Foundation Model）平台

2025-01-07NullThoughtTechAI,NVIDIA,工程,物理

NVIDIA 宣布推出 NVIDIA Cosmos™，一个包含最先进的生成性世界基础模型、先进的标记器、保护机...