人工智能AI

科学、艺术与技术的交汇：用科学与艺术的结合启发材料研发创新

科学、艺术与技术的交汇：用科学与艺术的结合启发材料研发创新

2024-11-18NullThoughtTech,科学AI,工程,音乐

麻省理工学院（MIT）工程教授Markus J. Buehler开发了一种基于图（Graph-based）的生...

Boltz-1：能够达到AlphaFold3精度的生物分子开源建模工具

Boltz-1：能够达到AlphaFold3精度的生物分子开源建模工具

2024-11-18NullThoughtTech,科学AI,医疗/生物医药

论文Boltz-1: Democratizing Biomolecular Interaction Model...

让ChatGPT基于对自己的了解，画出一幅生活场景图

让ChatGPT基于对自己的了解，画出一幅生活场景图

2024-11-18NullThoughtTech,杂谈AI,ChatGPT,OpenAI

向ChatGPT提出要求：based on what you know about me. draw a pi...

Evo：基因组尺度上的生成式AI生物基础模型

2024-11-16NullThoughtTech,科学AI,医疗/生物医药,多模态

Evo是由Arc研究所（Arc Institute）、斯坦福大学和加州大学伯克利分校的研究团队开发的生成式AI...

浅谈知识蒸馏（Knowledge Distillation）

浅谈知识蒸馏（Knowledge Distillation）

2024-11-15NullThoughtTechAI,AI模型泛化,蒸馏（Distillation）

知识蒸馏（Knowledge Distillation）是一种模型压缩技术，旨在通过从大型的复杂模型（教师模型...

通过令牌选择（Token Selection），实现Transformer的内存高效微调

通过令牌选择（Token Selection），实现Transformer的内存高效微调

2024-11-15NullThoughtTechAI,Meta,Transformer模型,大语言模型LLM

微调是利用预训练的大型模型在特定下游任务上获得最佳性能的一种有效方法，特别是对于大型语言模型（LLMs）和其他...

用蒸馏（Distilling）让复杂推理（System 2）“转换”为快速、直觉化推理（System 1）

用蒸馏（Distilling）让复杂推理（System 2）“转换”为快速、直觉化推理（System 1）

2024-11-15NullThoughtTechAI,Meta,大语言模型LLM,蒸馏（Distillation）

论文Distilling System 2 into System 1（《将系统2蒸馏到系统1》）研究了一种将...

AI对科学发现和产品创新的影响

AI对科学发现和产品创新的影响

2024-11-13NullThoughtTech,科学AI,人文,物理,经济

MIT的Aidan Toner-Rodgers博士基于其研究成果发表论文Artificial Intellig...

MedGo：中文医学领域的大型语言模型

MedGo：中文医学领域的大型语言模型

2024-11-13NullThoughtTechAI,健康,医疗/生物医药,大语言模型LLM

MedGo 是一个专门针对中文医学领域的大型语言模型，论文MedGo: A Chinese Medical L...

DeepMind正式宣布学术界的科学家可以下载AlphaFold3代码并进行非商业用途的使用

2024-11-12NullThoughtTech,科学AI,医疗/生物医药,谷歌

Nature发表文章AI protein-prediction tool AlphaFold3 is now...

思维链CoT要有选择地使用

思维链CoT要有选择地使用

2024-11-12NullThoughtTechAI,多模态,大语言模型LLM

论文Mind Your Step (by Step): Chain-of-Thought can Reduce...

Google在软件工程中AI应用的进展和未来方向

Google在软件工程中AI应用的进展和未来方向

2024-11-11NullThoughtIT,TechAI,AI时代老码农,大语言模型LLM,工程,谷歌

谷歌首席执行官桑达尔·皮查伊（Sundar Pichai）之前提到，目前谷歌新生成的代码中超过四分之一是由AI...

物理法则视角的视频生成

物理法则视角的视频生成

2024-11-08NullThoughtTechAI,AI模型泛化,Transformer模型,物理,计算机视觉（CV）

论文How Far is Video Generation from World Model: A Physi...

关系复杂！对网络数据集之间关系的分析

关系复杂！对网络数据集之间关系的分析

2024-11-08NullThoughtTechAI,大语言模型LLM,谷歌

论文Relationships are Complicated! An Analysis of Relatio...

Elon Musk聊了聊机器人Optimus（擎天柱）近况

2024-11-08NullThoughtTechAI,Elon Musk,制造,工程,机器人

科技大咖John Carmack(@ID_AA_Carmack)谈了自己对机器人的看法，对人形机器人（ hum...

MoICL：上下文学习混合模型

MoICL：上下文学习混合模型

2024-11-07NullThoughtTechAI,Transformer模型,大语言模型LLM

论文Mixtures of In-Context Learners提出了一种名为“上下文学习混合模型（MoIC...