PaddleOCR-VL与DeepSeek-OCR

一、PaddleOCR-VL 是什么(核心设计与能力) 二、DeepSeek-OCR 是什么(核心理念与能力)...
Read More

量子计算机第一次在真实硬件上成功运行可验证算法

Google宣布一项研究成果,历史上第一次实现量子计算机在真实硬件上成功运行可验证的算法,其速度甚至超过最快的...
Read More

AB-UPT(Anchored-Branched Universal Physics Transformer):具备较高准确性和效率的CFD建模替代

经典CFD(Computational Fluid Dynamics)仿真在汽车与航空航天外流场分析中耗时高、...
Read More

SINQ:无校准均匀量化

大型语言模型(LLM)在部署端最常用的压缩路径是后训练量化(Post-training quantizatio...
Read More
SimPoly:通过基于第一性原理的机器学习力场(MLFF)方法进行聚合物模拟仿真

SimPoly:通过基于第一性原理的机器学习力场(MLFF)方法进行聚合物模拟仿真

聚合物具有多尺度、强相互作用耦合等复杂性,传统经典力场(如 PCFF/OPLS)在可迁移性与精度上常受限,而从...
Read More
鸡脚杈

鸡脚杈

网上看到这个,第一反应是它的味道。小时候吃过,齁甜齁甜,还有一股淡淡的酒味儿。 老家万载管这个叫作“鸡脚杈”,...
Read More
第1000篇

第1000篇

第一千篇,Mark一下。 本博大多是些技术笔记,是Online Personal Notes Happily...
Read More
DeepSeek-OCR:不是“一目十行”,而是“百行”乃至“千行”的上下文理解

DeepSeek-OCR:不是“一目十行”,而是“百行”乃至“千行”的上下文理解

当今大模型在处理长文本时,注意力计算随长度二次增长,算力与显存压力巨大。DeepSeek的最新模型DeepSe...
Read More

模型坍塌(model collapse)

论文AI models collapse when trained on recursively genera...
Read More

ChatGPT的新建聊天中,能否指定一个或多个历史聊天记录作为本次对话的context?其实这是一个硬需求

短答:不能在“普通新建聊天”里直接指定某几段“历史对话”作为上下文自动载入。 但有几种官方支持的替代方案,能实...
Read More

整合MinerU + Chonkie + RAG-Anything 的 RAG系统技术实现

今日略研究了一下整合MinerU + Chonkie + RAG-Anything 的 RAG系统技术实现:...
Read More
Reducto 与 RAG-Anything 的比较与分析

Reducto 与 RAG-Anything 的比较与分析

Reducto 和 RAG-Anything 都利用视觉-语言模型(VLM)来增强对多模态文档的理解,确保图像...
Read More
A/B测试、灰度测试

A/B测试、灰度测试

一、A/B 测试是什么 在同一时间窗口里,将用户随机分到两个(或多个)版本中,对比核心指标的差异,以判断新方案...
Read More
星舰Starship超级重型助推器上栅格翼的重大升级

星舰Starship超级重型助推器上栅格翼的重大升级

星舰Starship超级重型助推器Super Heavy Booster的栅格翼(grid fins)进行了“...
Read More

AI应用初创公司的护城河:专有数据

投资公司Andreessen Horowitz(a16z)对AI应用初创公司的建议:可以转向规模不重要的赛道,...
Read More
包含数据/模型/工程三位一体内容的机器人学习(Robot Learning)教程

包含数据/模型/工程三位一体内容的机器人学习(Robot Learning)教程

Robot Learning: A Tutorial是一篇面向研究者与实践者的“机器人学习”教程型综述,主张在...
Read More

RAG Chunking原则

Chunking的目标不是“平均分字数”,而是让每个块都在语义上自洽、可被独立检索,且能回到原文定位,以支撑...
Read More
Reducto:给LLM/RAG喂料(结构化数据)的产品

Reducto:给LLM/RAG喂料(结构化数据)的产品

今日试用了Reducto的产品,可以用于RAG,例如专业文档的chunking。 Reducto公司介绍 一、...
Read More

里程碑式的星舰Starship IFT 11成功达成所有设定目标

2025年10月13日(周一)晚6:23(美国中部时间,CT),星舰(Starship)在德州星基地(Star...
Read More
DeepMMSearch-R1:通过“多工具、多轮交互”检索增强推理循环,实现面向真实网页的多模态检索/推理一体化

DeepMMSearch-R1:通过“多工具、多轮交互”检索增强推理循环,实现面向真实网页的多模态检索/推理一体化

现实应用中的多模态大模型(MLLM)在知识密集与信息检索型视觉问答任务上常受限于静态训练语料与长尾知识分布,难...
Read More

主流时序数据库(TSDB)及对比分析

主流时序数据库(Time-Series Database, TSDB)按核心定位一般分成四大类: 一、各产品要...
Read More
Paper2Video:从论文自动生成学术展示视频

Paper2Video:从论文自动生成学术展示视频

论文Paper2Video: Automatic Video Generation from Scientif...
Read More

中国2B软件市场还有出路吗?

此文《不要在中国做to B软件》(作者:朱建明 James) 提到了中国to B软件市场的6大特征:1 关系销...
Read More
案发现场

案发现场

很显然,有一只猫在此享用了它的猎物。 作案者肯定是一只流浪猫,生存压力所迫,原始的捕猎技能迸发。家猫是饭来张口...
Read More
寻路型AI(Wayfinding AI):打造“更像医生”的健康对话系统

寻路型AI(Wayfinding AI):打造“更像医生”的健康对话系统

现代人获取健康信息的入口极多,但也伴随低质信息、理解偏差与焦虑等风险。大型语言模型(LLMs)虽然在医学知识与...
Read More
ReasoningBank:构建“面向推理的记忆”机制,使智能体实现自主进化能力

ReasoningBank:构建“面向推理的记忆”机制,使智能体实现自主进化能力

大型语言模型(LLM)驱动的智能体正被用于长期、持续的真实世界任务(如网页浏览、软件工程自动化),但主流智能体...
Read More

浅谈LiDAR(Light Detection and Ranging)

一、LiDAR 的基本原理 二、关键器件与系统构型 三、核心性能指标怎么读 四、误差来源与标定 五、点云处理与...
Read More

稀土金属

中文名(拼音) 英文名 符号 原子序数 典型用途(举例) 钪(kàng) Scandium Sc 21 铝合金...
Read More