SINQ:无校准均匀量化
大型语言模型(LLM)在部署端最常用的压缩路径是后训练量化(Post-training quantizatio […]
当今大模型在处理长文本时,注意力计算随长度二次增长,算力与显存压力巨大。DeepSeek的最新模型DeepSe
DeepSeek-OCR:不是“一目十行”,而是“百行”乃至“千行”的上下文理解 Read More »
大型语言模型(LLM)正被用于构建“自驱动实验室(self-driving laboratories, SDL
用于自驱动实验室(self-driving laboratories, SDL)的AI智能体 Read More »
Reducto 和 RAG-Anything 都利用视觉-语言模型(VLM)来增强对多模态文档的理解,确保图像
Reducto 与 RAG-Anything 的比较与分析 Read More »
论文RAG-Anything: All-in-One RAG Framework提出 RAG-Anything
RAG-Anything: “面向一切模态”的统一 RAG 框架 Read More »
大型语言模型(LLM)在多任务上表现强劲,但“编造/幻觉”导致事实性不足,限制了实际可信度。论文SLED: S