大模型的微调/精调(Fine-tuning, 译为精调更为准确些)是指在预训练的大规模模型基础上,使用较小规模的领域数据或任务数据对模型继续训练,以适应特定任务的过程。它是迁移学习(Transfer Learning)的一种核心形式。 一、微调的基本原理 大模型(如GPT、BER Read more
论文LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models提出的LLaMAFactory,是当前最全面、可扩展性极强的LLM高效微调框架之一,兼具技术深度与实用性。在解决统一性、易用性与训练效率这三大 Read more
近日,彼得·蒂尔(Peter Thiel)与《纽约时报》专栏作家罗斯·道森(Ross Douthat)进行了对谈,内容涵盖科技停滞(Technological Stagnation)、人工智能、火星殖民、长寿、政治、宗教等主题。蒂尔在本次访谈中展现出罕见的多维思考能力。他将技术、 Read more
论文KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills提出了一种基于物理的人形机器人控制框架,旨在通过多步骤动作处理和自适应动作追踪,掌握如功夫和舞蹈等高动 Read more
论文Chain-of-Thought Is Not Explainability揭示了一个关于人工智能的重要误解:仅仅因为一个模型解释了它的推理步骤,并不意味着它揭示了真实的推理过程。 ✅ CoT 所给出的“理由”可以看似合理地为有偏差的输出辩护,却无法揭示真正的隐藏影响因素。✅ Read more
论文Going Deeper with Convolutions发表于2014年,论文的研究验证了通过稠密组件模拟稀疏连接结构是一种实用有效的深度网络构建方式,尤其适用于计算预算受限场景。GoogLeNet在ILSVRC 2014分类与检测任务中均取得领先成绩,论文提出的Ince Read more
内积(Inner Product)和卷积(Convolution)虽然在数学表达式上有些相似,但它们的本质、几何意义、应用目的和计算方式是完全不同的。 一、目的和语义对比 维度内积卷积✨ 目的衡量两个向量的全局相似性捕捉输入的局部模式特征(如边缘、语义片段)🎯 计算粒度整体对整体 Read more
内积(Inner Product)是线性代数中一个基本而核心的概念,是衡量两个向量之间相似程度或“对齐程度”的数学工具。在不同的语境下,内积也被称为点积(Dot Product)、数量积(Scalar Product),在信息检索、机器学习中常用来衡量两个向量的相似性。以下是对内 Read more
论文MUVERA: Multi-Vector Retrieval via Fixed Dimensional Encodings提出MUVERA这一理论与实践兼备的多向量检索新框架。该框架通过构建FDE(固定维度编码,Fixed Dimensional Encodings)有效将 Read more
论文Elevator fault diagnosis based on digital twin and PINNs-e-RGCN建立了一个具有三自由度的电梯垂直振动数值模型,并将所得的运动方程作为约束条件,利用物理信息神经网络(PINNs)生成模拟振动数据。随后,本文提出的e- Read more
论文Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task的研究结合神经科学、自然语言处理与主观访谈,系统评估了LLM对学习者认 Read more
这个观点具有一定的前瞻性,也引发了对未来教育体系变革的深入思考。以下从几个角度对其进行评论: 一、观点合理之处:AI提升了学习效率和资源获取的便捷性随着AI技术的发展,特别是智能辅导系统、自适应学习平台、语言模型问答助手的普及,学生可以在个性化节奏下掌握知识点。传统义务教育体系中 Read more