对人工智能AI的一些胡思乱想: 1.目前阶段的机器学习过程是一个数据拟合过程,是超高维空间的超级数据拟合; 2.AI模型能够破解部分事物的运行机理/规律。模型有了,基于模型的预测是有效的,从而说明破解是有效的。但破解是“暴力”的,即便其模型尚无完备的数学证明,能用海量数据和超强算 Read more
“卓如啊,一代人只能干一代人的事”,李合肥对年轻的梁任公感叹道。意思应该是,我做我的“裱糊匠”,你们后生一代干好自己的事儿。 对话是电视连续剧《走向共和》里的一个场景。李鸿章督粤时,梁启超前往拜会。梁向李中堂提出上中下三策,试探并暗劝李大人当行上策,拥两广自立并成为Preside Read more
Meta近日发布了Llama 3基础模型组,模型支持多语言、编程、推理和工具使用。最大的模型具有4050亿参数,能处理长达128K tokens的上下文。与Llama 2相比,Llama 3在数据质量、训练规模和复杂性管理方面做了显著改进。模型在多个任务上的性能与GPT-4相当。 Read more
看视频时,一个画面上的文字很模糊。好奇心作祟,盯着屏幕看了半天想看清楚,但无果。 截图丢给ChatGPT,让其识别,很快给出答案。答案是很确切的提示,反过来再去看屏幕,确认没问题。 进一步问此截图来自哪部电影。也答对了,是《变形金刚》("Transformers" 2007)。 Read more
论文YouTube-SL-25: A Large-Scale, Open-Domain Multilingual Sign Language Parallel Corpus(《YouTube-SL-25:一个大规模的开放领域多语言手语平行语料库》)主要研究手语数据不足的问题,特别 Read more
第41界机器学习国际大会(International Conference on Machine Learning, ICML 2024)于2024年7月21日到27日在奥地利维也纳召开。看看大会所接受论文(Accepted papers)列表,可以了解当前机器学习研究的最新动态 Read more
天空像是要下雨的节奏。看到个知了壳,脑海中有如下两个联想: 1.“今天只有殘留的軀殼,迎接光輝歲月,風雨中抱緊自由…”---Beyond 2.“下雨,收衣服呀”---唐僧 Read more
论文The Regulation of Clinical Artificial Intelligence主要探讨了临床人工智能(AI)的监管问题,特别是生成型人工智能(GAI)的监管挑战和可能的解决方案。文章由David Blumenthal和Bakul Patel撰写,两位作者 Read more
高维临床数据(HDCD)在生物银行(Biobank)级别的数据集中越来越多,但在遗传学研究中的应用仍具有挑战性。论文Unsupervised representation learning on high-dimensional clinical data improves ge Read more
用Google搜索“乱花渐...”,搜索自动给出的search hints都错了,都是“乱花渐入...”,正确的应该是“乱花渐欲...”。 很显然,大量用户的错误输入被喂进了搜索引擎。过多被污染的数据用于算法,输出结果的准确度自然会降低。 除了用户主动错误输入产生的数据污染,在A Read more
网上看到如下题目。天平左边,一个乒乓球悬浮于一杯水内;右边,一个铁球悬挂浸入一杯水内。两边的水杯一模一样,水的刻度相同。乒乓球和铁球大小一样。 乱花渐欲迷人眼,先不过多考虑拉力、浮力啥的。俺的思考,做了个小的思想实验: 1.左边的水假设是不透明的,则你看到的就是一杯水,只不过水缺 Read more
Miles Cranmer是剑桥大学助理教授,他于2024年4月在Simons Foundation发表的演讲The Next Great Scientific Theory is Hiding Inside a Neural Network很有启发性。 俺对视频内容的总结:先“ Read more
Google Research近日提到,在其从事连接组学(Connectomics,一门研究神经元之间连接模式的科学,旨在揭示大脑功能和行为的基础)研究十年之后,其实才刚刚开始。展望未来,谷歌研究团队与哈佛大学及其他机构的合作伙伴正在努力绘制小鼠海马体的图谱,海马体是大脑中与学习 Read more
摘要 论文Gradient Boosting Reinforcement Learning介绍了梯度增强强化学习(GBRL),它将梯度增强树(GBT)与强化学习(RL)结合。作者指出,尽管神经网络在各种任务中取得了显著成果,但它们通常缺乏可解释性,不适合处理分类数据或在边缘设备上 Read more
论文DoRA: Weight-Decomposed Low-Rank Adaptation(权重分解低秩适配)介绍了一种新的参数高效微调方法(PEFT)——DoRA,其旨在缩小LoRA和完全微调(FT)之间的准确性差距。通过将预训练权重分解为幅度和方向两个部分,DoRA专门采用L Read more
训练AI模型就像是炼丹…😄 #AI模型训练 #炼丹看公司小伙伴训练AI模型,通过优化输入层例如拉宽数值时间区间和增加典型特征值,调整隐藏层层级和改变部分层的类型,模型的验证精度提升了30多个百分点。 #炼丹⚗️持续中~公司小伙伴报告,服务器端AI模型经过低位整型化处理后,运行效率 Read more
对于深度学习推理的整数量化(Quantization),这篇论文《用于深度学习推理的整数量化:原理与经验评估》(Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluatio Read more
Nvidia这两天发布了MambaVision,即一种新型混合Mamba-Transformer视觉Backbone。针对的MambaVision的研究在论文《MambaVision: A Hybrid Mamba-Transformer Vision Backbone》有具体阐 Read more
PaliGemma 是一个开放的视觉语言模型(VLM),它结合了 SigLIP-So400m 视觉编码器和 Gemma-2B 语言模型。其目标是提供一个多功能的基础模型,能够有效迁移到各种任务,在近40个不同的任务中表现出色,包括标准的 VLM 基准测试以及更专业的任务如遥感和分 Read more
Gartner于2023年4月发布题为《4 Top Practices That Help EA/TI Leaders Add Value to Artificial Intelligence Initiatives》的报告,详细探讨了如何通过企业架构(EA)和技术创新(TI)领 Read more
细胞存储(cell storage)指的是将细胞样本保存起来,以便在未来需要时可以取出使用。这项技术在医疗、研究和生物技术领域有着广泛的应用。以下是一些关键点: 细胞存储技术的进步为医疗和科研提供了强大的支持,有望在未来进一步推动生物医学和生物技术的发展。 个性化医疗(preci Read more
纽约时报近日发表文章Wildlife Protections Take a Back Seat to SpaceX’s Ambitions,文章指责SpaceX忽视了生态保护,对星舰基地周边的生态环境造成不利影响,例如鸟类鸻鹬(piping plover)种群有所下降。 Spac Read more
一、LoRA(Low-Rank Adaptation) LoRA(Low-Rank Adaptation)是一种在机器学习和深度学习领域使用的技术,主要用于在大规模预训练模型(如BERT、GPT等)上进行高效的参数微调。LoRA的核心思想是通过限制模型参数的变化范围来减少微调所需 Read more
来自Roboflow的Piotr Skalski正在研究的足球AI项目⚽,很有趣。实现了如下功能: 1.训练一个自定义目标检测模型来检测球、球员和裁判;2.球员跟踪(尝试使用ByteTRACK、StrongSORT等方法);3.训练一个自定义关键点检测模型来检测足球场的特征点;4 Read more
自注意力机制在长上下文中表现良好,但其复杂度为二次方。现有的RNN层具有线性复杂度,但其在长上下文中的性能受限于其隐藏状态的表达能力。论文Learning to (Learn at Test Time): RNNs with Expressive Hidden States提出了 Read more
论文《MobileLLM:优化适用于设备上使用的十亿参数以下语言模型》(MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases)探讨了在移动设备上部署大语言模型(LLM Read more
来自Microsoft Research的最新研究成果:From Local to Global: A Graph RAG Approach to Query-Focused Summarization(《从局部到全球:基于图的RAG方法实现查询聚焦总结》),作者为Darren Read more
论文《A Review of Large Language Models and Autonomous Agents in Chemistry》,探讨了大型语言模型(LLMs)及其在化学领域中的应用,以及基于LLMs的自主代理在化学研究中的应用和潜力。论文作者为Mayk Cald Read more
《曙色》,电视剧《走向共和》的片头主题曲,徐沛东作曲,陈晓光作词。徐沛东原唱。 一年年 花开花落,冬去春来,草木又蓬勃一页页 历史翻过,前浪远去,后浪更磅礴一座座 火山爆发,天崩地裂,君王美梦破一顶顶 皇冠落地,斗转星移,世事有新说 风吹过 雨打过,铁蹄践踏过;火烧过 刀砍过,列 Read more
近日,来自University of California, Davis的Soroush Abbasi Koohpayegani介绍了他和其他几位作者的研究论文Compact3D: Smaller and Faster Gaussian Splatting with Vector Read more
2024年6月30日,天兵科技(https://spacepioneer.cc)的天龙三号火箭进行试车。试车过程中,一子级火箭脱离发射台升空,并跌落山中后解体。火箭的“试车”变成了“试飞”。问了问ChatGPT 4o对这件事的看法。 回答中规中矩但清汤寡水,有点儿“理中客”味道, Read more
战斗机在执行高迎角机动时,飞行员所承受的载荷或“G力”可能会有显著差异,具体取决于所执行的特定机动动作。对于一架F-22猛禽战斗机执行高迎角机动,G力可以在以下范围内变化: 飞行员经过严格的训练以承受这些高G力,包括身体素质训练和反G力锻炼,以防止G力诱发的意识丧失(G-LOC) Read more
近日,达索系统(Dassault Systèmes)宣布与 Mistral AI 建立合作关系,以尖端的人工智能技术彻底变革行业!🌟🤝 合作将把达索系统产品的虚拟孪生体验和主权云基础设施与 Mistral 强大的大型语言模型(LLMs)结合起来,通过先进的人工智能技术提升其行业解 Read more
腾讯AI实验室近日发表论文《利用10亿个虚拟身份扩展合成数据创建》(Scaling Synthetic Data Creation with 1,000,000,000 Personas)。论文针对合成数据提出了很创新的思路和技术方法👍 论文讨论了一种利用大型语言模型(LLM)进 Read more
杨立昆(Yann LeCun)教授列出了一系列机器学习方法与物理学的相似之处,或者说关联( ML methods connected with physics)。Insightful👍 物理 vs. 人工智能,两者的后面都是数学。 - variational Bayesian i Read more
两栖攻击舰USS Tarawa (LHA-1)的Wiki页面显示,该舰的最新状态为“将作为目标被击沉(To be sunk as a target)”。2024 年 4 月 30 日,该舰已从海军登记册中除名(Stricken from the naval r Read more
文笔行云流水,气韵丰沛;见解精辟深刻,入木三分。读陈旭麓先生的《近代中国社会的新陈代谢》,如品尝精美大餐,色香味俱全,且营养丰富👍👍 书中文句摘抄若干如下。这些精彩的历史评论中,有些是对现实的警告。 创深痛巨唤起了改革旧物的最初意识。 战争的权威性,在于它把矛盾置于生死存亡之中, Read more
Meta发布了Meta LLM Compiler,这是一个基于Meta Code Llama构建的模型家族,具备额外的代码优化和编译器功能。这些模型在代码尺寸优化和反汇编任务上达到了最先进的水平。 LLM Compiler 可以模拟编译器,预测代码尺寸的最佳传递路径,并进行代码反 Read more
模型泛化(Model Generalization)和可解释AI(Explainable AI,XAI)在机器学习和人工智能的研究和应用中有着紧密的联系。两者的关系主要体现在以下几个方面: 1. 模型性能和信任度的平衡 2. 模型复杂度与可解释性的权衡 3. 提高泛化能力的策略 Read more
合成数据(Synthetic Data)是指通过计算机程序或算法生成的数据,而不是通过实际的测量或观察得到的真实数据。合成数据在机器学习和人工智能领域具有广泛的应用,因为它能够解决许多现实世界中遇到的数据问题。以下是合成数据的详细解释及其主要应用: 合成数据的生成方法 合成数据的 Read more
The differences between subsonic, supersonic, and hypersonic speeds are as follows: These speed classifications are crucial for aerospace en Read more
陈旭麓、杨奎松、杨国强、茅海建,还有沈志华,都是华东师范大学教授,或者曾经是~👍👍 Read more
计算机图像和模式识别2024年度大会(Computer Vision and Pattern Recognition 2024 conference, CVPR2024)上,论文“Rich Human Feedback for Text-to-Image Generation”获 Read more
计算机图像和模式识别2024年度大会(Computer Vision and Pattern Recognition 2024 conference, CVPR2024)上,论文“Generative Image Dynamics”获评最佳论文。论文作者为Zhengqi Li, Read more
Nuclei.io使病理学家能够快速创建多样化的数据集和模型,用于多种临床关键应用。为了验证该框架的有效性,该项目研究人员采用病理学家与人工智能协作的方法进行了两项交叉用户研究。在这两项研究中,人工智能的使用在病理诊断的敏感性、确定性和效率方面均显著提升。项目的研究结果验证了所提 Read more
来自Google Research的Juan Manuel Zambrano Chaves、来自Google DeepMind的Eric Wang以及其他多名研究人员近期在论文Tx-LLM: A Large Language Model for Therapeutics中提出了T Read more
Federico Barbero等近期发表论文:Transformers need glasses👓: Information over-squashing in language tasks,研究了仅解码器结构的Transformer(decoder-only Transfor Read more
这张图片展示了一个用于分析振动数据的特征设计工具界面,带有显示从振动信号中提取的各种统计特征的直方图。以下是该图像的详细技术分析: 界面概览 变量窗格 特征 列出的特征包括: 详情窗格 直方图分析 每个直方图代表特定特征的分布,按 faultCode(0 或 1)分开,表示是否存 Read more
几点简单的读后感: 一、“其形其容,既不要夸大,也不要缩小;其神其貌,既不要骄横,也不要猥琐。就是一个本来的他就好了”,这是作者在书中评论沈阳(奉天)大帅府中张作霖塑像的一段话。能够看出,作者对书中五位叱诧风云的近代历史人物,袁世凯、黎元洪、段祺瑞、吴佩孚和张作霖的生平叙述和历史 Read more
看到如下这个优雅的极限等式,让ChatGPT 4o给出了证明。欣赏丝滑优美的证明过程也是种享受。 Read more
Human I/O是一种统一的方法,它使用自我中心视觉(egocentric vision)、多模态感知(multimodal sensing)和大语言模型推理(LLM reasoning)来检测情境性障碍,并评估用户在特定情境下使用手、视觉、听觉或语音进行交互的能力。 我们每天 Read more
论文《BAKU:用于多任务策略学习的高效transformer架构》BAKU: An Efficient Transformer for Multi-Task Policy Learning 作者: Siddhant Haldar, Zhuoran Peng, Lerrel Pi Read more