经典CFD(Computational Fluid Dynamics)仿真在汽车与航空航天外流场分析中耗时高、算力成本大,促使工业界寻求“神经替代(neural surrogate)”以数量级加速。AB-UPT(Anchored-Branched Universal Physics Transformer)此前已在高保真汽车外流场上展示出以极低训练/推理成本复现数值结果的能力。论文AB-UPT for Automotive and Aerospace Applications进一步把 AB-UPT 拓展到两套由 Luminary Cloud 生成的开放数据集:汽车的 SHIFT-SUV 与飞机的 SHIFT-Wing,并系统评估其在表面/体场预测、综合气动力(升/阻)等工程指标上的准确性与效率。核心结论是:AB-UPT 对两数据集均优于同类 Transformer 基线;在 Wing 上仅凭各向同性几何镶嵌(接近 CAD 网格)即可在秒级内高精度给出升阻力,训练可在单卡一天内完成,具备产业落地潜力。
论文作者为Benedikt Alkin, Richard Kurle, Louis Serrano, Dennis Just, Johannes Brandstetter,来自EMMI AI, Linz和ELLIS Unit Linz, Institute for Machine Learning, JKU Linz。
一、方法概述:AB-UPT 架构要点
- 点云式输入:直接以网格单元中心点作为“令牌”,同时建模表面与体积两域。
- 锚点-查询范式:训练时仅对大幅下采样的“锚点(anchor)”做自注意力,推理时其余全量点作为“查询(query)”仅跨注意到锚点,从而维持 O(N_anchor² + N_query·N_anchor) 的可控复杂度。
- 双分支耦合:表面分支与体积分支交替自/跨注意力交互,本报告中不共享两分支参数,实测略优且不增推理时延。
- 目标:同时回归表面压力 ps、表面剪切应力 τw,以及体积压力 pv、速度 u。升/阻力经表面积分由 ps、τw 计算并与真值对比。
二、数据集与物理背景
- SHIFT-SUV:基于 FKFS AeroSUV 平台(Fastback/Estate 两类型),全尺度/四分之一尺度共四类几何,本文使用全尺度训练评测。每个样本为 DDES 高保真瞬态仿真,验证配置网格约 4500 万体元,入流 30 m/s,滚动地板与车轮转动已建模。几何变形通过形变笼多参数协同实现(如前/后悬、风挡角、车高、后风窗角等)。
- SHIFT-Wing:以 NASA CRM 高速巡航构型为原型,参数化机翼平面形状与机身(展弦比、1/4 弦后掠、根部加宽因子、机身直径、三段扭转差等),覆盖 Ma=0.5 与 0.85 两马赫数、AoA∈[0°,4°]。采用 RANS/SA 模型与 Luminary 的自适应网格技术,自动加密激波等尖锐特征。
- 气动力定义:以表面压力差与壁面剪切在物面上积分得力 F,进一步与自由流方向/升力方向单位向量点乘得到 F_drag、F_lift;本文多用“力”而非系数,以避免接近 0 时相对误差失真。
三、实验与训练设置
- 模型与基线:与原 AB-UPT 设定一致的 12 层 Transformer、隐藏维 192、3 头注意力,MLP 扩展 4×;另训练更大模型(dim=384,6 头)。基线含 Transolver、标准 Transformer、以及点云神经算子 DoMINO。
- SHIFT-SUV 训练:全尺度 1996 个样本,随机 8/1/1 划分;体积随机取 10% 加速 IO;LION 优化器,峰值 LR=5e-5,5% 线性预热后余下余弦衰减至 1e-6;batch=1,EMA=1e-4;每步 16K 表面/体积分支锚点;FP16 混合精度,单张 H100 约 13.5 小时达成优良性能。
- SHIFT-Wing 训练:分别对 Ma=0.5(1138 样本)与 0.85(560 样本)单独建模;以 DiT 风格在各层对 AoA 做条件化;FP32 训练表现显著更好,但锚点降为 8K 控时;单卡 H100 约 25 小时到 400K 步版本。
四、定量结果与同类对比
- SHIFT-SUV:在 Estate 与 Fastback 两类上,AB-UPT-192 即优于 Transolver/Transformer/DoMINO;更大模型 AB-UPT-384 进一步降低表面/体场 MAE(例如表面 ps、τw 与体积 pv、u 全面改善)。联合训练 Estate+Fastback 明显优于只用单一子集,400K 更新优于 200K。
- SHIFT-Wing:对 Ma=0.5 与 0.85,AB-UPT 以更短 GPU-hours 获得优于基线的 MAE;延长到 400K 更新继续提升。分马赫建模优于合并训练并以马赫条件化。
- 相对误差:在 SUV 与 Wing 上分别报告相对 L1/L2,显示表面压力、体积压力等达到 1e-2% 量级(ps)或个位数/十位数百分比(τw、u)的低误差区间,符合工程可用性预期。
五、综合气动力(升/阻)预测
- SHIFT-SUV:阻力力值 R²≈0.96~0.98;Estate 的升力更具挑战(训练/测试中多数样本升力 < −200 N,导致极少数正升力尾部样本误差偏大),展现数据分布偏斜对极端区间的影响。
- SHIFT-Wing:Ma=0.5 与 0.85 的升/阻力在测试集上几乎“完美相关”(R²=1.00),最差个例误差 ≤2%。进一步做“小样本学习”实验,在仅 56 个训练样本时仍维持 R²≈0.99 的强相关性。
六、从各向同性几何(近 CAD 网格)的鲁棒推理
多数神经替代默认用“解网格”(高度各向异性、自适应加密),而工业早期评审往往只有几何三角化(近各向同性)。直接“零样本”把几何网格喂入以解网格训练的模型会显著失真(R² 下降、误差暴涨)。本文利用 AB-UPT 的锚/查询解耦:
• 训练时以几何网格采样表面锚点与几何分支输入;以规则栅格采体积分支锚点;查询仍来自仿真解网格并施加监督。这样模型学会仅依赖“几何+规则体积”的表示。
• 结果:对 Ma=0.85,改用几何网格做推理时,升/阻力 R² 恢复到 1.00,最差误差仅 3%~5% 量级。
七、效率分析(训练/推理)
- 训练:SUV-192 模型单卡 H100 ≈13.5h 即达标;Wing-FP32 400K 步 ≈25h。
- 推理(典型尺度):
• SUV:仅表面 300 万点 + 16K 体积锚点 ≈2.1 s;体积全场 4500 万点 ≈31.5 s;表面+体积全场 ≈33.6 s。
• Wing:以各向同性 CAD 表面 20 万点 + 8K 体积锚点,秒级(≈0.6 s)便可算出升/阻力;若解码完整 CFD 表面(300 万点)≈8.4 s;体积 600 万点 ≈16.8 s;表面+体积全量 ≈25.2 s。
八、优势、边界与误差剖析
- 优势:
• 统一点云表示与锚/查询策略,兼顾大规模注意力表达力与可扩展性;
• 双域(表/体)交互确保壁面量与尾迹体场耦合;
• 对 CAD/几何网格友好,可早期形状评审时快速给出升/阻力与关键剖面压力曲线;
• 数据需求相对温和(Wing 56 样本仍具高相关)。 - 边界:
• 受训练分布影响,对稀有工况(如 SUV 中升力>−200 N 的少数 Estate 几何)误差更大;
• Wing 需分马赫建模,跨物理差异过大的“合并版”未观察到迁移增益;
• τw 等梯度敏感量的相对误差仍高于压力与速度标量场。
九、与相关工作的关系
AB-UPT 属于“Transformer-化的神经算子”线路,与 OFormer、Transolver、Perceiver-系方法同属注意力驱动的跨尺度映射;相较 DoMINO 等点云神经算子,AB-UPT 在大规模外流场任务上呈现更佳的精度-时延折中;与“从 CAD 训练”的方案一致地通过锚/查询设计实现“几何→解网格”的域适配。
十、工程落地建议
- 目标优先:若只需综合气动力,优先用“CAD 表面 10~20 万点 + 规则体积锚点”的快速解码路径,0.6 s 级即可给出升/阻力。
- 采样策略:训练阶段固定少量锚点(8K/16K),体积分支随机下采样 10% 提速 IO;测试按需求决定查询密度(局部细节或全场)。
- 条件化要点:带 AoA 或多马赫工况时,采用块内条件化(如 DiT 风格);跨马赫建议分模型。
- 数据覆盖:对可能的“尾端工况”(如异常升力、极端后掠或扭转组合)适度超采样,提升极端区间稳健性。
十一、结论
AB-UPT 在 SHIFT-SUV 与 SHIFT-Wing 上系统验证了其作为外流场神经替代的“精度-效率双优”属性:单卡一日可得工程可用模型;在飞机巡航构型上,升/阻力预测几近完美相关;在仅有各向同性几何网格时仍能维持高精度与亚秒-秒级时延,适合设计空间探索、参数敏感性分析与多学科优化(MDO)前期筛选。本文结果清晰指向面向产业规模的 CFD 替代建模与设计闭环集成之路。