训练与微调中等

LoRA 的原理是什么？为什么能省显存？

#低秩适配#参数高效微调#显存优化

题目

请说明 LoRA（Low-Rank Adaptation）的原理，并解释它为什么能显著节省微调显存。

核心思想：假设模型权重的更新具有”低秩”特性，即 $\Delta W$ 可以用两个小矩阵的乘积近似：

$\Delta W = B A,\quad A \in \mathbb{R}^{r\times k},\ B \in \mathbb{R}^{d\times r},\ r \ll \min(d,k)$

微调时冻结原权重 $W$ ，只训练新增的 $A$ 、 $B$ 。前向为 $y = Wx + BAx$ 。

为什么省显存：

显存对比（7B 模型）：

面试加分点：

出处：开源仓库 wdndev/llm_interview_note、CSDN 大模型面经。

内容来源

整理自开源仓库 wdndev/llm_interview_note 及 CSDN 大模型面经

本站内容整理自公开面经与开源仓库，仅供学习交流，严禁杜撰。