[论文阅读] Knowledge Distillation via the Target-aware Transformer
发布于 2023-03-13
参考资料: CVPR2022 | 通过目标感知Transformer进行知识蒸馏 – 掘金 (juejin.cn) (53条消息) ̷
科技数码互联网,代码改变生活
参考资料: CVPR2022 | 通过目标感知Transformer进行知识蒸馏 – 掘金 (juejin.cn) (53条消息) ̷
原文 Abstract 知识蒸馏(KD)是一种流行的技术,以转移知识从教师模型或集合到学生模型。它的成功通常归因于关于教师模型和学 …
预备知识 BIFPN 参考链接:Bi FPN – 知乎 (zhihu.com) 随着网络层数的加深,网络的感受野逐渐变大,语义表达 ̷