热搜:

数据缩至 1/5000,模型准确率却翻倍,谷歌新“蒸馏法”火了 2024-11-05

在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就……