fix: modify readme format

569d167e · Zhihong Ma · bc233acc · 569d167e
Commit 569d167e authored Apr 28, 2023 by Zhihong Ma
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 0 deletions

mzh/new_mzh/ResNet_nobias/readme.md
+3 -0

No files found.
--- a/mzh/new_mzh/ResNet_nobias/readme.md
+++ b/mzh/new_mzh/ResNet_nobias/readme.md
 ## update: <br>2023.4.28<br>
 ### 目标工作：尝试去解决“预测模型收敛速度”方面的问题
 - 问题：按照原有思路，通过QAT from scratch获得前5/10/15/20个epoch的loss下降量和训练梯度相似度进行拟合。但根据qat.py得到的数据结果并不太好。<br>主要有两个方面的问题：<br>(1)出现了距离(即 相似度的差异性)过大、且变化过大(出现了显著的数量级差异，且规律与预期不符)的问题。<br>(2) 对不同量化方式的数据，loss的下降量有正有负，换言之，没有一个明显的loss在减小的趋势，数值较为随机。<br>
 - 实验：针对上述问题，我进行了一系列观察、思考、实验，修改了qat.py中可能存在的问题，得到new_qat.py，还新增了model_foldbn.py, 修改了module.py.<br>
 ### 分析与实验：
 1. 问题与方案：
 - 量化模型中将BN fold进了Conv，因此我尝试仿照量化中的fold过程，在全精度模型训练时也将BN fold进Conv，具体的代码在module.py和model_foldbn.py中。我对fold后的全精度模型进行了训练验证，其可以正常更新权值参数，提升推理精度，但训练的收敛速度明显变慢了(ResNet18_foldbn在80个epoch时acc才40%)。
 - qat.py中model和model_ptq都使用了同一个optimizer，在new_qat.py将其改为两个optimizer，分别为两个model的参数进行优化。