shtaxxx日記

コンピュータアーキテクチャについて研究している研究者の日記や技術紹介

2019-04-22から1日間の記事一覧

KLダイバージェンスを用いた異なる量子化パラメータの比較

NVIDIAのINT8量子化では、 KL Divergenceを使って活性値の分布をより正確に近似できる量子化パラメータ(最大値と最小値)を探索しているらしいので、それを実装してみた。 量子化前後でヒストグラムのビンの幅が異なるので、そのままではKLダイバージェンス…