神戸大学附属図書館デジタルアーカイブ
入力補助
English
カテゴリ
学内刊行物
ランキング
アクセスランキング
ダウンロードランキング
https://hdl.handle.net/20.500.14094/0100491826
このアイテムのアクセス数:
114
件
(
2025-08-04
14:58 集計
)
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
0100491826 (fulltext)
pdf
1.72 MB
120
メタデータ
ファイル出力
メタデータID
0100491826
アクセス権
open access
出版タイプ
Accepted Manuscript
タイトル
Semilayer-Wise Partial Quantization Without Accuracy Degradation or Back Propagation
著者
Matsuda, Tomoya ; Matsumoto, Kengo ; Inoue, Atsuki ; Kawaguchi, Hiroshi ; Sakai, Yasufumi
著者名
Matsuda, Tomoya
著者名
Matsumoto, Kengo
著者名
Inoue, Atsuki
著者ID
A0302
研究者ID
1000000361642
ORCID
0000-0001-8677-4733
KUID
https://kuid-rm-web.ofc.kobe-u.ac.jp/search/detail.html?systemId=b584e37f288df9e9520e17560c007669
著者名
Kawaguchi, Hiroshi
川口, 博
カワグチ, ヒロシ
所属機関名
科学技術イノベーション研究科
著者名
Sakai, Yasufumi
言語
English (英語)
収録物名
Artificial Neural Networks and Machine Learning – ICANN 2023
ページ
283-295
出版者
Springer
刊行日
2023-09-23
公開日
2024-10-22
抄録
In edge AI technologies, reducing memory bandwidth and computational complexity without reducing inference accuracy is a key challenge. To address this difficulty, partial quantization has been proposed to reduce the number of bits in weight parameters of neural network models. However, existing techniques monotonically degrade accuracy with the compression ratio without retraining. In this paper, we propose an algorithm for semilayer-wise partial quantization without accuracy degradation or back-propagation retraining. Each layer is divided into two channel groups (semilayers): one being positive for loss degradation and the other negative. Each channel is classified as positive or negative in terms of cross-entropy loss and assigned to a semilayer accordingly. The evaluation was performed with validation data as input. Then, the quantization priority for every semilayer is determined based on the magnitude in the Kullback-Leibler divergence of the softmax output before and after quantization. We observed that ResNet models achieved no degradation in accuracy at certain parameter compression ratios (i.e., 79.43%, 78.01%, and 81.13% for ResNet-18, ResNet-34, and ResNet-50, respectively) in partial 6-bit quantization on classification tasks using the ImageNet dataset.
キーワード
Partial Quantization
Sensitivity Analysis
Image Classification
カテゴリ
科学技術イノベーション研究科
会議発表論文
権利
© 2023 The Author(s), under exclusive license to Springer Nature Switzerland AG
関連情報
DOI
https://doi.org/10.1007/978-3-031-44201-8_24
ISBN
978-3-031-44200-1
OPACで所蔵を検索
CiNiiで学外所蔵を検索
ISBN
978-3-031-44201-8
OPACで所蔵を検索
CiNiiで学外所蔵を検索
詳細を表示
資源タイプ
conference paper
会議記述
会議名
32nd International Conference on Artificial Neural Networks
回次
32nd
開催期間
September 26–29, 2023
開催会場
Heraklion, Crete, Greece
ホームへ戻る