

PDF issue: 2024-05-28

微細化CMOSスタティックRAMの低消費電力化・高信頼 化設計に関する研究

藤原,英弘

<mark>(Degree)</mark> 博士(工学)

(Date of Degree) 2009-03-25

(Date of Publication) 2013-07-30

(Resource Type) doctoral thesis

(Report Number) 甲4612

(URL) https://hdl.handle.net/20.500.14094/D1004612

※ 当コンテンツは神戸大学の学術成果です。無断複製・不正使用等を禁じます。著作権法で認められている範囲内で、適切にご利用ください。



## 博士論文

# 微細化 CMOS スタティック RAM の 低消費電力化・高信頼化設計に 関する研究

平成 21 年 1 月

神戸大学大学院自然科学研究科

藤原英弘

## 内容梗概

本論文は、微細化CMOSスタティックRAM(SRAM: Static Random Access Memory)の 低消費電力化および高信頼化回路設計技術に関する研究成果をまとめたものである.

近年,システム LSI は様々な産業の基幹を担っており,システム LSI の信頼性の向 上および低消費電力化がますます重要となってきている.また,システム LSI には処 理データを記憶するメモリとして,高速,低消費電力,周辺回路が簡素,論理演算部 との混載が容易などという理由から,SRAM が広く用いられている.今後,コンピュ ータシステムにさらに高い処理能力が要求され,システム LSI における処理データ量 が大規模化するにしたがって,システム LSI に搭載される SRAM の記憶容量が増大す ることが予想されている.

以上に示した理由から、システム LSI の低消費電力化および高信頼化のためには、 SRAM の低消費電力化・高信頼化を行うことが最も重要な課題となる.しかし、MOS トランジスタの製造プロセスの微細化が進むにつれて、チップ間およびチップ内にお ける MOS トランジスタのしきい値電圧ばらつきが増大することにより、メモリセルの 安定動作性が低下し、SRAM の低電圧動作性の確保、および信頼性の維持が困難とな る.

本論文は6章で構成されており,第1章は序論である.第2章では,低消費電力化 および高信頼化に向けた SRAM の課題について述べる.

第3章では、回路設計技術による低消費電力化および高信頼化手法として、高信頼 モードを有する 7T/14T SRAM について詳述する.上記のとおり MOS トランジスタの しきい値ばらつきが増大することにより、SRAM の動作安定性が阻害される.それに 加えて、温度の変化、供給電圧の低下、経年劣化といった動作環境の変化によっても SRAM の動作安定性は低下する.また、暗号化プログラム、個人情報のデータと、ス クリーンセーバプログラムで扱うデータの重要性が異なるように、アプリケーション によって要求されるデータの信頼性は異なる.

提案した SRAM は必要なメモリの容量,電力,温度条件,速度,必要とされる信頼 性に応じて,ブロック単位で,1)従来の 6T メモリセルと同様の動作を行う通常モード, 2)高速アクセスが可能な高速モード,3)動作安定性が高い高信頼性モード,の3つの動 作モードに動的に切り替えることができる. 通常モードでは 7T メモリセルに 1bit のデ ータを保持し, 高速モードおよび高信頼性モードでは 14T メモリセルに 1bit のデータ を保持する.

65nm プロセスを用いてモンテカルロシミュレーションを行った結果, ビット不良率 が 10<sup>-8</sup>となる点で, 14T メモリセルは 7T メモリセルと比較して, 読出し動作の動作下 限電圧を 0.21V, 書込み動作の動作下限電圧を 0.26V 改善することを確認した. また, 提案した SRAM の高信頼性モードは, ECC(Error Correction Code)および MMR(Multi Module Redundancy)を従来の 6T メモリセルに用いた場合よりも低いビット不良率を実 現することができる. また, 65-nm プロセスを用いて 64-kb SRAM を試作し, 実測し た結果, 14T メモリセルは 7T メモリセルよりも 0.12V 低電圧で動作することを確認し た.

第4章では、プロセスと回路技術の協調設計による低消費電力化手法として、FD-SOI プロセスを用いたシステマチックばらつきを補正する基板バイアス電圧制御技術につ いて詳述する.システマチックばらつきは製造過程、方法に依存する.システマチッ ク成分のしきい値電圧ばらつきを抑えるために、すでにバルクプロセスに対する基板 バイアス電圧制御技術が提案されている.しかし、バルクプロセスにおいて順方向バ イアス電圧を用いる場合、接合リークが増大する.また、微細プロセスに対して逆方 向バイアス電圧を用いる場合、GIDL(Gate Induced Drain Leakage)が問題となる.よって、 バルクプロセスに対して、基板バイアス電圧制御を用いる場合、基板バイアス電圧を 印加できる範囲が制限されてしまうため、しきい値電圧の調整を広い範囲で行うこと ができない.

一方, FD-SOI プロセスには, 1)サブスレッショルドリークが小さい, 2)順方向バイ アス電圧を用いる場合において接合リークが問題にならない, という利点があるため, 基板バイアス電圧制御技術に適している. すでに FD-SOI プロセスにおいても基板バ イアス電圧制御技術が提案されているが, 特殊プロセスが必要であり, さらに, 速度 オーバヘッド, 面積オーバヘッドが発生するという問題があった.

本研究では, FD-SOI プロセスにおいて, 自動的にシステマチックばらつきを検出し, SRAM の動作マージンが最大となるように補正を行う基板バイアス電圧制御回路を提 案した. 0.15um FD-SOI デバイスを用いて 486-kb SRAM を試作し,実測した結果,提 案した基板バイアス電圧制御回路を用いることにより, SRAM の動作下限電圧を 0.14V 改善し, 0.42V での動作を確認した.

第5章では、システム応用・回路技術の協調設計による低消費電力化手法として、 動画像処理応用マルチポート SRAM の低消費電力化技術について詳述する.実時間動 画像処理プロセッサにおいてもメモリの面積の割合は増大してきている. HDTV 対応 のH.264 エンコーダにも、サーチウィンドウバッファとして少なくとも 500-kb のメモ リが必要であり、全消費電力のうち 40%が消費されると予想されている.また、プロ セスの微細化が進むにつれて大容量の SRAM がフレームバッファや再構成画像メモリ に実装され、消費電力の大部分を占めると考えられる.

そこで本研究では、動画像の持つ隣接画素相関性を利用し、実時間動画像処理に適 した低消費電力 2-port SRAM の提案を行った.一般的に、動画像処理用における SRAM の電力では、書込み動作電力よりも、読出し動作電力の占める割合が大きい. さらに、 読出し電力のうち、ビット線の充放電電力の占める割合が大きいため、ビット線の充 放電電力を小さくすることで、動画像処理 SRAM を低消費電力化できる.

読出し動作時において"1"を読出す場合にはビット線の充放電電力は発生しないが, "0"を読出す場合にはビット線の充放電電力が発生する.そこで,読出しビット線の 充放電電力を最小にするために,書込み動作時において,入力データの"0"の個数が "1"の個数よりも多い場合,多数決論理回路を用いて入力データの反転を行う多数決 論理 SRAM の提案を行った.さらに多数決論理回路をより効果的に利用するために, 動画像の持つ隣接画素相関性に着目し,画像データをビットごとに並べ替える Reordering 処理の提案を行った.

90-nm プロセスを用いて 68-kb SRAM の試作を行い,実測した結果,H.264 で符号化 した HDTV 解像度の再構成画像に対して,提案した手法を用いることにより,読出し 動作電力を 28%削減することを確認した.

最後に, 第6章において本論文の結論について記述する.

本論文では、微細化 CMOS のための SRAM の低消費電力化および高信頼化を実現す るための要素技術について記述した.回路設計技術からのアプローチとして、高信頼 モードを有する 7T/14T メモリセルについて詳述した.プロセスと回路技術を組み合わ せた協調設計技術として、FD-SOI プロセスを用いた基板バイアス電圧制御手法につい て詳述した.システム応用と回路技術を組み合わせた協調設計技術として、隣接画素 相関性を利用した低消費電力動画像処理応用 2-port SRAM について詳述した.これら の技術を用いることにより、微細化 CMOS SRAM の低消費電力化および高信頼化が実 現可能となる.

| <b>第</b> 1 | L章    | 序論  | ā                                     | 1 |
|------------|-------|-----|---------------------------------------|---|
| 1          | .1    | SRA | AMの技術背景                               | 1 |
| 1          | 2     | 研究  | 2目的及び本論文の構成                           | 1 |
| 第2         | 2章    | 低消  | 肖費電力化および高信頼化に向けたSRAMの課題               | 5 |
| 2          | .1    | 緒言  | · · · · · · · · · · · · · · · · · · · | 5 |
| 2          | .2    | SRA | AMの概要                                 | 5 |
|            | 2.2.1 | L   | SRAMの特徴                               | 5 |
|            | 2.2.2 | 2   | SRAMの構成と動作                            | 7 |
| 2          | .3    | メモ  | リセルの動作マージン                            | 8 |
|            | 2.3.1 | L   | 読出し動作マージン(SNM: Static Noise Margin)1  | 0 |
|            | 2.3.2 | 2   | 書込み動作マージン(WTP: Write Trip Point)1     | 1 |
| 2          | .4    | SRA | AMの低消費電力化の必要性1                        | 3 |
| 2          | .5    | しき  | い値電圧ばらつきが動作マージンに与える影響1                | 3 |
|            | 2.5.1 | L   | システマチックばらつきとランダムばらつき1                 | 3 |
|            | 2.5.2 | 2   | 動作マージンへの影響1                           | 6 |
| 2          | .6    | 動作  | ■環境が動作マージンに与える影響1                     | 8 |
| 2          | .7    | 結言  | ř                                     | 0 |
| 第3         | 3章    | 高信  | i頼性モードを有するディペンダブルSRAM2                | 1 |
| 3          | .1    | 緒言  | f                                     | 1 |
| 3          | .2    | ディ  | ペンダブルSRAMの概要2                         | 1 |
| 3          | .3    | ディ  | ペンダブルメモリセル2                           | 3 |
|            | 3.3.1 | L   | 従来の 6Tメモリセル2                          | 3 |
|            | 3.3.2 | 2   | 7T/14Tメモリセル2                          | 6 |
| 3          | .4    | 従来  | : 6Tメモリセルと 7T/14Tメモリセルの比較 3           | 0 |
|            | 3.4.1 | -   | ビット線遅延時間                              | 0 |
|            | 3.4.2 | 2   | ビット不良率(BER)                           | 1 |
|            | 3.4.3 | 3   | スタンバイリーク電力3                           | 5 |
|            | 3.4.4 | ł   | ECC, MMRとの比較3                         | 6 |

| : | 3.5  | ハーフセレクト回避のためのセルアレイ設計手法        | 8         |
|---|------|-------------------------------|-----------|
| 1 | 3.6  | 実測結果4                         | 13        |
| ; | 3.7  | 結言                            | 6         |
|   |      |                               |           |
| 第 | 4章   | システマチックばらつきを補正する基板バイアス電圧制御技術4 | 9         |
|   | 4.1  | 緒言4                           | 19        |
|   | 4.2  | FD-SOIデバイス                    | <b>i0</b> |
|   | 4.3  | 提案基板バイアス電圧制御手法                | 52        |
|   | 4.3. | 1 FD·SOIプロセスにおける基板バイアス電圧制御    | <b>j2</b> |
|   | 4.3. | 2 基板バイアス電圧制御回路                | 55        |
|   | 4.4  | 実測結果                          | í9        |
|   | 4.5  | 結言                            | 33        |
|   |      |                               |           |
| 第 | 5章   | 動画像処理応用 2-port SRAMの低消費電力化技術  | 15        |
| i | 5.1  | 緒言6                           | 55        |
|   | 5.2  | 従来の 2-port SRAMの問題点           | 36        |
|   | 5.2. | 1 2-port SRAM の構成             | 36        |
|   | 5.2. | 2 2-port SRAMの読出しビット線充放電電力    | 37        |
| i | 5.3  | 多数決論理SRAM                     | 38        |
|   | 5.3. | 1 多数決論理SRAMの概要                | 38        |
|   | 5.3. | 2 多数決論理を用いることによる消費電力削減効果      | <b>;9</b> |
|   | 5.4  | Reordering処理                  | 70        |
|   | 5.4. | 1 動画像の特性                      | 70        |
|   | 5.4. | 2 Reordering処理の概要             | 73        |
|   | 5.4. | 3 隣接画素の最適な取り方                 | 75        |
|   | 5.5  | 90-nmプロセスを用いた実装               | 32        |
|   | 5.5. | 1 全体回路構成                      | 32        |
|   | 5.5. | 2 メモリセル                       | 32        |
|   | 5.5. | 3 多数決論理SRAM向けの書込み回路および読出し回路   | 34        |
|   |      |                               |           |

5.6

| 謝辞        |     |
|-----------|-----|
| 参考文献      | 101 |
| 著者の研究業績目録 |     |



| 义        | 目 | 次 |  |
|----------|---|---|--|
| <u>х</u> | Ħ | 伙 |  |

| 义 | 1.1  | 本論文の構成3                                             |
|---|------|-----------------------------------------------------|
| 义 | 2.1  | DRAMのメモリセル                                          |
| 図 | 2.2  | SRAMのメモリセル                                          |
| 図 | 2.3  | SRAMのブロック図                                          |
| 义 | 2.4  | 6Tメモリセルの動作: (a)読出し動作時, (b)書込み動作時                    |
| 図 | 2.5  | 6Tメモリセルの読出し動作マージン(SNM): (a)読出し動作マージン導出グラ            |
|   | フ,   | (b)読出し動作マージン導出時の等価回路11                              |
| 図 | 2.6  | 6Tメモリセルの書込み動作マージン(WTP): (a)書込み動作マージン導出グラ            |
|   | フ,   | (b)書込み動作マージン導出時の等価回路12                              |
| 义 | 2.7  | SoCに搭載されるメモリの割合13                                   |
| 义 | 2.8  | システマチックばらつきとランダムばらつき14                              |
| 义 | 2.9  | プロセスコーナー                                            |
| 义 | 2.10 | ペリグロムプロット16                                         |
| 义 | 2.11 | 各プロセスコーナーにおける読出し動作マージン                              |
| 义 | 2.12 | 各プロセスコーナーにおける書込み動作マージン                              |
| 义 | 2.13 | システマチックばらつき,ランダムばらつきを考慮した動作マージン:…17                 |
| 义 | 2.14 | 温度を変化させた場合におけるId-Vgs特性: (a)nMOS,(b)pMOS.18          |
| 义 | 2.15 | 動作マージンの温度依存性: (a)読出し動作マージン,(b)書込み動作マージン.            |
|   |      |                                                     |
| X | 2.16 | 読出し動作マージンのpMOSしきい値電圧依存性19                           |
| 义 | 3.1  | ディペンダブルSRAM                                         |
| 义 | 3.2  | 従来の 6Tメモリセル: (a)回路図, (b)レイアウト                       |
| X | 3.3  | 読出しセル電流の分布24                                        |
| 図 | 3.4  | 2-MCモードにおける動作波形: (a)自己修復効果(WLパルス幅が十分長い場合),          |
|   | (b); | データ破壊(WLパルス幅が不十分な場合)                                |
| 义 | 3.5  | 7TN/14TNメモリセル(追加トランジスタ: nMOS): (a)回路図, (b)レイアウト. 27 |
| 义 | 3.6  | 7TP/14TPメモリセル: (a)回路図, (b)レイアウト(拡散層~2 層メタル), (c)レイ  |
|   | アワ   | フト(3 層メタル~4 層メタル)                                   |
| 凶 | 3.7  | ワーストケースのビット線遅延時間: (a) 7TPメモリセル, (b)高速動作モード          |
|   | (14  | TPメモリセル)                                            |
| 义 | 3.8  | 7TPメモリセルと 14TPメモリセルにおける読出し動作マージン(SNM)と書込            |
|   | み重   | b作マージン(WTP)                                         |
| 义 | 3.9  | ビット不良率(読出し動作)                                       |

| 义      | 3.10 | ビット不良率(書込み動作)                                           |
|--------|------|---------------------------------------------------------|
| 义      | 3.11 | ビット不良率(データ保持)                                           |
| 义      | 3.12 | 1 セル当たりのスタンバイリーク電力(CCコーナー, 25°C)                        |
| 义      | 3.13 | 従来の高信頼化手法:(a)誤り訂正符号(ECC: Error Correction Code), (b)多重  |
|        | 化(   | MMR: Multi Module Redundancy)                           |
| 义      | 3.14 | 提案 14TPの高信頼動作モードと従来の高信頼化手法とのBERの比較37                    |
| 义      | 3.15 | ハーフセレクト問題が発生する従来のメモリセルアレイ構造                             |
| 义      | 3.16 | ハーフセレクト問題が発生しない提案メモリセルアレイ構造(回路図)40                      |
| 义      | 3.17 | 提案メモリセルアレイのレイアウト41                                      |
| 义      | 3.18 | 提案メモリセルアレイのデコーダ構成: (a)ブロック図,(b)ワード線セレクタ                 |
|        | の国   | 回路図                                                     |
| 义      | 3.19 | 65-nmプロセスを用いて試作を行った 64-kb SRAM TEG                      |
| 义      | 3.20 | BERの実測結果44                                              |
| 図      | 3.21 | 高信頼動作モードのアクセスタイム44                                      |
| 図      | 3.22 | 1 セル当たりのリーク電力の実測結果45                                    |
| 义      | 3.23 | 40MHz動作時における読出し動作電力の実測結果                                |
| 図      | 3.24 | 40MHz動作時における書込み動作電力の実測結果46                              |
| 义      | 4.1  | 従来手法の問題点: (a)特殊プロセス(トリプルウェル構造),                         |
| 図      | 4.2  | 基板断面構造の比較: (a) バルクプロセスの基板, (b)SOIプロセスの基板50              |
| 図      | 4.3  | 素子構造: (a) 部分空乏化型(Partially-Depleted SOI),               |
| 図      | 4.4  | 読出し動作および書込み動作の低電圧動作下限(ミルキーウェイプロット):                     |
|        | (a)2 | 基板バイアス電圧制御なし,(b)基板バイアス電圧制御あり53                          |
| 図      | 4.5  | FD-SOIデバイス: (a)デバイス構造, (b)nMOSのId-Vgs特性, (c)pMOSのId-Vgs |
|        | 特性   | ±                                                       |
| 図      | 4.6  | FD-SOIプロセスを用いたSRAMのメモリセル55                              |
| X      | 4.7  | 提案基板バイアス電圧制御回路:(a)ブロック図,(b)しきい値電圧検出回路(Vt                |
| _      | dete | ector), (c)VDD/2 生成回路(Half-VDD generator)               |
| 図      | 4.8  | 基板バイアス生成回路の動作例(FSコーナー)                                  |
| 凶      | 4.9  | しきい値電圧検出回路とVDD/2 生成回路のシミュレーション結果                        |
| 凶      | 4.10 | 0.15-um FD-SOIプロセスで試作を行った 486-kb SRAM                   |
| 図      | 4.11 | 読出し動作時のBERの実測結果                                         |
| 凶      | 4.12 | データ保持時のBERの実測結果60                                       |
| 凶      | 4.13 | 書込み動作時のBERの実測結果                                         |
| 図<br>E | 4.14 | リーク電刀の実測結果                                              |
| 凶      | 4.15 | フンタムはらつきを抑制することができるデバイス構成                               |
| 区      | 5.1  | 8 トフンシスタで構成される 2-portメモリセル                              |
| 凶      | 5.2  | <b>2-port SRAM</b> における読出し動作時における動作波形                   |

х

| 凶 | 5.3  | 多数決論理SRAMの概要: (a)ブロック図, (b)フラグビットの概念6       | 8 |
|---|------|---------------------------------------------|---|
| 义 | 5.4  | 従来SRAMと多数決論理SRAMにおけるRBLの充放電電力の比較6           | 9 |
| 义 | 5.5  | 動画像の例                                       | 1 |
| 図 | 5.6  | HDTV解像度の標準テスト動画像シーケンス                       | 1 |
| 図 | 5.7  | H.264の符号化プロセスと符号化条件                         | 2 |
| 図 | 5.8  | 標準テスト動画像シーケンスMarket, Churchにおける隣接する横 8 画素のビ | • |
|   | ッ    | トごとの相関性7                                    | 3 |
| 図 | 5.9  | 多数決論理を用いた場合における規格化読出しビット線電力7                | 4 |
| 义 | 5.10 | 多数決論理とReordering処理7                         | 5 |
| 义 | 5.11 | 隣接する画素の取り方7                                 | 6 |
| 义 | 5.12 | インターレース画像の一例                                | 6 |
| 図 | 5.13 | 画素の取り方を変化させた場合の読出しビット線充放電電力削減効果7            | 7 |
| 义 | 5.14 | フラグビットの値を変化させた場合の読出しビット線充放電電力削減効果.          |   |
|   |      | 7                                           | 8 |
| 図 | 5.15 | フラグビットの値を変化させた場合の読出しビット線充放電電力               | 9 |
| 図 | 5.16 | 原画像に対して多数決論理とReordering処理を用いた場合の読出しビット線     | : |
|   | 充加   | 牧電電力削減効果                                    | 0 |
| 図 | 5.17 | 再構成画像に対して多数決論理とReordering処理を用いた場合の読出しビッ     |   |
|   | ト糸   | <b>泉充放電電力削減効果.</b>                          | 0 |
| 凶 | 5.18 | 提案SRAMにおける読出しビット線充放電電力削減効果とメモリセルアレ          |   |
|   | 11   | こおける面積オーバヘッド                                | 1 |
| 凶 | 5.19 | 提案する 68-kb SRAMのブロック図8                      | 3 |
| 义 | 5.20 | メモリセルのレイアウト8                                | 3 |
| 図 | 5.21 | 多数決論理回路を加えた書込み回路8                           | 4 |
| 义 | 5.22 | "1"の個数が7個, "0"の個数が9個の場合における多数決論理回路の動作波      |   |
|   | 形:   | (a) Lのシンクパスが1個, L_Nのシンクパスが0個, (b) Lのシンクパスが4 | • |
|   | 個,   | IL_Nのシンクパスが3個, (c)PVT条件が最悪の場合におけるILのシンクパス   |   |
|   | が    | 4 個, JL_Nのシンクパスが 3 個8                       | 6 |
| 义 | 5.23 | 元の入力データを復元するための読出し回路8                       | 7 |
| 図 | 5.24 | チップ写真およびレイアウト8                              | 8 |
| 図 | 5.25 | アクセスタイムの実測結果                                | 8 |
| 汊 | 5.26 | メモリセル1個あたりにおけるリーク電流の実測結果                    | 9 |
| 図 | 5.27 | 100MHz動作時における読出しビット線電力削減効果の実測結果             | 0 |
| 义 | 5.28 | 読出し動作電力の実測結果                                | 0 |

## 表 目 次

| 表 3.1 | 7T/14Tメモリセルの3種類の動作モード   |    |
|-------|-------------------------|----|
| 表 3.2 | 提案メモリセルアレイ構造のワード線マッピング. | 40 |

Υ.

## 第1章 序論

## 1.1 SRAMの技術背景

近年,システム LSI は様々な産業の基幹を担っており,システム LSI の信頼性の向 上および低消費電力化がますます重要となってきている.また,多くのシステム LSI には処理データを記憶するメモリとして,高速,低消費電力,周辺回路が簡素,論理 演算部との混載が容易といった理由から,SRAM(Static Random Access Memory)が搭載 されている.今後,情報処理端末にさらに高い処理能力が要求され,システム LSI に おける処理データ量が大規模化するに従って SRAM の記憶容量が増大することが予想 されている. ITRS 2003[1]によれば,2012 年にはシステム LSI の面積の 90%以上がメ モリで占有されると予想されており,システム LSI の大部分はメモリによって占めら れる.

よって、システム LSI の低消費電力化・高信頼化には、SRAM の低消費電力化およ び高信頼化技術が必要不可欠となる.しかし、半導体の製造プロセスが 90nm 以降の 世代になると、LSI に集積される MOS トランジスタのしきい値電圧のばらつきが顕在 化する.特に、システム LSI には大容量の SRAM が搭載され、SRAM のメモリセルは 最小サイズのトランジスタにより構成されるため、SRAM の低電圧動作性の確保およ び信頼性の維持が困難となる.

### 1.2 研究目的及び本論文の構成

本研究では,前節で述べた背景をもとに,微細プロセスにおける SRAM の低消費電 力化および高信頼化技術の実現を目的とする.本論文の構成および各研究の概略につ いて以下にまとめる.また,図 1.1 に本論文の構成をまとめる. 第1章 序論

本章では、本研究に関する技術的背景、技術動向及び本論文の研究内容について記述する.

第2章 低消費電力化および高信頼化に向けた SRAM の課題

本章では,SRAM の低消費電力化の必要性について示すとともに,プロセスの微細 化が進むにつれて顕著となるしきい値電圧ばらつき,および動作環境の変化が動作マ ージンへ及ぼす影響について記述する.

第3章 高信頼性モードを有するディペンダブル SRAM

本章では,SRAM の高信頼化を目的とし,動的に信頼性を変化することができる 7T/14T メモリで構成されたディペンダブル SRAM について記述する.提案するメモリ セルは通常動作モード,高速動作モード,高信頼動作モードの3つの動作モードを有 し,ブロックごとに動作モードを切り替えることができる.

第4章 システマチックばらつきを補正する基板バイアス電圧制御技術

本章では、FD-SOI プロセスを用いたシステマチックばらつきを補正するための基板 バイアス制御技術について記述する.提案する基板バイアス制御技術は、自動的にチ ップ間のしきい値ばらつきを検出し、SRAMの動作マージンが最大となるように補正 を行うことが可能である.

第5章 動画像処理応用 2-port SRAM の低消費電力化技術

プロセスの微細化が進むにつれ、大容量 SRAM がフレームバッファや再構成画像メ モリなどに実装され、消費電力の大部分を占めるため、実時間動画像処理プロセッサ の低消費電力化には、SRAM の低消費電力化が必要不可欠である.本章では、アプリ ケーションとハードウェアの両方の着眼点から動画像処理で広く用いられている 2-port SRAM に対して,動画像の持つ隣接画素相関性を利用した低消費電力化技術に ついて記述する.

第6章 結論

本研究で得られた結論について記述する.



図 1.1 本論文の構成.

## 第2章 低消費電力化および高信頼化に向け たSRAMの課題

## 2.1 緒言

本章では, SRAM(Static Random Access Memory)と微細プロセスにおける SRAM の低 消費電力化,高信頼化に対する課題について述べる.

製造プロセスの微細化が進むにつれて, MOS トランジスタのしきい値電圧ばらつき の増大により SRAM におけるメモリセルの動作マージンが劣化し, SRAM の動作下限 電圧が上昇する傾向にある.

2.2 節では, SRAM の概要について記述する. 2.3 節では, 6 トランジスタで構成される SRAM のメモリセルの動作マージンについて記述する. 2.4 節では, SRAM の低消費電力化の必要性について記述する. 2.5 節では, しきい値電圧ばらつきが動作マージンへ及ぼす影響について記述する. また, 2.6 節では動作環境が動作マージンへ及ぼす影響について記述する.

### 2.2 SRAMの概要

#### 2.2.1 SRAMの特徴

MOS (Metal-Oxide-Semiconductor)技術により構成される RAM (Random Access Memory)には, スタティック型 (SRAM: Static RAM)とダイナミック型 (DRAM: Dynamic RAM)がある. 双方とも揮発メモリであり, 電源供給がなくなると記憶データ は失われる.

DRAMは、容量に蓄えられた電荷の有無をビット情報の"1"/"0"に対応させる.メ モリセル(図 2.1)は1個のトランジスタと1個の容量(1T1C)で構成されるため、小面積 であり、大容量化に適し低コストである.しかし、時間経過により、リーク電流によ って容量に蓄えられた電荷が放電されるため、定期的に保持データをリフレッシュす る必要がある.



図 2.1 DRAM のメモリセル.



図 2.2 SRAM のメモリセル.

一方, SRAM のメモリセル(図 2.2)はフリップフロップ回路により構成されるため6 トランジスタ構成となり, DRAM と比較して面積が大きくなるが,以下の長所を持つ.

- 1. 読出しおよび書込み動作が高速.
- メモリセルに貫通電流が流れず、リフレッシュ動作が不要のため、待機時の消費 電力が低い。
- 3. CMOS ロジックプロセスで実現できるため、システム LSI に集積化しやすい.

1. の特徴を生かして,汎用コンピュータ,ワークステーション,PC のキャッシュメ モリ,スーパーコンピュータの主記憶メモリとして,2. の理由から,バッテリ駆動の 携帯機器の記憶装置として,また,3. の理由から,CPU や DSP に搭載されるキャッ シュメモリとして広く利用されている.

#### 2.2.2 SRAMの構成と動作

図 2.3 に SRAM の全体ブロック図を示す. SRAM ではメモリセルがアレイ状に配置 されている.また、メモリセルアレイの行選択線としてワード線、上下に貫通するデ ータ線としてビット線が配置されている.行アドレス(X アドレス)および列アドレス(Y アドレス)の入力により、メモリセルアレイ内で特定のメモリセルが選択される.



図 2.3 SRAM のブロック図.

SRAM の読出し動作の手順を以下にまとめる.

- 1. 外部入力の X アドレスを X デコーダでデコードする. また, 同時に Y アドレスに ついても Y デコーダでデコードを行う.
- 1. で選択された行のワード線を立ち上げ,選択された行のメモリセルのデータを ビット線に出力する.
- 3. 1. で選択された列のビット線のみをセンスアンプに出力する.
- 4. センスアンプによってビット線の微小振幅を増幅する.
- 5. 増幅された信号をラッチ部で保持し、読出しデータとして出力する.
- また、書込み動作の手順について以下にまとめる.
- 外部入力のXアドレスをXデコーダでデコードする.また,同時にYアドレスに ついてもYデコーダでデコードを行う.
- 外部入力のデータに応じて、書込み回路により1. で選択された列のビット線を駆 動する.
- 3. 1. で選択された行のワード線を立ち上げ, X アドレス, Y アドレスによって選択 されたメモリセルにデータを書込む.

## 2.3 メモリセルの動作マージン

6T メモリセル(図 2.2)はドライブトランジスタ(M2, M3), 負荷トランジスタ(M0, M1), アクセストランジスタ(M4, M5)で構成されている. ドライブトランジスタと負荷トランジスタの 4 トランジスタによりインバータカップルが形成されており, インバータの入出力電圧(N0, N1)は"H"(VDD)もしくは"L"(0V)で安定する. N0, N1の電位状態は(N0, N1) = ("H", "L")もしくは("L", "H")の 2 通りであり, 情報 1bit を記憶する. また, 6T メモリセルへのデータの入出力としてビット線(BL, /BL)がアクセストランジスタのドレインに接続され, また, 6T メモリセルへのアクセスとしてワード線(WL)がアクセストランジスタのゲートに接続されている.



図 2.4 6T メモリセルの動作: (a)読出し動作時, (b)書込み動作時.

図 2.4 を用いることにより, 6T メモリセルの読出しおよび書込み動作について説明 する.図 2.4 に示す 6T メモリセルでは,データ保持ノードを N0="H", N1="L"と仮 定する.また,WL が立ち上がる前にビット線(BL, /BL)が"H"レベルにプリチャージ されている.

読出し動作時には,WLが"H"に立ち上がりアクセストランジスタがオン状態になる. /BLからM5,M3を通してGNDへの放電パスが生じ,/BLにプリチャージされていた 電荷の放電が行われ,/BLの電位がVDDから徐々に低下する.逆に,ビット線BLに おいては放電パスが存在しないため,BLの電位はプリチャージ電圧 VDD から変化しない.ビット線対(BL,/BL)に発生する電位差をセンスアンプによって増幅することにより,アクセスされたメモリセルの保持データの値が読出しデータとして出力される.

書込み動作時では、ビット線電位が書込みドライバによって決定される.図 2.4(b) においては、BL="L"、/BL="H"となっている.WLが"H"に立ち上がりアクセストラ ンジスタがオン状態になると、セルインバータカップルの電源 VDD から M0, M4 を 通して BL への放電パスと、/BL から M5, M3 を通して GND への放電パスが生じ、 N0、N1 の電位が反転してデータの書込みが行われる.

安定動作のためには読出しおよび書込み双方の動作マージンの確保が必要である.

#### 2.3.1 読出し動作マージン(SNM: Static Noise Margin)

図 2.5(a)に, 読出し動作マージン(SNM: Static Noise Margin)の定義を示す読出動作し マージン導出グラフ,および図 2.5(b)に SNM 導出時の 6T メモリセルの等価回路を示 す[2]. 読出し動作マージン導出グラフは,ワード線およびビット線対が電源に接続さ れた状態で,セルインバータの入出力(N0, N1)の直流伝達特性をとり,2 本のカーブ を重ね合わせたグラフである.

読出し動作マージン導出グラフに内接する最大正方形の1辺の長さがSNMに対応する. SNM の値が大きいほど読出し動作が安定となり,保持データが読出し動作時において破壊されにくくなる.





図 2.5 6T メモリセルの読出し動作マージン(SNM): (a)読出し動作マージン導出グラ フ, (b)読出し動作マージン導出時の等価回路.

#### 2.3.2 書込み動作マージン(WTP: Write Trip Point)

図 2.6(a)に, 書込み動作マージン(WTP: Write Trip Point)の定義を示すグラフ, および 図 2.6(b)に WTP 導出時の 6T メモリセルの等価回路を示す[3]. WTP の導出時において は, ワード線が電源に接続され, ビット線の一方(図 2.6(b)では/BL)が電源に接続され た状態において, もう一方のビット線(図 2.6(b)では BL)の電位を 0V から VDD の間で 変化させる. 保持ノードの値が反転するときの BL の電位が WTP に対応する. WTP の値が大き いほど書込み動作が安定となり,書込み動作時において,保持データの書換えを行い やすくなる.



図 2.6 6T メモリセルの書込み動作マージン(WTP): (a)書込み動作マージン導出グラ フ, (b)書込み動作マージン導出時の等価回路.

## 2.4 SRAMの低消費電力化の必要性

情報処理端末にさらに高い処理能力(動画像の場合,高解像度への対応,高ビット エラーレートへの対応など)が要求され,システム LSI における処理データ量が大規 模化するに従って SRAM の記憶容量が増大することが予想されている. ITRS 2003[1] によれば,図 2.7 に示すように,2012 年にはシステム LSI の面積の 90%以上がメモリ で占有されると予想されており,システム LSI の消費電力の大部分はメモリによって 占められる.

よって、システム LSI の低消費電力化には SRAM の低消費電力化は必要不可欠となる.



図 2.7 SoC に搭載されるメモリの割合.

## 2.5 しきい値電圧ばらつきが動作マージンに与える影響

#### 2.5.1 システマチックばらつきとランダムばらつき

前節で記述したとおり、システム LSI の低消費電力化のためには SRAM の低消費電力化が必要不可欠である.また、低消費電力化には動作電圧の低電圧化が効果的であ

る.しかし,LSI 製造プロセスの微細化に伴い,MOS トランジスタのしきい値電圧の ばらつきが増大することにより,SRAMの低電圧動作性が阻害されている.

しきい値電圧ばらつきには,図 2.8 に示すようにチップ間/ウェハ間で発生するシス テマチック成分と,チップ内/トランジスタ間で発生するランダム成分が存在する.



図 2.8 システマチックばらつきとランダムばらつき.

システマチックばらつきの発生原因は、パターン寸法、堆積膜厚、酸化膜厚、熱処 理温度などの製造プロセスでのばらつきである.実設計においては図 2.9 に示す 5 つ のプロセスコーナーを考慮して、回路設計を行う必要がある.図 2.9 において、"F" は fast (しきい値電圧が標準より低い)、"C"は center(標準のしきい値電圧)、"S"は slow (しきい値電圧が標準より高い)の意味であり、例えば"FS"コーナーは nMOS トランジ スタのしきい値電圧が標準値よりも低く、pMOS のしきい値電圧が標準値よりも高い ことを表す.



図 2.9 プロセスコーナー.

一方, ランダムばらつきは不純物濃度のゆらぎ, 界面準位, ゲート端部におけるラ インエッジラフネス(LER), 多結晶粒界などが原因である. ランダムばらつきの標準偏 差のvth は以下の式で表される[4].

$$\sigma_{\rm Vth} \propto T_{\rm ox} \cdot \frac{\sqrt[4]{N \cdot T \cdot \ln(N / n_i)}}{\sqrt{L_{\rm eff} \cdot W_{\rm eff}}}$$
(2.1)

ただし,

Tox: ゲート実効酸化膜厚
N: チャネル不純物濃度
T: 絶対温度
Ni: 真性キャリア濃度
Leff: 実効チャネルゲート長
Weff: 実効チャネルゲート幅

図 2.10 に、ITRS2005 に基づく、 σ<sub>Vth</sub>の LSI 製造プロセス世代推移をペリグロムプロ ットで示す[5]. 世代とともにゲート酸化膜厚が薄くなることでペリグロムプロットの 傾きは小さくなるが、チャネルの最小面積(LW)の縮小にσ<sub>Vth</sub> が増大する.また、メモ リセルの各トランジスタの寸法は高集積化の観点から最小に設定されることが多いの で、 σ<sub>Vth</sub> がロジック部のトランジスタと比較して大きくなる.



図 2.10 ペリグロムプロット.

#### 2.5.2 動作マージンへの影響

以下では、システマチックばらつき、およびランダムばらつきが動作マージンに及 ぼす影響について述べる. 図 2.11, 図 2.12 に各プロセスコーナーにおける読出し動 作マージンおよび書込み動作マージンを示す. 読出し動作マージンは FS コーナーにお いて最も低くなり, 書込み動作マージンは SF コーナーにおいて最も低くなる. つまり, SRAM の読出し動作および書込み動作の動作下限電圧は、それぞれ FS コーナーおよ び SF コーナーにより決定される.

また,図 2.13 にシステマチックばらつき,およびランダムばらつきを考慮した場合 の読出し動作マージンおよび書込み動作マージン導出グラフを示す. 図中の実線が 6σ のランダムばらつきを考慮した場合,点線がランダムばらつきを考慮しない場合の動 作マージン導出グラフである. ランダムばらつきにより,読出し動作マージン,およ び書込み動作マージンが,さらに劣化することがわかる.



図 2.11 各プロセスコーナーにおける読出し動作マージン.



図 2.12 各プロセスコーナーにおける書込み動作マージン.



図 2.13 システマチックばらつき、ランダムばらつきを考慮した動作マージン: (a) 読出し動作マージン, (b) 書込み動作マージン.

## 2.6 動作環境が動作マージンに与える影響

微細化に伴うしきい値電圧ばらつきのみでなく,動作環境も SRAM の動作マージン に大きな影響を与える.

図 2.14 に温度を変化させた場合における Id-Vgs 特性を示す.オフ領域における電流は拡散電流が支配的であるため,高温条件ではキャリアが多くなるのでオフ電流が 上昇し,しきい値電圧は上昇する.一方,オン領域における電流はドリフト電流が支 配的であるため,高温条件ではシリコン原子の格子運動により,キャリアの移動度が 劣化し,オン電流は減少する[6],[7].逆に,低温条件においては,しきい値電圧は上 昇し,オン電流は増加する傾向を示す.



図 2.14 温度を変化させた場合における Id-Vgs 特性: (a)nMOS, (b)pMOS.

また, 読出し動作マージンおよび書込み動作マージンの温度依存性を図 2.15 に示す. 高温条件においては読出し動作マージンが劣化し,低温条件においては書込み動作マ ージンが劣化する.



図 2.15 動作マージンの温度依存性: (a)読出し動作マージン, (b)書込み動作マージン.

また, MOS トランジスタ特性の経年劣化も, SRAM の動作マージンに影響を及ぼす. pMOS のゲート電極に,ネガティブバイアスを印加した状態を長時間保持した場合に おいて,界面準位の増加,およびゲート酸化膜中のトラップに起因したチャージによ り, pMOS トランジスタのしきい値電圧が上昇し,オン電流が減少する(NBTI: Netagive Bias Temperature Instability) [8]

SRAM では,同じデータを長時間保持する可能性が高いため,特に深刻な問題となる.図 2.16 に示すように, pMOS のしきい値電圧が上昇することにより,読出し動作 マージンが劣化する[9], [10].



図 2.16 読出し動作マージンの pMOS しきい値電圧依存性.

### 2.7 結言

本章では、SRAM と微細化に伴う課題について述べた. SRAM の課題は次の通りである.

#### • 低消費電力化設計技術

今後, さらにシステム LSI における SRAM の消費電力の増大が予想されるため, SRAM の低消費電力化設計技術が必要不可欠である.

#### • しきい値電圧ばらつきを克服する設計技術

低消費電力化には、動作電圧の低電圧化が効果的である.しかし、しきい値電圧 ばらつきの影響により、メモリセルの動作マージンが劣化し、低電圧動作が阻害 されている.よって、しきい値電圧ばらつきを克服するための設計技術が必要不 可欠である.

#### • 高信頼化設計技術

しきい値電圧ばらつきに加えて,温度変化,経年劣化といった動作環境の変化に よっても SRAM の動作安定性は低下する.そのため,動作環境の変化に耐性を持 つ設計技術が必要不可欠である.
# 第3章 高信頼性モードを有するディペンダ ブルSRAM

#### 3.1 緒言

システム LSI は様々な産業の基幹を担っており、システム LSI の高信頼性化技術が ますます重要となってきている.しかし、プロセスの微細化が進むにつれて、MOSFET のしきい値電圧のばらつきが増大することにより、システム LSI において、歩留まり 低下とともに信頼性が低下している.特に、SRAM はシステム LSI の大部分の面積を 構成しているため、チップの動作安定性を決定する支配的な要因であり、より高い信 頼性が求められている[11-16].

システム LSI は、速度、供給電圧、温度、経年劣化など動作環境によって信頼性が 変化するため、環境に応じて動的に信頼性を改善し、適応することが求められている. さらに、要求される信頼性はアプリケーションによっても異なるため、各種のアプリ ケーションに応じて、信頼性を対応させることが期待されている.

本章では,SRAM の高信頼化を目的とし,動的に信頼性を変化することができる 7T/14T メモリで構成されたディペンダブル SRAM の提案を行う.提案するメモリセル は通常動作モード,高速動作モード,高信頼動作モードの3つの動作モードを有し, 必要に応じてブロックごとに動作モードを切り替えることができる.

## 3.2 ディペンダブルSRAMの概要

前節で記述したとおり,速度,供給電圧,温度,経年劣化といった動作環境によっ て SRAM の信頼性は変化する.また,アプリケーションに応じて,必要とされる信頼 性は異なる.例えば,暗号化プログラムや個人データを取り扱うプログラムでは高い 信頼性が必要とされるが,スクリーンセーバーでは信頼性は必要とされない.

一方,システム LSI の消費電力を削減する手法として,回路の動作周波数と電源電 圧を処理負荷に応じて動的に制御する DVFS(Dynamic Voltage and Frequency Scaling)が 提案されている[17]. しかし, 微細化が進むにつれ, MOSFET のしきい値電圧のばら つきの増大によりメモリセルの動作マージンが劣化し,低電圧条件下では SRAM が正 常に動作しない可能性がある.よって,DVFS を用いる場合においても,低電圧動作 時における,SRAM の信頼性の維持が求められている.

提案する SRAM では,図 3.1 に示すようにブロック単位を基準として SRAM の信頼 性を動的に変化させることができる.図 3.1 の場合,ブロック 0 からブロック 3 は 1 つのメモリセルに 1bit のデータが保持され,通常の信頼性を持つ.一方,ブロック 5 とブロック 6 では,2 つのメモリセルを結合し,2 つのメモリセルに 1bit のデータを保 持することにより,メモリの容量は半分になるが,高い信頼性を実現することができ る.



図 3.1 ディペンダブル SRAM.

例えば、OS(Operating system)では、暗号化プログラムや個人情報を取り扱うプログ ラムに対しては高い信頼性のブロックを割り当てる.アプリケーションソフトでは、 システムコールによってデータの信頼性を適切に変化させることが可能となる.また、 プログラムとデータの利用率がメモリの 50%以下である場合、メモリの容量を犠牲に することなく、OS によって積極的に高信頼性ブロックへデータを記憶させることが可 能である.また、データ量の少ない簡易なコードは常に高信頼モードで動作させるこ ともできる.

## 3.3 ディペンダブルメモリセル

#### 3.3.1 従来の 6Tメモリセル

図 3.2 に従来の 6T メモリセルペアを示す. 従来の 6T メモリセルペアでは, 読出し および書込みの動作時において, WL[0]もしくは WL[1]の一方が"H"となり, 1つのメ モリセルのみがアクセスされる.本章では, 1bit を 1 つのメモリセルで保持する従来 の方法を"1-MC モード"と呼ぶ.



図 3.2 従来の 6T メモリセル: (a)回路図, (b)レイアウト.

また,図 3.1 で示したように、1bit を 2 つのメモリセルで保持し信頼性を確保する 方法を"2-MC モード"と呼ぶ. 2-MC モードでは、書込み動作時に WL[0]と WL[1]の 2 つの WL を同時に"H にし、同一のデータを 2 つのメモリセルに書込む. 同様に、読出 し動作時においても 2 つの WL を同時に"H"にし、2 つのメモリセルから同一データを 読出す.

2-MC モードの読出し動作では、2 つのワード線が同時にアクセスされるため、従来 の読出し動作(1-MC モード)よりも読出しセル電流が大きくなり、ビット線の充放電時 間を短くすることができる.図 3.3 に、モンテカルロシミュレーション(標本数: 20,000) を行った結果から得られた、1-MC モードと 2-MC モードの読出しセル電流の分布を示 す. 2-MC モードは 1-MC モードと比較して、読出しセル電流の最悪値を 133%改善す ることができる.2-MC モード 2 つともセル電流が少ないメモリセルではない. つまり、 2 つのメモリセルペアを結合することにより、チップ内のランダムばらつきを抑制す ることができる.



図 3.3 読出しセル電流の分布.

さらに、2-MC モードを用いることの利点として自己修復効果がある. 1-MC モード において、メモリセル内の各トランジスタのしきい値電圧のばらつきが大きい場合、 メモリセルの動作マージンが小さくなるため、低電圧動作時において保持データが破 壊される恐れがある. 一方、2-MC モードでは、片方のメモリセルが動作マージンの不 十分なメモリセル(Bad Cell)であったとしても、もう片方のメモリセルの動作マージン が十分なメモリセル(Good Cell)であれば、図 3.4(a)に示すように破壊されたデータが正 しい値に修復される. よって 2-MC モードを用いる場合、1-MC モードよりも低電圧で の動作が可能である.



図 3.4 2-MC モードにおける動作波形: (a)自己修復効果(WL パルス幅が十分長い場合), (b)データ破壊(WL パルス幅が不十分な場合).

しかしながら,自己修復効果を用いるためには,サイクルオーバヘッドが必要である.これは,動作マージンの不十分なメモリセルの内部ノードがビット線とアクセストランジスタを介して徐々に修復されるためである.つまり,2つのビット線の電位 差が十分に開いた後に自己修復効果は発生する.よって,アクセスタイムが高速であったとしても,適切な動作のためにはサイクルタイムが大きくなってしまう.また, 自己修復効果にとって、ワード線パルス幅が不十分な場合、図 3.4(b)に示すように動 作マージンの不十分なメモリセルの保持データが破壊されてしまう. つまり、自己修 復効果が発生するために必要な時間を考慮して、ワード線パルス幅を決定するのは困 難である.

次節では、トランジスタを2つ追加して、内部ノードを直接接続した 7T/14T メモリ セルについて述べる.

#### 3.3.2 7T/14Tメモリセル

図 3.5、図 3.6に提案する7トランジスタで構成されるメモリセル(7T/14T メモリセ ル)を示す.提案するメモリセルはメモリセルの保持ノード(N00 と N10, N01 と N11) 間に2つの nMOS もしくは pMOS を追加した構成である.以下では、図 3.5のメモリ セル(nMOS を追加した構成)を 7TN メモリセルと呼び、図 3.6のメモリセル(pMOS を 追加した構成)を 7TP メモリセルと呼ぶ.従来の 6T メモリセルと比較して、提案 7TN メモリセルと 7TP メモリセルの面積オーバヘッドはそれぞれ 26%と 11%となる.また、 1bit を 2 つのメモリセルによって記憶する場合、7TN のメモリセルペアが 14TN メモ リセルとなり、7TP のメモリセルペアが 14TP メモリセルとなる.





図 3.5 7TN/14TN メモリセル(追加トランジスタ: nMOS): (a)回路図, (b)レイアウト.



図 3.6 7TP/14TP メモリセル: (a)回路図, (b)レイアウト(拡散層~2層メタル), (c)レ イアウト(3層メタル~4層メタル).

|            | # of MCs<br>comprising 1 bit | # of WL drives | CTRL (/CTRL) |
|------------|------------------------------|----------------|--------------|
| Normal     | 1 (7T/bit)                   | 1              | "L" ("H")    |
| High-speed | 2 (14T/bit)                  | 2              | "H" ("L")    |
| Dependable | 2 (14T/bit)                  | 1              | "H" ("L")    |

表 3.1 7T/14T メモリセルの3種類の動作モード.

提案する 7T/14T メモリセルペアは表 3.1 に示す3つの動作モードをもつ.

- 通常動作(Normal)モード(7T メモリセル)
  - 追加トランジスタ(M20 および M21)をオフ状態にして、1bit のデータを7個の トランジスタを用いて保持する(7T メモリセル).アクセス時には、WL[0]も しくはWL[1]の一方のみをオン状態にすることにより.従来の6T メモリセル と同様の動作を行う.
- 高速動作(High-speed)モード(14T メモリセル)
  - 追加トランジスタをオン状態にして、1bitのデータを14個のトランジスタを 用いて保持する(14Tメモリセル).アクセス時には、WL[0]およびWL[1]の双 方をオン状態にする.ビット線の電荷を2つのメモリセルを用いて放電する ため、通常動作モードと比較して高速動作が可能となる.
- 高信頼動作(Dependable)モード(14T メモリセル)
  - 追加トランジスタはオン状態にして、1bitのデータを14個のトランジスタを 用いて保持する.アクセス時には、WL[0]もしくはWL[1]の一方のみをオン状態にする.β比を大きくすることができるので、読出し動作マージン(SNM)を 改善することができる.

通常動作モードにおいては、1bit が 1 つのメモリセルに保持されるため、高速動作 モードおよび高信頼動作モードと比較して、面積効率が良い.一方、高速動作モード と高信頼動作モードはそれぞれ, 高速動作, 高い動作安定性を実現することができる. つまり, 提案する 7T/14T メモリセルは 1bit の品質を必要に応じて変化させることが可 能である.

他に信頼性を向上させる手法として, 誤り訂正符号(ECC: Error Correction Code), 多 重化(MMR: Multi Module Redundancy)がすでに提案されている.しかし,これらの方法 を用いる場合,面積オーバヘッド,速度オーバヘッド,電力オーバヘッドが発生する にもかかわらず,1bit の信頼性およびメモリの容量は,設計時および製造時に決定さ れてしまう.3.4.4 節で,提案する 7T/14T メモリセルと ECC, MMR の信頼性の比較を 詳細に行う.

### 3.4 従来 6Tメモリセルと 7T/14Tメモリセルの比較

本節では,提案 7T/14T メモリセルを速度およびビット不良率(BER)の観点から評価 を行う.

#### 3.4.1 ビット線遅延時間

図 3.3 に示したとおり,WL を 2 本同時に立ち上げることにより,ワーストケース のセル電流を 2 倍以上改善することが可能である.図 3.7 にワーストケースのビット 線遅延時間の比較を示す.比較するにあたって,ビット線の長さ,およびビット線上 のメモリセルの数は同じであると仮定している(つまり,14T メモリセルを用いる場合 は,7T メモリセルを用いる場合と比較して,ビット線上のメモリ容量は半分となる). また,ビット線遅延時間をWL が VDD/2 となってから,BL と/BL の電位差が 100mV になるまでの時間と定義する.

図 3.7 に示すように,高速動作モードを用いることにより,通常動作モードを用いる場合と比較して,ワーストケースのビット線遅延時間を 53%改善することができる.



図 3.7 ワーストケースのビット線遅延時間: (a) 7TP メモリセル, (b)高速動作モード (14TP メモリセル).

#### 3.4.2 ビット不良率(BER)

図 3.8 に, モンテカルロシミュレーション(標本数: 2,000)を行った結果から得られ た,7TPメモリセルと14TPメモリセルの読出し動作マージン(SNM)と書込み動作マー ジン(WTP)の比較結果を示す.14TPメモリセルにおいては,読出し動作マージンは高 信頼動作モードで評価し,書込み動作マージンは高速動作モードで評価を行った.14TP メモリセルを用いることにより,7TPメモリセルと比較して,ワーストケースの読出 し動作マージンおよび書込み動作マージンを,それぞれ40mV,60mV 改善することが できる.

図 3.9~図 3.11 に読出し動作時, 書込み動作時, データ保持時の BER の比較結果を示す. また, 7TP メモリセルと 7TN メモリセルの BER は, 6T メモリセルとほとんど同じであるため以下では, 6T メモリセルと 14TN, 14TP メモリセルの BER の比較について記述する.



図 3.8 7TPメモリセルと14TPメモリセルにおける読出し動作マージン(SNM)と書込 み動作マージン(WTP).



図 3.9 ビット不良率(読出し動作).







図 3.9~図 3.11 の打点はモンテカルロシミュレーション(標本数: 20,000)の結果から 得られた BER を示す.一方,図中の外挿曲線は,以下に示す BER の近似式から導出 したものである.

$$\begin{cases} f(x) = \begin{cases} \frac{1}{\sqrt{2\pi\sigma}} EXP\left[-\frac{(x-\mu)^2}{2\sigma^2}\right] & (x \ge \mu) \\ 0 & (x \le \mu) \end{cases} \\ BER (VDD) = \int_{VDD}^{\infty} f(x) dx \end{cases}$$
(3.1)

ここで, *f*(*x*)は正規分布の確率密度関数であり, BER はその累積分布関数である. *µ*は BER が 0.5 となる電圧値であり, モンテカルロシミュレーションの結果から得られる. また, *o*はフィッティングにより得られる.

図 3.9はワーストケース(FS コーナー, 125°C)における読出し動作時の BER である. ここで,最低動作電圧を BER が 10<sup>-8</sup>となる電圧と定義する.高信頼動作モードを用い ることにより,読出し動作時の最低動作電圧は 0.60 V となり,従来の 6T メモリセル と比較して,最低動作電圧が 0.21V 改善され,最低動作電圧における BER は 1.9×10<sup>-5</sup> 改善される.また,7T メモリセルの通常動作モードの BER の曲線は 6T メモリセルと 同じ結果となる.

図 3.10 はワーストケース(SF コーナー, -40°C)の書込み動作時の BER である. 高信 頼動作モードは1組のアクセストランジスタで, 2 つの 7T メモリセルを同時に書込む ことになるので, アクセストランジスタのコンダクタンスが不十分となり, 書込み動 作には適さない. そのかわり, 1bit のデータを 14T メモリセルで保持する場合は, 高 速動作モードが適している. 追加トランジスタが 6T メモリセルのデータ保持ノードを 直接接続しているので, メモリセルのばらつきが抑制され, 低電圧での動作が可能と なる. 高速動作モードを用いることにより, 書込み動作時の最低動作電圧は 0.69V と なり, 従来の 6T メモリセルと比較して, 最低動作電圧が 0.26V 改善され, 最低動作電 圧における BER は 5.5x10<sup>-4</sup> 改善される.

図 3.11 はワーストケース(FS コーナー, 125℃)のデータ保持時の BER である. 追加 トランジスタを用いることにより, 2 つの 6T メモリセルの保持ノード間を直接接続さ れるので、14T メモリセルを用いることにより、データ保持電圧を改善することがで きる.図 3.11 には高速動作モードの結果のみを示しているが、高信頼動作モードにお いても同じ結果となる.

提案するディペンダブル SRAM は、面積オーバヘッド、速度、もしくは必要な信頼 性に応じて、最適な動作モードを選択することができる.また、提案するディペンダ ブル SRAM は、高信頼動作モードと高速動作モードを用いることにより、低電圧動作 時においても正常な動作が可能であるので、DVFS にも適している.

#### 3.4.3 スタンバイリーク電力

図 3.12 に最低動作電圧におけるスタンバイリーク電力の比較を示す[18]. 14TP メモ リセルは 6T メモリセルと比較して 22%リーク電力を小さくすることができる. サブ スレッショルドリークは 6T メモリセルと比較して大きくなるが,ゲートリークは 50% 以上削減される. 6T メモリセルに 1bit のデータを記憶するよりも,メモリセルペア (14TP メモリセル)に 1bit のデータを記憶する方が,リーク電力を削減することができ る.

また,14TP メモリセルは低電圧での動作が可能であるため,NBTI に対する耐性を 持つ.



図 3.12 1 セル当たりのスタンバイリーク電力(CC コーナー, 25°C)

#### 3.4.4 ECC, MMRとの比較

本節では,提案する 7T/14T メモリセルと,従来の高信頼化手法(ECC, MMR)との比較について記述する.



図 3.13 従来の高信頼化手法:(a)誤り訂正符号(ECC: Error Correction Code), (b)多 重化(MMR: Multi Module Redundancy).

ECC について図 3.13(a)に示す. ECC ではパリティビットをデータビットとは別に メモリに記憶することにより, 誤動作が発生し, 誤ったデータが読出されたとしても, 正しいデータに復元することができる[15-17]. データビット長が 32bit の場合, 6bit の パリティビットを用いることにより, 1bit のデータ訂正および 2bit の誤り検出が可能 である. ECC を用いる場合, データビットおよび冗長ビット(図 3.13(a)では, データ ビットが 32bit, 冗長ビットが 6bit)の内 2 ビットの動作不良があれば, エラー救済を行 うことができないため, BER は以下の式で表すことができる.

$$BER (VDD) = P_{error} (VDD) \times \left[ 1 - \left\{ 1 - \left( P_{error} (VDD) \right) \right\}^{37} \right]$$
(3.2)

ここで, Perror は図 3.9 で示した従来の 6T メモリセル単体の BER である.

36

また, MMR について図 3.13(b)に示す. MMR では同じ処理を多重化することによ り, 信頼性を向上させることが可能である[22], [23]. 図 3.13(b)では, 3 重にデータビ ットを保持している. 3 重にデータを保持しておくことにより, 1 つの処理で誤動作が 発生し, 誤ったデータが読出されたとしても, 残りの 2 つのデータが正しく読出され た場合, 処理の最終段において多数決論理を用いることにより, 正常な動作を行うこ とが可能である. MMR を用いる場合の BER は以下の式で表される.

$$BER (VDD) = 3 (P_{error} (VDD))^2 - 2 (P_{error} (VDD))^3$$
(3.3)

図 3.14 に従来の高信頼化手法と提案する 14TP メモリセルの高信頼動作モードとの BER の比較結果を示す. 14TP メモリセルは従来の高信頼化手法と比較して,最も低い BER を実現することが可能である.



図 3.14 提案 14TP の高信頼動作モードと従来の高信頼化手法との BER の比較.

また,従来の高信頼化手法では様々なオーバヘッドが発生する. ECC においては, 出力のクリティカルパス(シンドロームジェネレータ,デコーダ,エラー訂正)により, 2 倍以上のアクセスタイムオーバヘッドが発生する[19]. さらに,従来の高信頼化手法 では,追加ビット(ECC においてはパリティビット, MMR においては冗長ビット)につ いても,データの読出しおよび書込みを行う必要があるので,電力オーバヘッドが発 生する.一方,提案する 7T/14T メモリセルでは,速度オーバヘッド,および電力オー バヘッドが発生しない.

提案する 7T/14T メモリセルは従来の高信頼化手法と併せて用いることもできる.提案する 7T/14T メモリセルと従来の高信頼化手法を併せて用いることにより,より高い 信頼性を実現することが可能である.

### 3.5 ハーフセレクト回避のためのセルアレイ設計手法

書込み動作時,選択された行のワード線を立ち上げて書込みを行うが,一方で選択 されていない列のメモリセルのアクセストランジスタもオン状態となる.この時,ビ ット線に電流が流れ込み,読出し動作マージンの不十分なメモリセルではデータが反 転する可能性がある(ハーフセレクト問題)[24].

すでに示した通り, 14T メモリセルにおける読出し動作, 書込み動作は以下の特徴 を持つ.

- 読出し動作
  - 追加トランジスタはオン状態であり、ワード線を1本のみ立ち上げて、保持 データを読出す(高信頼動作モード).
- 書込み動作
  - 追加トランジスタはオン状態であり、ワード線を2本同時に立ち上げて、データの書込む(高速動作モード).

14T メモリセルにおいては,読出し動作方法と書込み動作方法が異なるため,図 3.15 に示す従来のセル配置では,書込み動作時において,書込みを行う必要のないメモリ セル(Half-selected pair)まで,ワード線が2本立ち上がるためデータが破壊される恐れ がある.



図 3.15 ハーフセレクト問題が発生する従来のメモリセルアレイ構造.

そこで、ハーフセレクト問題を回避するために、図 3.16 に示すメモリセルアレイ構 造を提案する.1 列ごとにメモリセルペアを1 セル分だけ列方向にシフトさせて、WLA と WLB の2 つのワード線を導入する.表 3.1 は WLA と WLB のマッピング方法を まとめたものである.高速アクセスモードでの書込み時に、選択された列においては 2 本のワード線が立ち上がり高速動作モードでの動作となるが、非選択の列において は、1 本のワード線のみ立ち上がり、高信頼動作モードでの動作となり、横 8 列のブ ロックまでハーフセレクトの問題に対応することができる.また、図 3.6(b)に示した レイアウトでは、メタル配線を追加するための面積の余裕があるので、WL および BL を追加することによる面積オーバヘッドは発生しない.

図 3.16 に示す回路図では、1 列ごとにメモリセルペアを1 セル分だけ列方向にシフトさせているが、実際のレイアウトにおいては図 3.17 に示すように、WL を終端に1 組追加(図 3.17 では WLA[2(n+2)]、WLB[(2n+2)]を追加)するだけで、従来のレイアウトと同様の並べ方で対応することができる.



図 3.16 ハーフセレクト問題が発生しない提案メモリセルアレイ構造(回路図).

|              | BL[0] | BL[1] | BL[2] | BL[3] | BL[4] | BL[5] | BL[6] | BL[7] |
|--------------|-------|-------|-------|-------|-------|-------|-------|-------|
| WL[2n]       | WLA   | WLA   | WLA   | WLA   | WLB   | WLB   | WLB   | WLB   |
| WL[2n+1]     | WLA   | WLA   | WLB   | WLB   | WLA   | WLA   | WLB   | WLB   |
| WL[2(n+1)]   | WLA   | WLA   | WLA   | WLA   | WLB   | WLB   | WLB   | WLB   |
| WL[2(n+1)+1] | WLA   | WLA   | WLB   | WLB   | WLA   | WLA   | WLB   | WLB   |

表 3.2 提案メモリセルアレイ構造のワード線マッピング.



図 3.17 提案メモリセルアレイのレイアウト.

提案メモリセル構造を実現するためのデコーダのブロック図を図 3.18(a)に示す.高 速動作モードおよび高信頼動作モードでは,X[0]が"H"に固定される.つまり,Xアド レスが常に奇数アドレスとなる.また,高速動作モードにおいては,HSM(High-speed mode)信号が"H"となり,隣接するワード線が2本活性化される.一方,通常動作モー ドおよび高信頼動作モードにおいては,HSM 信号は"L"となり,ワード線が1本だけ 活性化される.

HSM 信号および,行アドレス(X[6:0])を用いることにより,行デコーダの出力信号 (ROW[127:0])のうち,通常動作モードおよび高信頼動作モードでは1つ,高速動作モ ードでは2つが"H"となる.次に,行デコーダの出力と列アドレス(Y[2:0])を用いるこ とにより,ワード線セレクタがワード線を活性化する(通常動作モードおよび高信頼動 作モードでは1つのワード線が"H"となり,高速動作モードでは2つのワード線が"H" となる).また,BL対はX[1]および列アドレスを用いることにより選択される.



図 3.18 提案メモリセルアレイのデコーダ構成: (a)ブロック図, (b)ワード線セレクタの回路図.

## 3.6 実測結果

図 3.19 に 65-nm CMOS プロセスを用いて試作を行った 64-kb SRAM TEG のチップ 写真およびレイアウトを示す.本試作 TEG では,メモリセルに 7TP/14TP メモリセル を用いた.

図 3.20 に 7TP メモリセルと 14TP メモリセルの BER の実測結果を示す. 14TP メモ リセルは 7TP メモリセルと比較して,最初に動作不良が発生する電圧を 0.12V を改善 する.シミュレーション結果の図 3.9,図 3.10 と比較して最低動作電圧が低くなって いるが,室温での測定状況および,測定チップが FS コーナーもしくは SF コーナーで はないためであると考えられる.



図 3.19 65-nm プロセスを用いて試作を行った 64-kb SRAM TEG.



図 3.20 BER の実測結果.

高信頼動作モードにおけるアクセスタイムを図 3.21 に示す.また,高信頼動作モードの最低動作電圧である 0.36V において,40MHz での動作を実測により確認した. 図 3.22 に図 3.20 の結果から得られた最低動作電圧における,1 セル当たりのリー





図 3.21 高信頼動作モードのアクセスタイム.



図 3.22 1セル当たりのリーク電力の実測結果.

図 3.12 で示したシミュレーション結果では 14TP メモリセルの方が 7TP メモリセルよ りも1 セルあたりのリーク電力は小さくなっているが, 実測結果では 14TP メモリセル の方が 5%大きくなっている.これは,最低動作電圧の実測結果が,シミュレーション 結果よりも低くなっているので,ゲートリークがサブスレッショルドリークと比べて 無視できるほど小さくなっているためと考えられる.



図 3.23 40MHz 動作時における読出し動作電力の実測結果.



図 3.24 40MHz 動作時における書込み動作電力の実測結果.

図 3.23, 図 3.24 に 40MHz 動作時における読出し動作電力および書込み動作電力を 示す. 14TP メモリセルを用いることにより,7TP メモリセルと比較して読出し動作電 力を 43%,書込み動作電力を 48%削減することができる.

3.7 結言

動的に信頼性を変化することのできるディペンダブル SRAM の提案を行った.提案 した 7T/14T メモリセルは必要とされるメモリ容量,速度,信頼性に応じて,動的に 3 種類のモード(通常動作モード,高速動作モード,高信頼動作モード)を切り替えること ができる.メモリセルの面積オーバヘッドは追加するトランジスタが nMOS の場合 26%となり, pMOS の場合は 11%となる.

モンテカルロシミュレーションの結果から、ビット不良率が10<sup>-8</sup>となる点において、 読出し動作時および書込み動作時における最低動作電圧が、それぞれ0.21V、0.26V 改 善されることを確認した.提案した7T/14Tメモリセルは、誤り訂正符号(ECC: Error Correction Code)および多重化(MMR: Multi Module Redundancy)と比較して、より低いビ ット不良率を実現することができる.また、提案した7T/14Tメモリセルを使用するこ とによる、速度オーバヘッド、電力オーバヘッドは発生しない.

さらに, 提案した 7T/14T メモリセルにおけるハーフセレクト問題を回避するための 新しいメモリセルアレイ構造の提案も行った. 65-nm プロセスを用いて 64-kb SRAM を試作し, その実測結果から, 14T メモリセルが 7T メモリセルよりも低いビット不良 率を実現することを確認した.

本手法を用いることにより、システム LSI において新しいメモリ割り当て方法が可能となる.また、ユーザが動作環境、必要な信頼性、速度、電源電圧、アプリケーションなどに応じて、動的に SRAM の性能を変化させることが可能となる.

## 第4章 システマチックばらつきを補正する

## 基板バイアス電圧制御技術

#### 4.1 緒言

第3章では、ランダムばらつきを抑えるための手法としてディペンダブル7T/14Tメ モリセルの提案を行った.本章では、チップ間におけるシステマチックばらつきを抑 える手法の提案を行う.

システマチックばらつきを抑えるために、すでにバルクプロセスに対する基板バイ アス電圧制御技術が提案されている[25],[26].しかし、これらバルクプロセスにおい ては順方向バイアス電圧を用いる場合、フォワードジャンクションリークが増大して しまう.さらに、微細プロセスに対して逆方向バイアス電圧を用いる場合においても、 GIDL (Gate Induced Drain Leakage current)が問題となる.よって、バルクプロセスに対 して、基板バイアス電圧制御を用いる場合、基板バイアス電圧を±0.6V 程度にしか印 加することができないため、しきい値電圧の調整を広い範囲で行うことができない.

一方, FD-SOI(Fully-Depleted Silicon-on-Insulator) プロセスには、 1)サブスレッショ ルドリークが小さい、2)順方向バイアスを用いる場合でも、フォワードジャンクショ ンリークが問題にならない、という利点がある.

FD-SOI プロセスにおいても、すでに基板バイアス電圧制御技術が提案されている [27]. しかし、すでに提案されている手法では、図 4.1(a)に示すトリプルウェル構造を 用いて、pMOS および nMOS の基板バイアス電圧をそれぞれ別に印加する必要がある ため、特殊なデバイス構造が必要となる. さらに、図 4.1(b)にに示すように、基板バ イアス電圧を、読出し動作および書込み動作に応じて制御する必要があるため、サイ クルオーバヘッドが発生してしまう. また、ブロックごとに基板バイアス電圧制御を 行うため、バックゲートコンタクトに伴うメモリセルアレイにおける面積オーバヘッ ドも発生する.

そこで本研究では、FD-SOI プロセスにおいて、自動的にチップ間のしきい値ばらつ きを検出し、SRAMの動作マージンが最大となるように補正を行う基板バイアス電圧 制御回路の提案を行う.また、本提案手法を用いることによる速度オーバヘッド、お よびメモリセルアレイにおける面積オーバヘッドは発生しない.



図 4.1 従来手法の問題点: (a)特殊プロセス(トリプルウェル構造), (b)サイクルオーバヘッド.

## 4.2 FD-SOIデバイス

図 4.2 は, SOI(Silicon-On-Insulator)の断面構造を示したものである. シリコン基板中 に埋め込み酸化膜 SiO<sub>2</sub>(BOX: Buried Oxide)が埋め込まれ,その上に単結晶シリコン膜 (SOI 膜)が存在し,素子はこの単結晶シリコン膜上に形成される.また,BOX の下の バルク Si 部は支持基板と呼ばれる[28], [29].



図 4.2 基板断面構造の比較: (a) バルクプロセスの基板, (b)SOI プロセスの基板.

素子構造には図 4.3 に示すように部分空乏化型(PD-SOI: Partially-Depleted SOI)および完全空乏化型(FD-SOI: Fully-Depleted SOI)の2種類がある.



図 4.3 素子構造: (a) 部分空乏化型(Partially-Depleted SOI), (b) 完全空乏化型 (Fully-Depleted SOI).

一般的に、SOI プロセスは、バルクプロセスと比較して以下の長所がある.

1. 高速化・低消費電力化が可能.

SOI プロセスでは、ドレインー基板間容量が小さいため、寄生容量が小さくなるので、スイッチングが高速化し、スイッチングに要する消費電力も下がる.

- 多段入力論理回路の高速化が可能.
   バルクプロセスでは、多段入力論理回路を構成した場合、基板効果が発生し高速 動作の妨げとなるが、SOIプロセスでは基板効果が発生しない.
- 3. ラッチアップの心配がない.

バルクプロセスでは、トランジスタの拡散層、ウェル構造から構成される寄生サ イリスタ構造が存在するため、ラッチアップを起こさないように、寄生抵抗の低 減、回路レイアウトなどの工夫が必要となる.一方、SOI プロセスでは、寄生サ イリスタ構造が存在しないため、設計時にラッチアップを起こさないように注意 を払う必要がない. 4. ソフトエラーに強い.

SOI プロセスでは BOX 膜が存在するので, α線など放射線の影響を小さくできる. SOI 素子では, BOX 膜が素子表面から数百 nm 以内に存在するため, 深い場所で 発生した電子・正孔対は, SiO2 のエネルギー障壁でブロックされ, SOI 膜中に形 成された回路に影響を与えない.

 拡散層における pn 接合リーク電流が小さい.
 SOI プロセスにおける拡散層 pn 接合のリーク電流は、不純物が SOI 層に深く拡散 されれば、pn 接合の底面部からの寄与は無視することができるため、小さくなる.

また, FD-SOI プロセスは, PD-SOI プロセスと比較して以下の長所がある.

- 基板浮遊効果が小さい.
   PD-SOIでは、中性領域にドレインのインパクト・イオン化で発生した正孔が蓄積 しやすく基板浮遊効果が発生し、キンク効果、ドレイン破壊電圧の低下、しきい 値電圧の不安定性といった問題が発生する.
   一方 FD-SOIでは、ソースと SOI ボディ間のエネルギー障壁が低いため、正孔は ソースに流れやすくなり、SOI ボディ中に蓄積されにくくなるため、基板浮遊効 果を抑制することができる.
- サブスレッショルドリークの低減
   FD-SOI プロセスは、PD-SOI プロセスと比較して空乏層容量を小さくすることができるため、サブスレッショルドスロープ係数(S 係数)が小さくなり、サブスレッショルドリークを抑制することができる.

## 4.3 提案基板バイアス電圧制御手法

#### 4.3.1 FD-SOIプロセスにおける基板バイアス電圧制御

図 4.4(a)に電源電圧を変化させた場合のプロセスコーナーと, 読出し動作および書 込み動作下限の関係を示したミルキーウェイプロットを示す[30]. 既に記述したとおり, SRAM の読出し動作および書込み動作の動作下限電圧は, それぞれ FS コーナーおよ



図 4.4 読出し動作および書込み動作の低電圧動作下限(ミルキーウェイプロット): (a)基板バイアス電圧制御なし,(b)基板バイアス電圧制御あり.

FD-SOI プロセスはバルクプロセスと比較して、ランダムばらつきが小さいので、FS コーナーおよび SF コーナーのシステマチックばらつきが SRAM の歩留まり、および 低電圧動作性に大きな影響を与える[31]. したがって、FD-SOI プロセスを用いた SRAM では、システマチックばらつきを補正することにより、歩留まりの向上および低電圧 動作を実現することができる(図 4.4(b)).



図 4.5 FD-SOI デバイス : (a)デバイス構造, (b)nMOS の Id-Vgs 特性, (c)pMOS の Id-Vgs 特性.

図 4.5(a)に FD-SOI デバイス構造を、支持基板から基板バイアス電圧(Vsub)を印加し た場合の nMOS および pMOS の Id-Vgs 特性をそれぞれ図 4.5(b),図 4.5(c)に示す.順 方向バイアス電圧を印加する場合、nMOS のしきい値電圧(Vtn)は低下し、pMOS のし きい値電圧の絶対値([Vtp])は上昇する.一方、逆方向バイアス電圧を印加する場合、 Vtn は上昇し、|Vtp|は低下する.つまり、FS コーナーのチップにおいては逆方向バイ アス電圧を印加し、SF コーナーのチップにおいては順方向バイアス電圧を印加するこ とにより、図 4.4(b)に示すように、システマチックばらつきを CC コーナーのしきい 値電圧に補正することが可能となる.

また,図 4.6 に示すように,支持基板から基板バイアス電圧を印加することにより, 全てのトランジスタのしきい値電圧を同時に変化させることが可能であるため,基板 バイアス電圧を用いることによる面積オーバヘッドは発生しない.



図 4.6 FD-SOI プロセスを用いた SRAM のメモリセル.

#### 4.3.2 基板バイアス電圧制御回路

図 4.7(a)に提案する基板バイアス電圧制御回路のブロック図を示す. 図 4.7(b), 図 4.7(c)にしきい値電圧検出回路および VDD/2 生成回路をそれぞれ示す.



(a)



(b)



図 4.7 提案基板バイアス電圧制御回路: (a)ブロック図, (b)しきい値電圧検出回路(Vt detector), (c)VDD/2 生成回路(Half-VDD generator).
しきい値電圧検出回路はシステマチックばらつきを Detect 信号として出力する. チ ップ間のしきい値電圧が FS コーナー寄りの場合, Detect 信号は VDD/2 よりも低い電 圧値を出力する. 逆に, チップ間のしきい値電圧が SF コーナー寄りの場合, Detect 信号は VDD/2 よりも高い電圧値を出力する.

一方, VDD/2 生成回路はボディタイトランジスタを使用し, プロセスばらつきの影響を受けずに, VDD/2 よりも高い電圧値,および低い電圧値を,それぞれ Ref+, Ref –として出力する.

次に、しきい値電圧検出回路からの出力 Detect 信号と VDD/2 生成回路からの出力 Ref+, Ref-の比較をセンスアンプにより行う. 順方向バイアスを生成する場合は Up 信号が"H"となり,順方向バイアス電圧生成回路により,順方向バイアス電圧が生成さ れる. また、逆方向バイアスを生成する場合は Down 信号が"H"となり、逆方向バイア ス電圧が生成される. 順方向バイアス電圧生成回路,および逆方向バイアス電圧生成 回路はチャージポンプにより構成される.

図 4.8 に FS コーナーチップにおける動作例を示す. FS コーナーチップにおいて, 基板バイアス電圧生成回路は以下のように動作する.

- Detect 信号は VDD/2 よりも低い値("L")を出力する. 同時に, VDD/2 生成回路が VDD/2 よりも少し高い電圧値 Ref+(VDD/2+α), および VDD/2 よりも少し低い電圧 値 Ref-(VDD/2-α)を出力する.
- センスアンプを用いて、Detect 信号と Ref+, Ref-の比較を行う. FS コーナーチッ プにおいては、Detect 信号が"L"になるので、センスアンプの出力信号である Down 信号、および Up 信号はそれぞれ、"H"、および"L"となる.
- 3. Down 信号が"H"となるので、逆方向バイアス電圧生成回路により、逆方向バイア ス電圧が生成される.



図 4.8 基板バイアス生成回路の動作例(FS コーナー).

図 4.9 にしきい値電圧検出回路および,VDD/2 生成回路のシミュレーション結果を 示す. 基板バイアス電圧はセンスアンプの出力信号に基づいたフィードバック機構に より制御され,最終的に Detect 信号は Ref+と Ref-の間の電位となる. このようにし て,FS コーナーおよび SF コーナーのしきい値電圧は CC コーナーのしきい値電圧に 収束する.



図 4.9 しきい値電圧検出回路と VDD/2 生成回路のシミュレーション結果.

# 4.4 実測結果

図 4.10 に 0.15-um FD-SOI プロセスを用いて試作を行った 486-kb SRAM のチップ写 真を示す.



図 4.10 0.15-um FD-SOI プロセスで試作を行った 486-kb SRAM.

図 4.11~図 4.13 に FS コーナーチップにおける BER の実測結果を示す. 図 4.11 は 読出し動作時の BER である. 基板バイアス電圧を印加しない場合の読出し動作の最低 動作電圧は 0.56V である. 逆方向バイアス電圧を印加することにより, しきい値電圧 が FS コーナーから CC コーナーの方向に補正させるため, 読出し動作マージンが増大 し, 最低動作電圧は改善される. 逆に, 順方向バイアス電圧を印加する場合, 読出し 動作マージンが劣化するので, 最低動作電圧は悪化する.

図 4.12 にデータ保持時の BER を示す,基板バイアスを印加しない場合,リテンション電圧は 0.36V である.また,読出し動作と同様に,逆方向バイアス電圧を印加することにより,リテンション電圧は改善される.



図 4.11 読出し動作時の BER の実測結果.



図 4.12 データ保持時の BER の実測結果.

図 4.13 に書込み動作時の BER を示す. 基板バイアス電圧を印加しない場合,書込み動作の最低動作電圧は 0.36V である. 逆方向を印加することにより,最低動作電圧 は悪化すると考えられるが, Vsub が-2V 以下の場合,リテンション電圧により最低 動作電圧が律速されている. そのため, Vsub が-2V においては,リテンション電圧 が改善されるため,最低動作電圧は改善される. また, Vsub が-2V より低い場合, 書込み動作の最低動作電圧は悪化するため,実測結果は妥当である.



図 4.13 書込み動作時の BER の実測結果.

Vsub=-4V において,最低動作電圧が 0.14V 改善され,486-kb SRAM が 0.42V で正 常に動作することを実測により確認した,またこの場合において,図 4.14 に示すよう に,リーク電力が 40%削減されることを実測により確認した.低電圧動作は微細プロ セスにおけるゲートリークの削減および,NBTI に対しても効果的である.

また,図 4.15 に示すようにチャネル部の不純物濃度を低くし,支持基板の不純物濃度を高くすることにより,ランダムばらつきを抑制することのできるデバイス構造が すでに提案されている[32],[33]



図 4.15 ランダムばらつきを抑制することができるデバイス構成.

提案した基板バイアス電圧制御回路は、ランダムばらつきを抑制することができる デバイス構造および、第3章で提案した7T/14Tメモリセルと併せて用いることにより、 チップ間およびチップ内の両方のばらつきを改善することが可能である.

# 4.5 結言

FD-SOI プロセスを用いた,システマチックばらつきを抑制することができる基板バ イアス電圧制御回路の提案を行った.提案した基板バイアス電圧制御回路は,システ マチックばらつきを自動的に検出し,補正することにより SRAM のメモリセルの動作 マージンを改善することができる.

0.15-um FD-SOI プロセスを用いて,486-kb SRAM を試作し,実測することにより,動作下限電圧を 0.14V 改善し,0.46V で動作することを確認した.

# 第5章 動画像処理応用 2-port SRAMの低消 費電力化技術

# 5.1 緒言

近年の携帯機器の普及により、限られたバッテリ容量の範囲で、実時間動画像処理 プロセッサを長時間駆動させる必要があるため、実時間動画像処理プロセッサの低消 費電力化は非常に重要な課題である.

2003 年, MPEG-2, MPEG-4 に続く動画像圧縮規格 H.264 が制定された. H.264 は MPEG-4 に比べて最大で約2倍の圧縮符号化効率を持つ. しかし, H.264 は, 複数ブロ ックサイズ, 複数参照ピクチャでの動き補償, デブロッキングフィルタなど, 多くの 高効率符号化ツールを採用しており, MPEG-4 と比較して圧縮符号化演算量は数十倍 となるため, 消費電力が莫大に増加してしまう.

また,既に示したとおり,近年 SoC に搭載されるメモリの容量が増大しており,実時間動画像処理プロッセサにおいても,この傾向は顕著である.特に HDTV 対応の H.264 エンコーダには,サーチウィンドウバッファとして少なくとも 500-kb のメモリ が必要であり,全消費電力のうち 40%が消費される[34].

さらに、プロセスの微細化が進むにつれ、大容量 SRAM がフレームバッファや再構 成画像メモリなどに実装され、消費電力の大部分を占めると考えられる.

上記の理由から,実時間動画像処理プロセッサの低消費電力化には,SRAMの低消 費電力化が必要不可欠である.本章では,アプリケーションとハードウェアの両方の 着眼点から動画像処理で広く用いられている 2-port SRAM に対して,動画像の持つ隣 接画素相関性を利用した低消費電力化技術の提案を行う.

また,本提案手法は標準動作電圧時においても低消費電力化を実現することができるため,プロセスの微細化が進み SRAM の低電圧動作が困難となる状況においても有効な手法である.

# 5.2 従来の 2-port SRAMの問題点

## 5.2.1 2-port SRAM の構成

通常のプロセッサでは、1 サイクルで読出し、または書込みを行うことができる 1-port SRAM が用いられている.しかし、実時間動画像処理プロセッサでは、1 サイク ルで同時に読出しと書込みを行うことができ、より処理の高速化を図れる、2-port SRAM が広く用いられている[34 – 37].

本章では,図 5.1 に示す読出しポートがシングルビット線構造の 2-port SRAM メモ リセルを用いる.本メモリセルは従来の 1-port 6T メモリセルに,読出しポート用に 2 つの nMOS トランジスタを追加した,8 トランジスタで構成される.



図 5.1 8 トランジスタで構成される 2-port メモリセル.

このメモリセルは読出し用のドライバトランジスタ M7 のゲートが保持ノードに接続 されているため,読出し動作マージンが無限大となる.よって,アクセストランジス タ M4, M5 に対して,ドライバトランジスタ M2, M3 を大きくする必要がなく, M2, M3 を最小サイズにすることができるため,メモリセルの面積を小さくすることができ る[38], [39].

## 5.2.2 2-port SRAMの読出しビット線充放電電力

図 5.2 に本章で用いる 2-port SRAM の読出し動作時の読出しワード線(RWL: Read Word Line)と読出しビット線(RBL: Read Bit Line)の波形を示す.一般的に, SRAM のビット線はプリチャージ構造がとられており,読出しビット線は RWL が立ち上がる前に, 電源電圧 VDD に充電されている.シングルビット線構造では,"0"データ読出しの場合,読出しドライバトランジスタ N5 がオン状態となり,読出しビット線の電荷が放電され,充放電電力が発生する.一方,"1"データ読出しの場合, N5 はオフ状態となるため,読出しビット線の電荷の放電は発生しないので,充放電電力は発生しない.



図 5.2 2-port SRAM における読出し動作時における動作波形.

よって、"0"読出しの数を削減し、"1"読出しの数を増加させることにより、読出し ビット線の充放電電力を削減することができる.次節では、多数決論理を用いて"0"読 出しの数を削減し、"1"読出しの数を増加させる手法について述べる.

# 5.3 多数決論理SRAM

#### 5.3.1 多数決論理SRAMの概要

"1"読出しの数を増加させるには,SRAM に保持するデータの"1"の個数を増加させ ればよい.書込み動作時に入力データの"0"の個数を削減し,"1"の個数を増加させる ことにより,保持データの"1"の個数を増加させることができる.以下では,書込み動 作時に多数決論理判定回路を用いて,入力データの"0"の個数を減らし,"1"の個数を 増加させる手法について述べる.

図 5.3(a)に多数決論理 SRAM のブロック図を示す. 多数決論理 SRAM では,保持デ ータの"1"の個数を増加させるため,書込み動作時において,多数決論理回路を用いて 入力データの"0"の個数が"1"の個数よりも多い場合に入力データの反転を行う.また, 入力データが反転したかどうかの情報を,図 5.3(b)に示すように,フラグビットとし て付加する(図 5.3(b)では,入力データが反転した場合,フラグビットの値を"1"とし, 反転しなかった場合,フラグビットの値を"0"としている).



図 5.3 多数決論理 SRAM の概要: (a)ブロック図, (b)フラグビットの概念.

また,読出し動作時において,フラグビットの値が"1"の場合,保持データの反転を 行ってから出力し,フラグビットの値が"0"の場合,保持データをそのまま出力するこ とにより,元の入力データを復元することができる.

## 5.3.2 多数決論理を用いることによる消費電力削減効果.

図 5.4 に、従来 SRAM と多数決論理 SRAM の消費電力の比較を示す. 図 5.4 では、 入出力データのビット幅を 8bit (8bit/word)としている.入力データの"1"の個数が 8 個 の場合、多数決論理 SRAM では、データの反転は行われず、保持データの"0"の個数 はフラグビットの 1 個のみとなる.この場合、従来の SRAM では、保持データに"0" が存在しないため、多数決論理 SRAM の方が読出しビット線の充放電電力は大きくな る.つまり、入力データの"1"の個数が 5 個以上の場合においては、フラグビットの値 が"0"となるので電力オーバヘッドが発生する.一方、入力データの"1"の個数が 4 個 以下の場合においては、多数決論理回路によって、入力データが反転されるので、"0" の個数が削減され"1"の個数が増加するし、読出しビット線の消費電力は削減される.



図 5.4 従来 SRAM と多数決論理 SRAM における RBL の充放電電力の比較.

ここで,入力データを二項分布のパターンと仮定した場合における,消費電力削減 効果について解析を行う.従来 SRAM では,保持データの"0"の個数の平均µ<sub>conv</sub>は以 下のようになる.

$$\mu_{\rm conv} = \frac{\sum_{k=0}^{8} {}_{8}C_{k} \cdot (8-k)}{\sum_{k=0}^{8} {}_{8}C_{k}} = 4.0$$
(5.1)

一方,多数決論理 SRAM では,保持データの"0"の個数の平均µ<sub>mj</sub>は以下のようになる.

$$\mu_{\rm mj} = \frac{\sum_{k=0}^{4} {}_{8}C_{k} \cdot k + \sum_{k=5}^{8} {}_{8}C_{k} \cdot (8+1-k)}{\sum_{k=0}^{8} {}_{8}C_{k}} = 3.27$$
(5.2)

よって,入力データが二項分布のパターンである場合,多数決論理を SRAM に用いる ことにより,読出しビット線の充放電電力を 18%削減することができる.

データが反転した場合の,フラグビットの値を"1"とするか"0"とするかという問題 があるが,入力データが全体的に"1"が多い場合は,フラグビットの消費電力オーバへ ッドを避けるために,フラグビットの値を"0"とした方が良い.逆に,入力データが全 体的に"0"が多い場合は,多数決論理 SRAM の消費電力削減効果を効率的に利用する ために,フラグビットは"1"とした方がよい.詳細については次節で記述する.

## 5.4 Reordering処理

### 5.4.1 動画像の特性

H.264 コーデックでは、YUV フォーマットが用いられている. 図 5.5 に動画像の例 を示す. 1 つの画素は 8bit の輝度信号(Y 信号)と、4bit の色差信号(U 信号、V 信号)か らなる. 以下では、簡単のため、Y 信号についてのみ取り扱うこととする. また、本 章で取り扱う動画像として、図 5.6 に示す 10 種類の HDTV 解像度の標準テスト動画 像シーケンスである、"Bronze with Credit" (Bronze)、"Building along the Canal" (Canal)、 "Church" (Church)、"Intersections" (Inters)、"Japanese room" (Jpnroom)、"European Market"



(Market), "Yachting" (Sail), "Street Car" (Stcar), "Whale Show" (Whale), "Yacht Harbor" (Yacht)を用いる.

図 5.5 動画像の例.



図 5.6 HDTV 解像度の標準テスト動画像シーケンス.

また,原画像は符号化され,再構成画像がループフィルタから生成され,動き補償 器に利用される.符号化条件を図 5.7 に示す.本章では,再構成画像についても取り 扱う.



図 5.7 H.264 の符号化プロセスと符号化条件.

動画像は,隣接する画素同士の間に強い相関性をもつ.特に,上位ビットほど相関 性は強く,最上位ビットの値は高い確率で,全て"0"もしくは"1"となる.また,下位 ビットほど相関性は弱くなり,最下位ビットの値はランダムとなる.

図 5.8 に, 隣接する横8画素のビットごとの相関性を示す. 最上位ビットは, 全て"0" もしくは"1"になる可能性が大きく, 一方, 最下位ビットは, ほぼ二項分布となってお り, 相関性が低いということが分かる.



図 5.8 標準テスト動画像シーケンス Market, Church における隣接する横 8 画素の ビットごとの相関性。

## 5.4.2 Reordering処理の概要

5.3節で記述したとおり,入力データが二項分布のパターンであっても,多数決論理 回路を用いることにより,読出しビット線の充放電電力を削減することができる. HDTV 解像度の標準テスト動画像シーケンスの原画像に対して多数決論理を用いる場 合,読出しビット線の充放電電力を平均20%削減することができる.

さらに、多数決論理を"0"に偏ったデータに用いることで、より効率的に読出しビット線の充放電電量を削減することができる.図 5.8 に示した通り、隣接する画素の最上位ビットは高い確率で、全て"0"もしくは"1"となる.よって、動画像の持つ隣接画素相関性を利用することにより、読出しビット線の充放電電力をより効率的に削減することが可能である.



図 5.9 多数決論理を用いた場合における規格化読出しビット線電力.

図 5.10 に Reordering 処理の概要を示す.書込み動作において,はじめに m 画素(つまり, 8m bit)で構成されるデータをビットごとのグループに並び替える.次に,入力データの"0"の個数が"1"の個数よりも多い場合,つまり,"0"の個数が m/2 以上の場合,データの反転を行い,そうでなければデータの反転を行わない. Reordering 処理と多数決論理を組み合わせることにより,保持データの"1"の個数を最大化することができ,読出しビット線の充放電電力を最適化することができる.

また,読出し動作時において,フラグビットの値に応じて保持データを反転するか どうかの判定を行い,その後,並び替えを行うことにより,元の入力データを復元す ることができる.

本節では,画像の持つ隣接画素相関性を利用した Reordering 処理の概要について述 べた.しかし,隣接画素の取り方として,例えば,縦方向に8画素を取る方法,横方 向に16画素を取る方法,横2画素×縦4画素の8画素を取る方法などが考えられる. 次節では,画像の持つ隣接画素相関性を最大限に発揮できる隣接画素の取り方の解析, フラグビットの値の解析,および読出しビット線電力の消費電力削減効果について述 べる.



図 5.10 多数決論理と Reordering 処理.

## 5.4.3 隣接画素の最適な取り方

はじめに m=8 とする場合(隣接する 8 画素を取る場合)について検討を行う.考えら れる全ての画素の取り方は,図 5.11 に示すように,横8 画素 × 縦1 画素,横4 画素 × 縦2 画素,横2 画素 × 縦4 画素,および横1 画素 × 縦8 画素である.また,動画像 符号化処理では図 5.12 に示すようなインターレース画像を用いるため,奇数行の画素 と偶数行の画素では時間が生じる.よって,縦方向に画素を取る場合,1 行とばしに 取る方法において,隣接画素相関性が高くなる可能性がある.したがって,画素の取 り方を横4 画素 × 縦2 画素,横2 画素 × 縦4 画素,および横1 画素 × 縦8 画素とす る場合,縦方向について連続して画素を取る場合と,1 行とばしに取る場合の2 通り について検討を行う.







図 5.12 インターレース画像の一例.

図 5.13 に, HDTV 解像度の標準テスト動画像シーケンスの原画像に対して画素の取 り方を変化させた場合における,多数決論理と Reordering 処理の読出しビット線充放 電電力削減効果を示す.



図 5.13 画素の取り方を変化させた場合の読出しビット線充放電電力削減効果.

図 5.13 より横方向に連続して画素を取る方法(横 8 画素 × 縦 1 画素)が最も消費電 力を削減することができる.原因は以下のように考えられる.

- 連続して縦方向に画素を取る場合、インターレース画像を取り扱っているため、
   奇数行と偶数行では時間差が存在し、隣接画素相関性は低くなる。
- 1行とばしに画素を取る場合,時間差は存在しない.しかし,縦に8画素取る場合,
   実際には縦方向の16画素を扱ってしまうため,画素間の距離が遠くなり,隣接画素相関性は低くなる.

次に,フラグビットの付け方について解析を行う.ただし,画素の取り方を8画素 × 縦1画素とした場合について取り扱う.

これまで、「入力データが反転した場合は、フラグビットの値を"1"、入力データが 反転しなかった場合は、フラグビットの値を"0"」として記述してきた.しかし、「入 カデータが反転した場合は、フラグビットの値を"0"、入力データが反転しなかった場合は、フラグビットの値を"1"」とする方法も考えられる.

図 5.14 に、データ反転時のフラグビットの値を変化させた場合の読出しビット線の 充放電電力削減効果の変化を示す. "Flag"が「入力データが反転した場合は、フラグビ ットの値を"1"、入力データが反転しなかった場合は、フラグビットの値を"0"」とす る場合、"Flag\_n"が「入力データが反転した場合は、フラグビットの値を"0"、入力デ ータが反転しなかった場合は、フラグビットの値を"1"」とする場合である.



図 5.14 フラグビットの値を変化させた場合の読出しビット線充放電電力削減効果.

図 5.15 に"1"の個数に応じた Flag と Flag\_n の読出しビット線の充放電電力削減効果 の比較を示す.取り扱うデータの"0"の個数が多い場合,Flag の方が消費電力削減効果 は大きくなり,取り扱うデータの"1"の個数が多い場合,Flag\_n の方が消費電力削減効 果は大きくなる.つまり,暗い画像(Bronze, Church, Inters, Market, Stcar)に対して は「入力データが反転した場合は,フラグビットの値を"1",入力データが反転しなか った場合は,フラグビットの値を"0"」とする方が消費電力削減効果は大きくなり,明 るい画像(Sail, Whale, Yacht)に対しては「入力データが反転した場合は,フラグビッ トの値を"0",入力データが反転しなかった場合は,フラグビットの値を"1"」とする 方が消費電力削減効果は大きくなる. 本論文で用いた 10 種類の HDTV 解像度の標準テスト動画像シーケンスに対しては 「入力データが反転した場合は、フラグビットの値を"1"、入力データが反転しなかっ た場合は、フラグビットの値を"0"」とする方が消費電力削減効果は大きくなる.した がって、5.5 で述べる実設計ではこの方法を用いて実装を行った.



図 5.15 フラグビットの値を変化させた場合の読出しビット線充放電電力.

次に、横方向に連続して取る画素数について解析を行う.以下では、横方向に4 画 素(m=4)、8 画素(m=8)、16 画素(m=16)、32 画素(m=32)、を取る場合について取り 扱う.図 5.16 に HDTV 解像度の標準テスト動画像シーケンスの原画像に対する読出 しビット線の充放電電力削減効果を示す.m=8とする場合、消費電力削減効果は最大 となり、読出しビット線の充放電電力を 45%削減することができる.さらに、H.264 符号化処理時の再構成画像に対して多数決論理と Reordering 処理を用いることにより、 m=8とする場合、図 5.17 に示すように読出しビット線の充放電電力を 53%削減する ことができる.よって、再構成画像に対して多数決論理と Reordering 処理を用いるこ とにより、さらに読出しビット線の充放電電力を削減することができる.



図 5.16 原画像に対して多数決論理と Reordering 処理を用いた場合の読出しビット 線充放電電力削減効果.



図 5.17 再構成画像に対して多数決論理と Reordering 処理を用いた場合の読出しビット線充放電電力削減効果.

最後に,横方向に連続して取る画素数を変化させた場合における,消費電力削減効 果とフラグビットによる面積オーバヘッドの解析を行う.図 5.18 に,連続して取る画 素数を変化させた場合の消費電力削減効果と面積オーバヘッドのグラフを示す.4 面 素を取る場合,隣接画素相関性は大きくなるが,フラグビットによる消費電力オーバ ヘッドが大きいため,8 画素をとる場合と比べて消費電力削減効果は小さくなる.8 画 素を取る場合が,最も消費電力削減効果は大きくなる.また,16 画素以上になると, 隣接画素相関性が低くなるため,諸費電力削減効果は小さくなる.4 画素,8 画素を取 る場合,フラグビットによるメモリセルアレイにおける面積オーバヘッドが10%以上 となってしまうため,次節で記述する実設計では,横方向に連続して16 画素を取る場 合を選択した.



図 5.18 提案 SRAM における読出しビット線充放電電力削減効果とメモリセルアレ イにおける面積オーバヘッド.

# 5.5 90-nmプロセスを用いた実装

### 5.5.1 全体回路構成

90-nm プロセスを用いた提案 SRAM の実装方法を本節において記述する. 図 5.19 に提案 SRAM のブロック構成図を示す.メモリセルの容量は 68-kb で, 図 5.18 に記述 した通り, *m* = 16 を採用している. 本 SRAM は 64-kb がデータ用の領域, 4-kb はフラ グビット用の領域である.

読出しビット線は、すでに記述したとおりシングルビット線を採用している.また、 シングルビット線構造はデュアルビット線構造と比較して、速度オーバヘッドが発生 するため、階層ビット線構造を用いている[38]、[39].一方、書込みビット線はデュア ルビット線構造を採用している.書込みビット線は書込み動作時にしか用いられず、 動作前にプリチャージをする必要がないので、書込みビット線にプリチャージトラン ジスタは存在しない.

## 5.5.2 メモリセル

図 5.20 に本 SRAM で用いたメモリセルのレイアウトを示す. セル面積は 3.15µm × 0.76µm であり,メモリセルの回路図はすでに図 5.1 で示したとおりである. また,各 トランジスタのサイズは図 5.20 に示してある.



図 5.19 提案する 68-kb SRAM のブロック図.



図 5.20 メモリセルのレイアウト.

## 5.5.3 多数決論理SRAM向けの書込み回路および読出し回路

提案 SRAM では、書込み動作時において入力データに対して多数決論理をとる必要 があるため、書込み回路には多数決論理回路が必要となる.しかし、デジタルセルラ イブラリのみで多数決論理回路を構成する場合は 70 ゲート必要となるため、面積オー バヘッドが大きくなる[40], [41].

図 5.21 に多数決論理回路を加えた書込み回路を示す. 多数決論理回路はダイナミックロジックによって構成されている. フリップフロップ(FF)に接続されたプルダウンネットワークが JL と JL\_N の電荷の引き抜きを行い, センスアンプが JL と JL\_N の電位差を増幅し, フラグビットの値が決定される.



図 5.21 多数決論理回路を加えた書込み回路.

単純にダイナミックロジックを用いて 16bit の多数決論理を実装する場合, 16 個の プルダウンネットワークにより多数決論理を判定しなければならないため, IL と IL\_N の電位差が小さくなる可能性がある.そこで,提案する多数決論理回路では, IL と IL\_N の電位差を大きくするために, AND ゲートを用いることにより, プルダウンネットワ ークの個数を 16 個から 8 個に削減している.また,センスアンプの次段に MUX を追加することにより,テストモード時において,外部からフラグビットの値を入力する ことができる.

入力データの"1"の個数が 7 個, "0"の個数が 9 個の場合における多数決論理回路の 動作波形を図 5.22 に示す. 図 5.22(a)は JL のシンクパスが 1 個, JL\_N のシンクパス が 0 個の場合の動作波形である. JL\_N のシンクパスが 0 個であるため, JL\_N はプリ チャージレベル(VDD)の状態から変化しないので, センスアンプの入力の電位差(JL と JL\_N)が 670mV と最も大きくなる. 図 5.22(b)は JL のシンクパスが 4 個, JL\_N のシン クパスが 3 個の場合の動作波形である. センスアンプの入力の電位差が 130mV となり, 図 5.22(a)と比較して小さくなるが, センスアンプが正常な動作をするには十分な電位 差である.

PVT が最悪条件(FS コーナー, 電源電圧 0.9V, -40°C)における, 動作波形を図 5.22(c) に示す.また, 図 5.22(b)と同様, L のシンクパスは4個, JL\_N のシンクパスは3個 である. PVT が最悪条件であったとしても, センスアンプの入力の電位差は100mV 存 在するため, センスアンプは正常に動作する.

入力データの"1"の個数と"0"の個数が同じで,JL と JL\_N におけるシンクパスの個数が同じ場合において,JL と JL\_N の電位差は発生しない.しかし,フラグビットの 値はセットリセットフリップフロップにより,"1"もしくは"0"に決定される."1"と"0" の個数が同じ場合,多数決論理による消費電力削減効果は小さくなる可能性があるが, フラグビットによって,メモリセルへの入力(Dopt[15:0])は決定されるため,動作に問 題は発生しない.

また,書込みワード線(WWL)の立ち上がりまでに,多数決論理回路によって入力デ ータが決定されるので,多数決論理回路を追加したことによる速度オーバヘッドは発 生しない.



図 5.22 "1"の個数が7個, "0"の個数が9個の場合における多数決論理回路の動作波 形: (a)JL のシンクパスが1個, JL\_N のシンクパスが0個, (b)JL のシンクパスが4個, JL\_N のシンクパスが3個, (c)PVT 条件が最悪の場合におけるJL のシンクパスが4

図 5.23 に元の入力データを復元するための読出し回路を示す. EX-OR を用いるこ とにより、フラグビットの値と保持データから元の入力データを復元することができ る.

また、テストモード時において、TEST 信号と Flag\_test 信号を用いることにより、 メモリセルに保持されている値を読出すことができる.



図 5.23 元の入力データを復元するための読出し回路.

# 5.6 実測結果

図 5.24 に 90-nm CMOS プロセスを用いて試作を行った 68-kb SRAM TEG のチップ 写真およびレイアウトを示す.また,比較評価のために,従来の 64-kb SRAM TEG も 同一チップに搭載されている.

フラグビット,多数決論理回路,EX-OR による面積オーバヘッドは 7%である.また,電源電圧 1.0V におけるアクセスタイムの実測結果を図 5.25 アクセスタイムの 実測結果に示す.提案 SRAM および従来 SRAM のアクセスタイムは,それぞれ 3.32 ns および 3.19 ns である.提案 SRAM のアクセスタイムのオーバヘッドは読出し回路に



追加した MUX および EX-OR が原因である.

図 5.24 チップ写真およびレイアウト.



図 5.25 アクセスタイムの実測結果

図 5.26 にメモリセルのリーク電流の実測結果を示す. "1"を保持する場合,読出し ドライブトランジスタ N4 のゲートリーク,および RBL に流れるビット線リークを削 減することができるため, "0"を保持する場合と比較して, リーク電流を 36%削減する ことができる.よって、多数決論理回路および Reordering 処理を用いて、保持データの"1"の個数を増加させることにより、読出しビット線の充放電電力を削減するだけでなく、リーク電力も削減することができる.



図 5.26 メモリセル1個あたりにおけるリーク電流の実測結果.

図 5.27 に電源電圧 1.0V,動作周波数 100MHz における,読出しビット線の充放電 電力を示す. 10 種類の標準テスト動画像シーケンスにおいて,読出しビット線の充放 電電力を平均で 45%削減することを実測により確認した. 図 5.17,図 5.18 と比較し て消費電力削減効果が小さくなる理由を以下に示す.

- シミュレーションにおいて、"0"読出し時におけるフラグビットとデータビットの 充放電電力は同じであると仮定していたが、実際の回路では、読出し回路の EX-OR を駆動する必要があるため、"0"読出し時におけるフラグビットのビット線充放電 電力は、データビットのビット線充放電電力と比較して 1.6 倍大きくなる.
- 入力データの"0"と"1"の個数が同じ場合、シミュレーションではフラグビットの値を"1"になると仮定していたが、実際の回路では 5.5.3 で記述した通り、"1"になるとは限らない。



図 5.27 100MHz 動作時における読出しビット線電力削減効果の実測結果.

図 5.28 に電源電圧 1.0V,動作周波数 300MHz における,読出し動作時の全体電力 を示す. 提案 SRAM を用いることにより,読出し電力が 28%削減される.



# 5.7 結言

多数決論理と Reordering 処理を用いて,実時間動画像処理に利用される 8T 2-port SRAM の読出しビット線充放電電力を削減する手法の提案を行った.90nm プロセスを 用いて 68-kb SRAM を試作し実測することにより,提案手法を用いることで,読出し ビット線充放電電力を 45%削減し,読出し動作電力を 28%削減することを確認した. また,速度オーバヘッドおよび面積オーバヘッドは,それぞれ 4%,7%となった.

本提案手法は標準動作電圧時においても低消費電力化を実現することができるため、 プロセスの微細化が進み SRAM の低電圧動作が困難となる状況においても有効な手法 である.

また、実時間動画像処理のみでなく、実時間動画像認識においても本手法を適用することにより、SRAMの低消費電力化を実現することができると考えられる.

·
# 第6章 結論

本論文では、微細プロセスにおける SRAM の低消費電力化技術および高信頼化技術 の要素技術について詳述した.

#### 第3章 高信頼モードを有するディペンダブル SRAM

高信頼モードを有する 7T/14T ディペンダブル SRAM の提案を行った.提案した 7T/14T メモリセルは必要とされるメモリ容量,速度,信頼性に応じて,動的に3種類 のモード(通常動作モード,高速動作モード,高信頼動作モード)を切り替えることがで きる.メモリセルの面積オーバヘッドは追加するトランジスタが nMOS の場合 26%と なり, pMOS の場合は 11%となる.

モンテカルロシミュレーションの結果から, ビット不良率が 10<sup>-8</sup> となる点において, 読出し動作時および書込み動作時における最低動作電圧が, それぞれ 0.21V, 0.26V 改 善されることを確認した.提案した 7T/14T メモリセルは, 誤り訂正符号(ECC: Error Correction Code)および多重化(MMR: Multi Module Redundancy)と比較して, より低いビ ット不良率を実現することができる.また,提案した 7T/14T メモリセルを使用するこ とによる,速度オーバヘッド,電力オーバヘッドは発生しない.

さらに, 提案した 7T/14T メモリセルにおけるハーフセレクト問題を回避するための 新しいメモリセルアレイ構造の提案も行った. 65-nm プロセスを用いて 64-kb SRAM を試作し, その実測結果から, 14T メモリセルが 7T メモリセルよりも低いビット不良 率を実現することを確認した.

本手法を用いることにより、システム LSI において新しいメモリ割り当て方法が可能となる.また、ユーザが動作環境、必要な信頼性、速度、電源電圧、アプリケーションなどに応じて、動的に SRAM の性能を変化させることが可能となる.

#### 第4章 システマチックばらつきを補正する基板バイアス電圧制御技術

FD-SOI プロセスを用いた,システマチックばらつきを抑制することができる基板バ イアス電圧制御回路の提案を行った.提案した基板バイアス電圧制御回路は,システ マチックばらつきを自動的に検出し,補正することにより SRAM のメモリセルの動作 マージンを改善することができる.

0.15-um FD-SOI プロセスを用いて、486-kb SRAM を試作し、実測することにより、 動作下限電圧を 0.14V 改善し、0.46V で動作することを確認した.

本手法は、ランダムばらつきを抑制するデバイス構造、および第3章で提案した 7T/14T メモリセルと併せて用いることにより、システマチックばらつき、およびラン ダムばらつきの双方を抑制することが可能となる.

#### 第5章 動画像処理応用 2-port SRAM の低消費電力化技術

多数決論理と Reordering 処理を用いて,実時間動画像処理に利用される 8T 2-port SRAM の読出しビット線充放電電力を削減する手法の提案を行った.

90nm プロセスを用いて 68-kb SRAM を試作し実測することにより,提案手法を用いることで,読出しビット線充放電電力を 45%削減し,読出し動作電力を 28%削減することを確認した.また,速度オーバヘッドおよび面積オーバヘッドは,それぞれ 4%,7%となった.

本提案手法は標準動作電圧時においても低消費電力化を実現することができるため、 プロセスの微細化が進み SRAM の低電圧動作が困難となる状況においても有効な手法 である。

また,実時間動画像処理のみでなく,実時間動画像認識においても本手法を適用することにより,SRAMの低消費電力化を実現することができると考えられる.

以上,本論文では,微細プロセスにおける SRAM の低消費電力化および高信頼化を 実現するための要素技術について,回路設計技術からのアプローチとして,高信頼モ ードを有する 7T/14T メモリセルについて詳述した.プロセスと回路技術を組み合わせ た協調設計技術として, FD-SOI プロセスを用いた基板バイアス電圧制御手法について 詳述した.システム応用と回路技術を組み合わせた協調設計技術として, 隣接画素相 関性を利用した低消費電力動画像処理応用 2-port SRAM について詳述した.これらの 技術を用いることにより, 微細プロセスにおいて SRAM の低消費電力化および高信頼 化が実現可能となる.

## 謝辞

本論文は、筆者が神戸大学大学院情報知能学専攻プロセッサアーキテクチャ研究室 において行った研究成果をまとめたものである.

本研究の遂行に当たり、5年間、一貫して懇切なご指導とご鞭撻を賜った神戸大学 大学院工学研究科教授 吉本雅彦先生に甚大なる謝意を表します.豊富な発想・知識 により積極的でかつ適切なご指導を賜った神戸大学大学院工学研究科准教授 川口博先生に厚く謝意を申し述べます.

また,本論文及び本研究に対して貴重なご助言を賜った神戸大学大学院工学研究科 准教授 太田能先生,神戸大学大学院工学研究科准教授 永田真先生,神戸大学大学 院工学研究科教授 羅志偉先生,神戸大学大学院工学研究科教授 沼昌宏先生に深く 感謝の意を表します.

本研究に対して有益なご教示を賜った新居浩二博士,森田泰弘博士,宮越純一博士, 村地勇一郎博士,鈴木利一博士,鈴木弘明博士に厚く感謝の意を表します.

本研究に関して有益な討論を行い,また助言をいただいた川上健太郎博士, 金森美和子氏,竹村淳氏,野口紘希氏,黒田光彦氏,井口友輔氏,奥村俊介氏, 山口幸介氏,吉本秀輔氏に深く感謝の意を表します.

国際学会発表の際,英語のプレゼンテーションの指導をしていただいた月野光先生 に深く感謝の意を表します.

研究室配属から5年の間ともに研究室生活を過ごし,共に切磋琢磨できた竹内隆氏, 松田隆志氏に深く感謝いたします.

研究室配属から修士号取得までの3年間の研究生活をともに過ごした,青西孝文氏, 一圓真澄氏,長井健一氏,濱本真生氏,福山祐貴氏,山本亮氏に深く感謝いたします.

研究生活を共にし,多くのご助言とご協力をいただいた,峯岸孝行博士, 三上真司博士,Augusto Foronda 博士,松野哲郎氏,芳野宏徳氏,飯沼隆弘氏, 石原朋和氏,印芳氏,祇園昭宏氏,黒田光彦氏,樋口雄飛氏,吉野圭一氏, 和泉慎太郎氏,大竹優氏,坂田義典氏,高橋巧至氏,矢倉健一郎氏,李赫鍾氏, 李将充氏,上農哲也氏,小西恵大氏,谷純一氏,鶴田嵩氏,中田洋平氏,三浦和夫氏, 水野孝祐氏,酒井康晴氏,岡顕久氏,藤永剛史氏,嶋井優介氏,高木智也氏, 竹内幸大氏,何光霽氏に深く感謝いたします.

学部4回生の8月から12月の4ヶ月間,金沢大学集積回路システム研究室でお世話 になり、貴重な経験をさせていただいた、黒田雄樹氏、片桐忠義氏、浜野康司氏に深 く感謝いたします.

また,研究生活のお世話をしていただいた泉由里絵氏,呉恵美氏に深く感謝いたします.

2008 年 1 月から 2008 年 3 月の 3 ヶ月間, Takumi B.V., Eindhoven, Netherlands におけ るインターンシッププログラムでお世話になり,生涯忘れることのできない経験をさ せていただいた後藤彬文氏,馬場健志氏,川西宏博士, Maarten Berkens 氏, Marjolein Hilgers 氏, Kevin Haens 氏, Michiel Oostindie 氏, Mark Scheffer 氏, Simon Klaver 氏, Ekaterina Viatkina 氏, Elena Bortnik 氏, Frank Driessen 氏, Rene Beugels 氏,北川恭資氏,倉本聡氏,中島望氏,柴田有紀子氏,川上研一氏, 柳澤伸氏, Elias Ahmed 氏に深く感謝の意を表します.

大学1回生から8年間,神戸大学柔道部においてご指導を賜った,神戸大学柔道部総監督 貴島徹先生,神戸大学発達科学部教授 岡田修一先生,神戸大学医学部教授 千原和夫先生,神戸大学柔道部コーチ 松雪博先生,豊学館佐伯道場館長 佐伯太郎先生に深く感謝の意を表します.

同期として神戸大学柔道部において入部し、大学1回生から4年間楽しい時間を共 にし、切磋琢磨することができた近藤正樹氏,亀山智史氏,小山昭洋氏,高見直樹氏, 岡向恵美氏に感謝いたします.また,神戸大学柔道部においてご指導,ご支援いただ いた先輩方,後輩の皆様に深く感謝いたします.

本論文の第4章の研究内容は科学研究費補助金(20360161)の協力の下に行われた研 究成果の一部です.また,LSI チップ試作は沖電気工業株式会社の協力で行われたも のです.研究の技術的支援に関して,沖電気工業株式会社の谷幸一氏に感謝いたしま す.

本論文の第5章でのLSI チップ試作は東京大学大規模集積システム設計教育研究センター(VDEC)を通し,株式会社半導体理工学研究センター,富士通株式会社,松下電器産業株式会社,NEC エレクトロニクス株式会社,株式会社ルネサステクノロジ,株式会社東芝の協力で行われたものです.

試作チップの評価に関して,京都大学情報学研究科准教授

98

学情報学研究科助教 土谷亮先生,ならびに京都大学 VDEC サブセンターに感謝いた します.

研究生活において奨学金の支給をしていただいた財団法人 井植記念会, 奨学金の 貸与をしていただいた財団法人 日本学生支援機構に深く感謝いたします.

神戸大学大学院工学研究科プロセッサアーキテクチャ研究室に在籍していた 5 年間, 暖かく支えていただいた林佐知世氏に深く感謝いたします.

最後に,丈夫な体に生んでくれた両親,これまで支えてくれた兄弟に感謝いたしま す.

# 参考文献

- ITRS, "International Technology Roadmap for Semiconductors," 2003. [Online]. Available: http://www.itrs.net/Common/2003ITRS/ Home2003.htm.
- [2] E. Seevinck, F. J. List, and J. Lohstroh, "Static-Noise Margin Analysis of MOS SRAM Cells," IEEE J. Solid-State Circuits, vol. 22, no. 5, pp. 748-754, October 1987.
- [3] E. Grossar, M. Stucchi, K Maex, and W. Dehaene, "Statically Aware SRAM Memory Array Design," 7th Int. Symposium on Quality Electronic Design (ISQED 2006), pp. 25-30, March 2006.
- [4] P. A. Stolk, F. P. Widdershoven, and D. B. M. Klaassen, "Modeling Statistical Dopant Fluctuations in MOS Transistors," IEEE Trans. Electron Devices, vol. 45, no. 9, pp. 1960-1971, Sep. 1998.
- [5] M. J. M. Pelgrom, A. C. J. Duinmaijer, and A. P. G. Welbers, "Matching Properties of MOS Transistors," IEEE J. Solid-State Circuits, vol. 24, no. 5, pp. 1433-1440, Oct. 1989.
- [6] A. Bellaouar, A. Fridi, M. I. Elmasry, and K. Itoh, "Supply voltage scaling for temperature-insensitive CMOS circuit operation," IEEE Trans. Circuits Syst., vol. 45, pp. 415-417, Mar. 1998.
- [7] K. Kanda, K. Nose, H. Kawaguchi, T. Sakurai, "Design Impact of Positive Temperature Dependence on Drain Current in Sub-1-V CMOS VLSIs," IEEE J, Solid-State Circuits, vol. 36, no. 10, Oct. 2001.
- [8] V. Huard and M. Denais, "Hole Trapping Effect on Methodology for DC and AC Negative Bias Temperure Instability Measurements in pMOS Transistors," Proc. IEEE IRPS 2004, pp. 40-45, Apr. 2004.
- [9] M. Ball, J. Rosal, R. McKee, WK Loh, T. Houston, R. Garcia, J. Raval, D. Li, R. Hollingsworth, R. Gury, R. Eklund, J. Vaccani, B. Castellano, F. Piacibello, S. Ashburn, A. Tsao, A. Krishnan, J. Ondrusek, and T. Anderson, "A Screening Methodology for VMIN Drift in SRAM Arrays with Application to Sub-65nm Nodes," IEDM 2006, Dec. 2006.
- [10] A. T. Krishnan, V. Reddy, D. Aldrich, J. Raval, K. Christensen, J. Rosal, C. O'Brien, R. Khamankar, A. Marshall, W-K. Loh, R. McKee, and S. Krishnan, "SRAM Cell Static

Noise Margin and VMIN Sensitivity to Transistor Degradation," IEDM 2006, Dec. 2006.

- [11] H. Pilo, J. Barwin, G. Braceras, C. Browning, S. Burns, J. Gabric, S. Lamphier, M. Miller,
   A. Roberts, F. Towler, "An SRAM Design in 65nm and 45nm Technology Nodes
   Featuring Read and Write-Assist Circuits to Expand Operating Voltage," 2006
   Symposium on VLSI Circuits Digest of Technical Papers, pp. 15-16, June 2006.
- [12] N. Verma, A. P. Chandrakasan, "A 65nm 8T Sub-Vt SRAM Employing Sense-Amplifier Redundancy," ISSCC 2007 Digest of Technical Paper, pp. 328-329, Febrary 2007.
- [13] T. H. Kim, J. Liu, J. Keane, C. H. Kim, "A High-Density Subthreshold SRAM with Data-Independent Bitline Leakage and Virtural Ground Replica Scheme," ISSCC 2007 Digest of Technical Papers, pp. 330-331, Febrary 2007.
- [14] I. J. Chang, J. J. Kim, S. P. Park, and K. Roy, "A 32kb 10T Subthreshold SRAM Array with Bit-Interleaving and Differential Read Scheme in 90nm CMOS," ISSCC 2008 Digest of Technical Papers, pp. 398-300, Febrary 2008.
- [15] M. Yamaoka, N. Maeda, Y. Shinozaki, Y. Shimazaki, K. Nii, S. Shimada, K. Yanagisawa, And T. Kawahara, "90-nm process-variation adaptive embedded SRAM modules with power-line-floating write technique," IEEE J. Solid-State Circuits, vol. 41. no. 3, pp. 705-711, March 2006.
- [16] Y. Morita, H. Fujiwara, H. Noguchi, K. Kawakami, J. Miyakoshi, S. Mikami, K. Nii, H. Kawaguchi, and M. Yoshimoto, "A Vth-Variation-Tolerant SRAM with 0.3-V Minimum Operation Voltage for Memory-Rich SoC under DVS Environment," 2006 Symposium on VLSI Circuits Digest of Technical Papers, pp. 16-17, June 2006.
- [17] K. Kawakami, J. Takemura, M. Kuroda, H. Kawaguhi, and M. Yoshimoto, "A 50% Power Reduction in H.264/AVC HDTV Video Decoder LSI by Dynamic Voltage Scaling in Elastic Pipeline," IEICE Trans. Fundamentals, vol. E89-A, no. 12, pp. 3642-3651, December 2006.
- [18] K. Nii, Y. Tsukamoto, T. Yoshizawa, S. Imaoka, Y. Yamagami, T. Suzuki, A. Shibayama,
  H. Makino, and S. Iwade, "A 90-nm low-power 32-kB embedded SRAM with gate leakage suppression circit for mobile applications," IEEE J. Solid-State Circuits, vol. 39. no. 4, pp. 684-693, April 2004.
- [19] T. Suzuki, Y. Yamagami, I. Hatanaka, A. Shibayama, H. Akamatsu, and H. Yamauchi, "A

Sub-0.5-V Operating Embedded SRAM Featuring a Multi-Bit-Error-Immune Hidden-ECC Scheme," IEEE J. Solid-State Circuits, vol. 41. no. 1, pp. 152-160, January 2006.

- [20] K. Osada, Y. Saitoh, E. Ibe, and K. Ishibashi, "16.7 fA/cell tunnel-leakage-suppressed 16 Mb SRAM for handling cosmic-ray-induced multi-errors," IEEE J. Solid-State Circuits, vol. 38, no. 11, pp. 1952-1957, Novenber 2003.
- [21] J. Maiz, S. Hareland, K. Zhang, and P. Armstrong, "Charactrization of Multi-bit Soft Error Events in Advanced SRAMs," IEDM 2003 Digest of Technical Papers, pp. 519-522, December 2003.
- [22] J. F. Wakerly, "Microcomputer Reliability Improvement Using Triple-Modular Redundancy," Proceedings of the IEEE, vol. 64, no. 6, pp. 889-895, June 1976.
- [23] C-H. Chen, and A. K. Somani, "Fault-Containment in Cache Memories for TMR Redundant Processor Systems," IEEE Trans. on Computers, vol. 48, no. 4, pp. 386-397, April 1999.
- [24] H. Yamauchi, T. Suzuki, and Y. Yamagami, "A 1R/1W SRAM Cell Design to Keep Cell Current and Area Saving against Simultaneous Read/Write Disturbed Accesses," IEICE Trans. Electronics, vol. E90-C, no. 4, pp. 749-757, April 2007.
- [25] S. Mukhopadhyay, K. Kim, H. Mahmoodi, A. Datta, D. Park, and K. Roy, "Self-Repairing SRAM for Reducing Parametric Failures in Nanoscaled Memory," Digest of Technical Papers of Symposium on VLSI Circuits, pp. 132-133, July, 2006.
- [26] M. Yamaoka, R. Tsuchiya, and T. Kawahara, "SRAM Circuits with Expanded Operating Margin and Reduced Stand by Leakage Curret Using Thin-BOX FD-SOI Transistors", IEEE Journal of Solid-State Circuits, Vol. 41, No. 11, pp.2366-2372, November, 2006.
- [27] M.Yamaoka, N.Shinozaki, Y.Shimazaki, K.Nii, S.Shimada, K.Yanagisawa, Y.Kawahara, "90-nm process-variation adaptive embedded SRAM modules with power-line-floating write technique", IEEE Journal of Solid-State Circuits, Vol. 41, No. 3, pp.705-711, March, 2006.
- [28] 吉見信, "SOI デバイス技術-実践的基礎と応用-,"ED リサーチ社, 2005 年 1 月 25 日.
- [29] T. Sakurai, A. Matsuzawa and T. Douseki, "Fully-Depleted SOI CMOS Circuits and

Technology for Ultralow-Power Applications," Spriger-Verlag New York Inc., June, 2006.

- [30] M. Yamaoka, K. Osada, R. Tsuchiya, M. Horiuchi, S. Kimura and T. Kawahara, "Low power SRAM Menu for SoC Aplication Using Yin-Yang-Feedback Memory Cell Technology," IEEE Symp. VLSI Circuits Dig. Tech. Papers, pp. 288-291, June 2004.
- [31] S.Sundareswaran, J.A.Abraham, A.Ardelea, R.Panda,," Characterization of Standard Cells for Intra-Cell Mismatch Variations", Quality Electronic Design, 2008. ISQED 2008. 9th International Symposium on, pp.213-219, March, 2008.
- [32] M. Fujiwara, T.Morooka, N.Yasutake, K.Ohuchi, N.Aoki, H.Tanimoto, M.Kondo, K.Miyano, S.Inaba, K.Ishimaru, H.Ishiuchi, "Impact of BOX scaling on 30 nm gate length FD SOI MOSFET", SOI Conference, 2005. Proceedings. 2005 IEEE International, pp.180-182, October, 2005.
- [33] T.Ohtou, N.Sugii, T.Hiramoto, "Impact of Parameter Variations and Random Dopant Fluctuations on Short-Channel Fully Depleted SOI MOSFETs With Extremely Thin BOX", Electron Device Letters, IEEE, Vol.28,No.8, pp.740-742,August,2007.
- [34] J. Miyakoshi, Y. Murachi, K. Hamano, T. Matsuno, M. Miyama, and M. Yoshimoto, "A Low-Power Systolic Array Architecture for Block-Matching Motion Estimation," IEICE Trans. Electronics, vol. E88-C, No. 4, pp. 559-569, Apr. 2005.
- [35] Y. Murachi, K. Hamano, T. Matsuno, J. Miyakoshi, M. Miyama, and M. Yoshimoto, "A 95 mW MPEG2 MP@HL Motion Estimation Processor Core for Portable High-Resolution Video Application," IEICE Trans. Fundamentals, vol. E88-A, no. 12, pp. 3492-3499, Dec. 2005.
- [36] S. Ishiwata, T. Yamakage, Y. Tsuboi, T. Shimazawa, T. Kitazawa, S. Michinaka, K. Yahagi, A. Oue, T. Kodama, N. Matsumoto, T. Kamei, M. Saito, T. Miyamori, G. Ootomo, and M. Matsui, "A Single-Chip MPEG-2 Codec Based on Customizable Media Embedded Processor," IEEE J. Solid-State Circuits, vol. 38, no. 3, pp. 530-540, Mar. 2003.
- [37] Y-W. Huang, T-C. Chen, C-H.Tsai, C-Y. Chen, T-W. Chen, C-S. Chen, C-F. Shen, S-Y. Ma, T-C. Wang, B-Y. Hsieh, H-C. Fang, and L-G. Chen, "A 1.3TOPS H.264/AVC Single-Chip Encoder for HDTV Applications," IEEE Int. Solid-State Circuits Conf., pp. 128-129, Jan. 2005.
- [38] K. Takeda, Y. Hagihara, Y. Aimoto, M. Nomura, Y. Nakazawa, T. Ishii, and H. Kobatake,

"A Read-Static-Noise-Margin-Free SRAM Cell for Low-Vdd and High-Speed Applications," IEEE J. Solid-State Circuits, vol. 41, no. 1, pp. 113-121, Jan. 2006.

- [39] J. Pille, C. Adams, T. Christensen, S. Cottier, S. Ehrenreich, F. Kono, D. Nelson, O. Takahashi, S. Tokito, O. Torreiter, O. Wagner, D. Wendel, "Implementation of the CELL Broadband Engine in a 65nm SOI Technology Featuring Dual-Supply SRAM Arrays Supporting 6 GHz at 1.3V," IEEE Intl. Solid-State Circuits Conf., pp. 322-323, Feb. 2007.
- [40] M. R. Stan, and W. P. Burleson, "Bus-Invert Coding for Low Power I/O," IEEE Trans. VLSI Systems, vol. 3, no. 1, pp. 49-58, Mar. 1995.
- [41] Y. Shin, and K. Choi, "Narrow Bus Encoding for Low Power Systems," Asia and South Pacific Design Automation Conf., pp.217-220, Jan. 2000.

# 著者の研究業績目録

## A.学会誌論文 (筆頭論文, 査読有)

- H. Fujiwara, K. Nii, H. Noguchi, J. Miyakoshi, Y. Murachi, Y. Morita, H. Kawaguchi, and M. Yoshimoto, "Novel Video Memory Reduces 45% of Bitline Power using Majority Logic and Data-Bit Reordering," IEEE Transactions on Very Large Scale Integration (VLSI) Systems, vol. 16, no. 6, pp. 620-627, June 2008.
- H. Fujiwara, S. Okumura, Y. Iguchi, H. Noguchi, H. Kawaguchi, and M. Yoshimoto, "A Dependable SRAM with 7T/14T Memory Cells," IEICE Trans. Electoron, April 2009.

### B. 国際会議(筆頭論文, 査読有)

- H. Fujiwara, S. Okumura, Y. Iguchi, H. Noguchi, Y. Morita, H. Kawaguchi, and M. Yoshimoto, "Quality of a Bit (QoB): A New Concept in Dependable SRAM," 9th International Symposium on Quality Electronic Design (ISQED 2008), San Jose, California, pp. 98-102, USA, March 2008.
- H. Fujiwara, S. Okumura, Y. Iguchi, H. Noguchi, H. Kawaguchi, and M. Yoshimoto, "A 7T/14T Dependable SRAM and Its Array Structure to Avoid Half Selection," International Conference on VLSI Design 2009, New Delhi, India, pp. 295-300, Jan. 2009.
- H. Fujiwara, T. Takeuchi, Y. Otake, M. Yoshimoto, and H. Kawaguchi, "An Inter-Die Variability Compensation Scheme for 0.42-V 486-kb FD-SOI SRAM using Substrate Control," 2008 IEEE International SOI Conference, pp. 93-94, New Paltz, New York, USA, Oct. 2008.
- H. Fujiwara, K. Nii, J. Miyakoshi, Y. Murachi, Y. Morita, H. Kawaguchi, and M. Yoshimoto, "A Two-Port SRAM for Real-Time Video Processor Saving 53% of Bitline Power with Majority Logic and Data-Bit Reordering," International Symposium on Low Power Electronics and Design (ISLPED), pp.61-66, Tegernsee, Germany, Oct. 2006.

### C.本研究に関するその他の発表(査読無)

- 藤原英弘,奥村俊介,井口友輔,野口紘希,川口博,吉本雅彦,"7T/14T ディペン ダブル SRAM およびそのセル配置構造,"電子情報通信学会総合大会,2009 年 3 月.
- 奥村俊介,藤原英弘,井口友輔,野口紘希,森田泰弘,川口博,吉本雅彦,"高信 頼性モードと高速アクセスモードを有するディペンダブル SRAM,"システム LSI 設計技術(SLDM)研究報告,2008-SLDM-135, Vol.2008 No.38, pp.67-72,電子情報 通信学会技術研究報告,VLD2008-12, pp.31-36,2008 年 5 月.
- 3. 山口幸介,藤原英弘,竹内隆,大竹優,吉本雅彦,川口博,"システマチックばら つき補正機能を有する基板バイアス電圧制御を用いた 0.42V 動作 486-kb FD-SOI SRAM,"電子情報通信学会技術研究報告,2008 年 12 月.
- 4. 藤原英弘,新居浩二,野口紘希,宮越純一,村地勇一郎,森田泰弘,川口博,吉本雅彦,"ビット線の電力を削減する実時間動画像処理応用 2-port SRAM,"電子 情報通信学会技術研究報告, ICD2007-7, Vol.107, No.1, pp.35-40, 2007 年 4 月.
- 藤原英弘,新居浩二,宮越純一,村地勇一郎,森田泰弘,川口博,吉本雅彦,"ビット線電力を 53%削減できる実時間動画像処理応用 2 ポート SRAM,"第10 回システム LSI ワークショップ ポスタセッション, pp.223-226, 2006 年11 月.
- 藤原英弘,新居浩二,野口紘希,宮越純一,村地勇一郎,森田泰弘,川口博,吉本雅彦,"ビット線充放電電力を53%削減する動画像処理応用2-port SRAM,"2006 電子情報通信学会ソサイエティ大会講演論文集,C-12-42, p.103, 2006年9月.

### D.本研究に関する特許出願

- 吉本雅彦,川口博,藤原英弘,奥村俊介,"半導体メモリのハーフセレクト防止セル配置,"特願 2009-000012(2009 年 1 月 4 日出願).
- 吉本雅彦,川口博,藤原英弘,奥村俊介,"半導体メモリおよびプログラム,"特 願 2008-000357(2008 年 1 月 7 日出願).
- 藤原英弘, 宮越純一, 村地勇一郎, 川口博, 吉本雅彦, 新居浩二, "半導体装置,"
   特願 2006-237637(2006 年 9 月 1 日出願).