31
1 信頼性維持の低コスト化を実現する 信頼性維持の低コスト化を実現する ディペンダブル ディペンダブル LSI LSI 技術 技術 200 200 12 12 日本電気㈱ 日本電気㈱ デバイスプラットフォーム研究所 デバイスプラットフォーム研究所 水野 水野 正之 正之 E E - - mail: mail: m m - - [email protected] [email protected] JST JST - - CREST CREST 研究領域 研究領域 ディペンダブル ディペンダブル VLSI VLSI システムの基盤技術 システムの基盤技術 平成 平成 19 19 年度ワークショップ 年度ワークショップ

System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

1

信頼性維持の低コスト化を実現する信頼性維持の低コスト化を実現する

ディペンダブルディペンダブルLSILSI技術技術

20020077年年1212月月11日日

日本電気㈱日本電気㈱デバイスプラットフォーム研究所デバイスプラットフォーム研究所

水野水野 正之正之EE--mail: mail: [email protected]@bc.jp.nec.com

JSTJST--CRESTCREST研究領域研究領域『『ディペンダブルディペンダブルVLSIVLSIシステムの基盤技術システムの基盤技術』』平成平成1919年度ワークショップ年度ワークショップ

Page 2: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

2

半導

体市

場規

PC

インターネット携帯端末

デジタル民生 「安全」

「安心」「健康」

さらに、「楽しさ」を提供「便利さ」を提供

LSIの故障は、安心・安全・健康に直接影響を与える

LSILSI市場のトレンド市場のトレンド

より生活に密着した“人を補佐・支援する”市場が拡大

人を補佐・支援

さらに、「安心・安全・健康」を提供

Page 3: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

3

LSILSI技術の技術のトレンドトレンド微細化、大規模化により、

市場での不良率が増加傾向 (→ 信頼性維持が高コスト化)

欠陥原因の多様化、バラツキ増大

LSIの大規模化100

ゲー

ト数

(100万

個)

08 10 12 1404 060

25

50

75

年Ref. NEDO

100200

400

1000(=0.1%)

102040

607080859095

100

8050

85 90 100テストし尽せる割合(%)

(一定コスト内で実現できるテストの網羅率)

製造

工程

での

不良

率(歩

留ま

り)(%)

市場での不良品率(ppm)

トランジスタ

配線微小ゴミ微小ゴミ

ストレスストレスでこぼこでこぼこ

原子位置バラツキ

原子位置バラツキ

テスト困難

不良

増加

Page 4: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

4

好き勝手に何でもソフトを追加してしまうと...

一方、ソフトの追加を制限してしまうと...

ウィルスまで混入して、ハングアップしちゃた...

私は新しい機能が使いたいのに...

ウィルスウィルスウィルス再インストール再インストール

インターネット

自由なインストールの制限自由なインストールの制限

インターネット

皆が使うソフト以外はダメ!

パソコンに例えると...※ ソフト=アプリケーションソフトウェア

外部環境の外部環境のトレンドトレンド高性能化・オープン化の進展により多機能化と安全性の両立が困難

020406080100120140160180200

08.2

004

12.2

004

04.2

005

08.2

005

12.2

005

04.2

006

08.2

006

12.2

006

モバイルウィルス変異数(*)

(*) Source: Gostev, A. “Mobile Malware Evolution: An Overview” & “Kaspersky Security Bulletin 2006: Mobile malware”

急速

な増

Page 5: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

5

ディペンダブルLSIを実現するために

DFY(Design for yield)

補正

構造の単純化

幅を広げる

自己修復設計 製造テスト &

バリデーション

つくらないつくらない

ださないださない

へこたれないへこたれない

DFM(Design for

manufacturability)

研究開発領域は

この方向に拡大

出荷

DFT(Design fortestability) BIST

Scan

ECC andRedundancyfor memory

不良品を

不良品を本日御紹介する技術

②③

Page 6: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

6

①①装置、セット品の動作マージンを知る技術装置、セット品の動作マージンを知る技術

温度や電源電圧を変えるなどの温度や電源電圧を変えるなどの

従来従来のバーイン検査ではのバーイン検査では到達できない到達できない品質保証を実現品質保証を実現

Shunichi Kaeriyama, Mikihiro Kajita, Masayuki Mizuno, “A 1-to-2GHz 4-Phase On-Chip Clock Generator with Timing-Margin Test Capability, ” ISSCC2007 digest of technical papers, pp. 174-175.

ださないださない

Page 7: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

7

同期回路

同期回路

演算回路

クロック

データ出力

データ入力 この時間までにデータ

が届かないといけない

演算回路の遅延 マージン

実際のLSIでは,ノイズなどの影響で演算回路の遅延がばらつく.

→遅延ばらつきを見越した適切なマージンの→遅延ばらつきを見越した適切なマージンの設定が高性能なLSI設計の鍵設定が高性能なLSI設計の鍵

電源ノイズ

温度変動

データ

クロック

データ入力

データ出力 データ

LSILSIの動作マージンとはの動作マージンとは??演算回路遅延がクロック信号の発振周期に

くらべてどれだけ速いか

←スタート

Page 8: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

8

遅延

のば

らつ

LSI 小加工寸法

クロックジッタ

電源電圧変動

配線インダクタンス

プロセスばらつき

電源電圧変動

0 50 100 150 200 250 300 350–0.4

–0.2

0.0

0.2

0.4

0.6

アンダーシュート

0.25um 0.18um 0.10um

実際のLSI実際のLSIのばらつきの大きさのばらつきの大きさ

CADシミュレート可能範囲CADシミュレート可能範囲

プロセス微細化・プロセス微細化・チップ大規模化にチップ大規模化に伴いギャップ拡大伴いギャップ拡大

従来の従来のシミュレーションだけではシミュレーションだけでは

遅延ばらつきを遅延ばらつきを正確に予測できない正確に予測できない

クロストーク

動作マージンの設計時予測の困難性動作マージンの設計時予測の困難性

微細化・大規模化により益々困難に

動作環境・実行プログラムに依存

Page 9: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

9

Core1

Core2

クロックジッタ生成回路クロックジッタ生成回路

動作マージン観測用クロックジッタ生成技術動作マージン観測用クロックジッタ生成技術LSI内コア間やLSI間の通信に影響を与えることなく

LSI動作中に、クロック信号にジッタを入れる

Core1Core1ももCore2Core2もも同じ時間で同じ時間で

55サイクル分動作サイクル分動作

マージン測定が可能なマージン測定が可能な発振周波数が高いクロック信号発振周波数が高いクロック信号

同期を維持する同期を維持する発振周波数が低いクロック信号発振周波数が低いクロック信号

長い時間レンジで見るとCore1とCore2の発振周波数は同じ長い時間レンジで見るとCore1とCore2の発振周波数は同じ

短い時間レンジで見ると発振周波数が変わったように見える短い時間レンジで見ると発振周波数が変わったように見える

Page 10: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

10

8

Registers

Phase codes

0°edge

180°

90°

270°

OUT0/180

OUT90/270

7

EdgeInterleaver

Phaseshifter

Phaseshifter

Phaseshifter

Phaseshifter

MU

X

8-ph

ase

cloc

k ge

n.IN0/180

IN90/270

EnablesDouble edgetiming control

Calculates properclock edge timings

Controller logicM

UX

(Optional)

クロックジッタ生成回路のブロック図クロックジッタ生成回路のブロック図

Page 11: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

11

製造プロセス

電源電圧

消費電力

回路面積

入力クロック

90nm CMOS

1.2 [V]

40 [mW]

300[μm]×128[μm]

1.5GHz 4相

出力クロック 1GHz から 2GHz 4相

テストチップテストチップ

入力クロック信号(発振周波数は一定)

出力クロック信号(入力クロック信号を変えなくても,このような信号を出力可能)

動作マージン観測用クロックジッタ生成回路

動作マージン観測用クロックジッタ生成回路

Page 12: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

12

T ≅ 760 ps

T ≅ 950 ps

動作マージン測定のための周期が短いクロック信号

同期を維持する発振周波数の低いクロック信号

テストチップの出力信号波形テストチップの出力信号波形1.25GHzのクロック信号にジッタを導入した結果

Page 13: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

13

Output Clock Period [ns]

Jitte

r Am

plitu

de [p

s]

0

10

20

30

40

0.5 0.6 0.7 0.8 0.9 1

Jitter is mainly due to phase shifter nonlinearity and BW limitations.

-12-8-4048

12

0 64 128Phase Code

Tim

ing

Err

or [p

s]RJ <1 ps rms

Measured jitter vs. clock period(Generating 1G~2GHz from 1.5-GHz input)

Phase shifterlinearity error

Period jitter (DJ, p-p)Timing jitter (DJ, p-p)

Input clockT=666.7ps

11 ps p-p

Jitter due toBW limitations

出力クロック信号の性能出力クロック信号の性能

Page 14: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

14

今回開発した技術がもたらす価値今回開発した技術がもたらす価値

観測機会の拡大

観測精度の向上

物理を見切る

これまでのこれまでの観測技術観測技術

動作マージン観測との協調技術

大多数の中での少数の価値の追求(顧客サイトでの観測)

品質を見切る品質を見切る(LSI(LSI動作品質動作品質

を把握を把握))(これまでの

直接観測不能だった)

・低コスト品質検査の実現・欠陥チップゼロの実現

設計 製造 テスト&バリデーション

((TakamiyaTakamiya et. al.,et. al.,VLSI VLSI sympsymp.. 2004)2004)

(Nose et. al.,(Nose et. al.,ISSCCISSCC 2006)2006)

大きな動きの中での小さな動きの価値の追従

(ディジタル世界でのアナログ的理解)

Page 15: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

15

②② 経年変化による故障を事前検知、経年変化による故障を事前検知、

ロジックに冗長を導入し故障を回避ロジックに冗長を導入し故障を回避する技術する技術

Toru Nakura, Koichi Nose, Masayuki Mizuno, “Fine-Grain Redundant Logic Using Defect-Prediction Flip-Flops, ” ISSCC2007 digest of technical papers, pp. 402-403.

へこたれないへこたれない

Page 16: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

16

従来の「へこたれない」技術従来の「へこたれない」技術

信頼性維持に多くの冗長回路が必要(高コスト化)

MPU1 多数決・故障検出

故障検出

2重化 4重化

2倍以上

複数不良補償

継続正常動作

不良箇所特定

× ○ ○

△(2個目でNG)×(故障検知のみ可能)

面積

×

3倍以上 4倍以上

× ×

MPU2

MPU3

MPU4

出力

入力

MPU1

故障検出

MPU2

MPU3

出力入力

MPU1

故障検出

MPU2

出力入力

多数決・故障検出

故障検出

3重化

構成

出力

消費電力 2倍以上 3倍以上 4倍以上

多数決による故障検知は高コスト多数決による故障検知は高コスト

△(3個目でNG)

Page 17: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

17

不良を予知する技術不良を予知する技術 の御紹介の御紹介

不良による遅延時間増加に着目し、『そろそろ危ない』を知る

(a):誤動作となるリミット(b):たとえば5分前チャイムに相当→ (a)と(b)で2度、演算信号を観測し結果を比較

結果が異なると「そろそろ危ない」と判断

回路の遅延時間

要求性能

実使

用時

そろそろ危ない

実使用時間

同期回路

同期回路

演算終了時間が徐々に遅くなる

クロック信号

演算信号

不良が序所に拡大する

(a)(b)

クロック信号

演算信号

演算終了演算開始

演算回路

故障

Page 18: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

18

dela

y

QmQs

W

DmDs

M/S

sSW

LcDC

Q

LaDC

QLb

DC

Q

LdDC

QScanIn

CLK

a) system FF c) warning generation

d) main-sub state keeper/scan

b) delay for prediction

ScanEn

故障の事前検知可能FFの回路図故障の事前検知可能FFの回路図

Page 19: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

19

細粒度分割・予測・切替細粒度分割・予測・切替

FF FFFFFF

故障の無いブロックでは、サブブロックは動作停止→ 無駄な動作電力を消費しない

② c1に故障があるとc2の動作開始③ c2からデータを得るように切り替え

③②

① 故障事前検知可能FF

a1a1

細粒度main/sub“set”

b1b1 c1c1 d1d1 e1e1

a2a2 b2b2 c2c2 d2d2 e2e2

Page 20: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

20

実際の回路の分割方法実際の回路の分割方法故障事前検知可能FF(例えば下記の星印)に

演算結果を入力する演算回路群を分割単位とする

M

M

MS

MainSub

MS

M

MS

LSI

分割単位

故障事前検知可能FF

演算回路

Page 21: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

21

テストチップによる動作検証テストチップによる動作検証

動作中に2箇所が故障しても正常動作&場所特定

0 100 200 300時間 [ns]

CLK

故障なし(正解)

故障あり冗長使用

故障あり冗長未使用

(御参照)

同じ

0 1時間 [us]

0.5

異なる

CLK動作モード波形

スキャンチェーンから得られる故障箇所情報

故障発生! 正常動作

エラー

Page 22: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

22

・故障の事前通知機能の実現・無駄な電力増なしで高信頼を実現

今回の技術が提供する価値今回の技術が提供する価値

要素

技術

対処レベル検出 訂正 修復

処理

の階

ソフトウェア

方式

回路パリティチェック

N重化

不良予知

ECC

仮想化

ウォッチドッグタイマ

Tr. レプリカモニター

マルチコア

不良が起こる前に予知

データマイニング

適材適所に要素技術を組み合わせることで低コスト・低電力に、ディペンダブルを実現

Page 23: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

23

③③ CPUCPUの動的な振り分けによりの動的な振り分けにより

セキュアなシステムを実現する技術セキュアなシステムを実現する技術

Hiroaki Inoue, Akihisa Ikeno, Tsuyoshi Abe, Junji Sakai, and Masato Edahiro, “Dynamic Security Domain Scaling on Symmetric Multiprocessors for Future High-End Embedded Systems, ”CODES+ISSS 2007.

へこたれないへこたれない

Page 24: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

24

(1) App.-level (3) CPU-level(2) OS-level

CPU CPU CPU

OS

Opendomain

App.App.

App.

App.

Base domain

Separation

App.

CPU CPU CPUVirtualization SW

Opendomain

App.App.

App.

App.

Base domain

Separation

App.

OS OS

CPU CPU CPU

OS OS

App.App.

App.

Opendomain

Base domain

Separation

App.

App.

2種類のアプリ実行での従来技術とその課題2種類のアプリ実行での従来技術とその課題多機能化と安全性の両立は困難

多機能化(演算性能)

安全性

Page 25: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

25

注目技術

低電力技術「CPUホットプラグ技術」

CPU#0

アプリ

CPU#1 CPU#2 CPU#3

アプリ アプリ

基本ソフト群

CPU#0

アプリ

CPU#1 CPU#2 CPU#3

アプリ アプリ基本

ソフト群

CPU削除処理

CPU#0

アプリ

CPU#1 CPU#2 CPU#3

アプリ アプリ

基本ソフト群CPU#3を低電力モードへ

CPU追加処理

クロック停止

OS

OS

OS

Page 26: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

26

解決技術

コンテキスト処理をCPUホットプラグに追加CPUホットプラグ処理の修正フロー

動的制御?

コンテキスト保存

新しいドメイン起動

Yes No

クロック停止(従来フロー)

“CPU Hot Remove”処理

“CPU Hot Add”処理

SMP OS

基本ソフト群

APAP

CPU#3CPU#2CPU#1CPU#0

SMP OS

基本ソフト群

APAP

CPU#3CPU#2CPU#1CPU#0

AMP OS

追加ソフト群

AP

SMP OS

基本ソフト群

APAP

CPU#3CPU#2CPU#1CPU#0

Page 27: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

27

評価環境

ARM MPCoreを用いた基本実証

レイアウト

テストチップ

MPCore

CPU#0

CPU#1

CPU#2

CPU#3

評価ボード

SoC MPCore (MP11 x 4) @ 130nm

Cache I$:32KB, D$:32KB per CPU

Freq. ARM: 240MHz, Bus: 35MHz

Page 28: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

28

非仮想化Linux

今回の技術

従来仮想化技術

SMP Linux SMP Linux

OS システムコール

(a) Process (b) Context switch

基本ドメイン

プロセスプロセス

基本ドメイン

LMbench: OS性能ベンチマーク

規格

化性

オーバヘッドは?

コンテキストスイッチ

時間

改善

?

CPU CPU CPU CPU CPU CPU CPU CPU

1

LMBenchによる性能オーバヘッド測定

性能オーバヘッド評価

Page 29: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

29

0

0.2

0.4

0.6

0.8

1

null call

null I/O

stat open close

siginst

sighndl

forkproc

execproc

shproc

規格

化性

今回の技術 Xen UML

1.4 非仮想化Linux

従来

技術

より

改善

プロセスマイクロベンチでは、約0.3%性能オーバヘッド

性能オーバヘッド結果(1/2)

Page 30: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

30

0

0.2

0.4

0.6

0.8

1

2p0K

2p16K

2p64K

8p16K

8p64K

16p16K

16p64K

規格

化性

1.4今回の技術 Xen UML

非仮想化Linux

従来

技術

より

改善

コンテキストスイッチマイクロベンチでは、約0.8%性能オーバヘッド

性能オーバヘッド結果(2/2)

Page 31: System-level timing margin test...Capability, ”ISSCC2007 digest of technical papers, pp. 174-175. ださない 7 同期 回路 同期 回路 演算 回路 クロック データ

31