アベイラビリティ:稼働率のこと
MTBF(実際稼働していた時間)
稼働率=--------
MTBF+MTTR(分母は全稼働時間)
平均故障間隔(動いてる時間のこと:故障と故障のあいだのこと=すなわち普通に動いてる合計時間)
平均修復時間
この「英語」が試験に出る
>MTBFとは、Mean Time Between Failureの略称です。 日本語で平均故障間隔を意味し、システムや機器の信頼性を表す指標となる数値です。
>字義通り、故障から次の故障までの平均的な間隔を表している。言い換えると連続稼働できる時間の平均値である。つまり、MTBFの数値が大きいほど信頼性の高いシステムであるといえる。
MTBF:平均故障間隔
Between 故障と故障の間隔のこと
>平均修復時間 平均修復時間(へいきんしゅうふくじかん)とは、あるシステムに障害が発生してから修復が完了するまでの時間の平均値のこと。 平均復旧時間(へいきんふっきゅうじかん)とも言い、英語のmean time to recoveryからMTTRと略される。
>MTTRは、Mean Time To Repairの略で、平均復旧時間のこと。
どっちだよ
先生は「Mean Time To Repair」派
MTTR :平均修復時間
稼働率を上げたい:
故障の回数を減らす
復旧までの時間を減らす
繰り返し使われている問題:
「MTBFを2倍にしMTTRも2倍になったらどうなるか」
→変わらない
273P
組み合わせたときの計算が出ちゃうらしい
電気抵抗の考え方と同じらしい
直列でつなぐとか並列で計算するとかとは?
装置1と2が横でつながって同じネットワークで1から2にいっている→どっちかダウンしたら止まる→「これは直列」とみなす(両方いきてないとだめだ)
並列は負荷分散のため2系列にわかれていてどっちか生きてれば処理が行われる→並列と見做す
数珠繋ぎするほど稼働率は下がる(直列)
1台が稼働率90%(0.9)であるとする
それを2台つなぐと0.9*0.9=0.81に稼働率はさがる(90%大丈夫だったのが8割になる)
逆に並列のときは「両方ともだめでない」状態なら大丈夫
両方ともだめになる確率=
止まる可能性0.1と、同時にもう一台が0.1、同時にダウンする可能性は0.1*0.1=0.01(1%)でそれを1からひくので0.99(稼働率が99%)
3つ直列とする
0.9と0.95と0.95の稼働率
0.81225
並列ほど稼働率が高い
274p
等身大の設計
稼働率はシステムにとってめちゃくちゃ重要
テストに出る:
フェールソフト
フェールセーフ
ポイントはこの2つの違い
一番出やすい
システムによっては頑張り続けなきゃいけないものと速く捨てなきゃいけないものがある
飛行機のエンジンがトラブルを起こした
→頑張らないとだめだ
ウイルスにシステムが感染した
→がんばっちゃだめだ、遮断しないと
ただちに停止する方向かがんばってもらう方向かという
フェールソフト:最低限のことになっても頑張り続けてほしい
>フェイルソフト(フェールソフト)とは、故障箇所を切り離すなど被害を最小限に抑え、機能低下を許しても、システムを完全には停止させずに機能を維持した状態で処理を続行(縮退運転)する設計のこと。 これは信頼性設計の一つである。
ソフトは頑張るイメージ
フェールセーフ:
すぐ止めて安全にしたい
レイド:
これも大事
レイド事業部とかあったりする
二重化の話にも関係ある
RAID
冗長なディスクの配列というかんじ
やすあがりなディスクの配列で冗長(のびしろ)にする
ディスクとはハードディスクのことで、単にディスクの部分だけ二重化する→ハードディスクを2倍の数にするだけ→お金かからない
一番安上がりな二重化
ディスクの二重化=レイド
リアルタイムに2つ書き込んでおく
ミラーリングといって同時に2つに書き込む
ただ同じコンピュータの中での話なので、コンピュータがいかれたら対応できなかったりする
自分のLANのなかに設置するディスクでナス(nas)というのがある
直接LANケーブルにつなぐと同じLAN内から使えるらしい
ほとんど見かけは外付けHDD
なかにはリナックスかwinが入っているらしい
分散書き込みもできるし、レイドもできるらしい
分散するとじゃあそのうちひとつがいかれたらこまるね?→そういうことがないようにお互いの情報をちょっとずつ持ち合うらしい→一台のディスク分を使うらしい