ESXiがクラッシュ
3月中旬の夕方、外部の監視サービスからサイトダウンの通知メールが届いた。確かにWebが見えなくて、VPNしようにもまったく反応しない。
帰宅してIPMI越しに覗くと見えたのは、ESXiのクラッシュ。思い返せば2ヶ月ほど前にもパープルスクリーンで堕ちた事があった。
BIOSも起動しない事態
再起動させようとしても、ファンだけが回って画面が真っ暗なまま(汗 パーツ類を外しても変わりない。典型的なBIOSクラッシュ事象。。。
オワッタ(;´∀`)と落胆。。。
前々から、このマザー「A1SRi-2758F」はIPMIでBIOSアップデートが出来ることを知ってたけれど、ライセンス購入しなければならず調べてもなかった。後述するけれど、ライセンス購入してIPMI経由で試みたけれど、BIOS書き込みできず完全に壊れてしまったようだ涙 別途USのSupermicroサポートにも問い合わせたが、期間的に、ライセンス的にも、修理さえ受け付けてくれない。Supermicroが大好きだとアピールしたのに薄情だw
これを機に、AWSかGCPに移管しようかとよぎったが、10TB超をクラウド移管するのは時期尚早であるしNASアプライアンスも必要。やはり、、、構成維持して10GbEオンボードマザーに買い替えよう! と決断。あわよくば壊れたマザーのBIOS修復ができたら売ってしまえばトータルで安い! と思い込み。数日後、以前から目をつけていたAtom C3758マザーをポチった。本当は、16コアのC3958マザーがいいなぁと思うものの10万クラスは高根過ぎた。
上写真上側が買い換えた新マザー「A2SDi-H-TF」(2017年発売)、下側がBIOS起動しなくなった「A1SRi-2758F」(2013年発売)。
壊れたC2758マザーは2015年12月に買ったので、5年ほど24時間動き続けてくれた。ありがとうお疲れさま。この基板上ぎゅうぎゅうの集積具合が好きだった。。。
A2SDi-H-TFは、上位モデル(A2SDi-H-TP4F)と基板共用してるのでSFP+ポート分の空きが目立つ。それ以外BIOSクラッシュしたマザーと同じ8コアだし、世代が新しいので多少パワー向上を期待するもののそれほど変化を感じない。とはいえ、DDR3からDDR4に変わってメモリー量を増やせる楽しみがある。Xeon-DやASRockマザーも検討したけれど、やっぱりSupermicroのAtom C3000シリーズに惹かれた。
メモリーはMicron派なのでCrucialブランドのECC DDR4 2666、16GB✕2枚を1万8千円で購入。マザーは送料込み6万円(通関税で3千円取られた)。
A2SDi-H-TFの決め手は、やはり10GbEオンボードと8コア、そしてECCなら256GBまでメモリー量を増やせるところ。さらにminiSAS HDが2ポートで計12台ディスクが繋げられる。まぁ、今のところケースを買い換える予定は無いので、せいぜい8台くらいが限界か。
平常稼働で落ち着いた電力量を見ても、3W程度下がったほどでほぼ変わらなかった。
チップセットはDDR4 2400までしか対応してない。2666の方が安価だったので。。。
しかしまぁ、C2758に比べてCPU発熱がヤバい。ヒートシンクを空冷しないと夏を超えられない感じがする。いや、定期実行してるZFSのScrubで既にヤバいかも。。。
と、思ったものの、Munin履歴を見るとC2758も同じような温度だった。ファンモードを見直したほうがよいかも。
生還を期待したけれどダメだった
壊れたマザーが直らないかな、とあがいてみた。IPMIでBIOSアップデートが出来るというSupermicroのOOBライセンス(SFT-OOB-LIC)について、有志ブログを参考にWIREDZONEで買ってみた。
3日ほどでライセンス記載のメールが届き、早速IPMIでBIOS書き込みをしてみたけれど変化が無い(涙 3回くらい試したけれど、諦めることにした。
USPS輸送は10日間で届いた
最後に、マザーのUSPSトラック情報。10日ほどで届いて速かった。メモリーはポスト投函されたのでさらに速い8日間。今回は、ebayにて購入。
March 26, 2021, 10:51 am
Delivered
JAPAN
Your item was delivered in JAPAN at 10:51 am on March 26, 2021.
March 26, 2021, 9:17 am
Out for Delivery
JAPAN
March 25, 2021, 12:17 pm
Addressee not available – Scheduled for another delivery attempt today
JAPAN
March 25, 2021, 8:42 am
Out for Delivery
JAPAN
March 25, 2021, 7:20 am
Arrival at Post Office
JAPAN
March 24, 2021, 4:07 pm
Processed through Facility
KAWASAKI PORT, JAPAN
March 24, 2021, 4:06 pm
Customs Clearance Processing Complete
JAPAN
March 23, 2021, 9:53 am
Held in Customs
KAWASAKI PORT, JAPAN
March 23, 2021, 9:00 am
Held in Customs
KAWASAKI PORT, JAPAN
March 23, 2021, 8:59 am
Customs Clearance
JAPAN
March 21, 2021, 4:37 pm
Processed Through Facility
JAPAN
March 21, 2021, 8:19 am
Departed
OSAKA, JAPAN
March 20, 2021, 10:00 pm
Departed
TOKYO, JAPAN
March 19, 2021, 1:25 pm
Departed
SAN FRANCISCO, UNITED STATES
March 19, 2021, 8:08 am
Arrived
SAN FRANCISCO, UNITED STATES
March 18, 2021, 10:27 pm
Processed Through Regional Facility
SAN FRANCISCO CA INTERNATIONAL DISTRIBUTION CENTER
March 18, 2021, 10:26 pm
Arrived at Regional Facility
SAN FRANCISCO CA INTERNATIONAL DISTRIBUTION CENTER
March 18, 2021
In Transit to Next Facility
March 16, 2021, 10:53 am
USPS picked up item
EMERYVILLE, CA 94608
March 15, 2021, 7:49 pm
Shipping Label Created, USPS Awaiting Item
EMERYVILLE, CA 94608
今回学んだことがある。それは、1筐体でルーターも仮想化してると緊急時にVPN越しのIPMIアクセスもできないこと汗。根幹の出入り口となるルーターは冗長化が必要か。まぁ、それほどシビアでもないか。。。
CPU温度下げた
その後、4cmの空冷ファンをCPUヒートシンク近くに配置して温度を下げた。しかし、4cmで4ピンタイプが購入時に見つけられず3ピンタイプ。そのせいか、フル回転しすぎてて温度が下がるさがる汗 定格回転数を大きく上回ってる。まぁ、Munin監視してるからいいか。