Chienomi

5950X機障害 → 3700Xが犠牲に PC不具合検証方法と注意点

Live With Linux::trouble shooting

Ryzen9 5950X機が起動しないという問題に見舞われた。 原因の特定は順調に行っていたが、終盤にミスがあり、検証に用いられたRyzen7 3700Xを破損するという結末になってしまった。

手順そのものには誤りがなかったため、起動しないといった不具合における検証手順、及び事故発生を踏まえた注意点を述べる。

なお、現象は「電源投入は可能だが画面は出ず、電源操作(電源ボタン長押しやリセットボタン)も効かず電源遮断するしかなくなる」というもの。

問題を見当する

まず、画面が全く出ない、というのはOSに関わるもの、あるいはディスクの論理的故障ではない。 ディスクの中身を読む行為は起動シーケンスとしてはブートスプラッシュを出すよりも後の段階であり、この場合でも画面は出るからだ。 (ブートスプラッシュを無効にしている場合は判定できないかもしれない)

これでスプラッシュ表示まで行くがセットアップやブート選択でフリーズする、となるとESPが壊れている可能性も考えられるが、全く到達していないのでその可能性は非常に低い。

電源が投入でき、かつその状態で固まってしまうのは電気的な問題である可能性が高い。

電気的な問題は必ずしも故障とは限らない。 可能性が高いのは、デバイスがちゃんとささっていない(中途半端な状態である)ケースと、ビデオカードに電源が供給されていないケース(稀には、CPU電源を挿し忘れていることも)だ。

また、一時的な電気的な異常が生じているというケースもある。放電やCMOSクリアで直るケースのことだ。しかしこのような場合、どちらかというと電源が入らないことのほうが多い。

次にデバイスが故障していて、ちゃんとささっているにも関わらず電気的なエラーを生じる可能性が考えられる。

また、デバイスの故障に関しては画面出力系が壊れている場合はたとえケーブル不良などであっても当然ながら画面が出ない。 とはいえ、今回は電源操作ができないという問題がついてきているので、可能性は低い。

検証する

デバイス取り外し

問題の切り分けを行うため、最小限の構成からスタートするのが良い。

まずは手軽なUSBなどの外付けデバイスをすべて取り外してディスプレイ1台だけにする。

次の段階として、本体をマザーボード、CPU、メモリ、そしてビデオ出力をCPUが持たない場合はビデオカード、という構成にする。 なお、起動すればOKであるため、冷却系を外すことになったとしても外したままで良い。そのまま使わず、すぐにシャットダウンするからだ。

ストレージがなくても画面を出すところまでは行くのでストレージは外してしまって良い。

これで解決するのならば、取り外した何らかのデバイスが不良であるか、あるいは接続不良であった可能性が考えられるが、今回は改善しなかった。

ビデオカード

今回の場合、私はハードウェアをいじって間もなかったことからビデオカードの問題から考えることにした。 例えば、ビデオカードのささりが甘かった、というような可能性があるためだ。

ビデオカードの挿し直し、電源の確認、異なるディスプレイへの接続などを試した。

また、本来はもっと後にやる作業だが、ビデオカードを交換してのテストも行った。 別のビデオカードを装着しても起動しないこと、もとのビデオカードを用いて他のPCは起動することからビデオカードの問題ではないと判定した。

ビデオカードは互換性があるため、交換しての検証は複数台あれば難しくない。

放電

常套手段である。 電気供給を停止した状態で放置する。

10〜20分程度と言われることが多いが、私の経験上、これでは足りない。一晩や丸一日放置くらいが良い。 2, 3時間放置して起動しなくて焦っている人に「12時間は放置しろ」と言ってそれで解決したこともある。

しかし今回は解決しなかった。

CMOSクリア

マザーボードのリセットはこのようなケースで有効である。 必ずしも設定をリセットする目的ではなく、マザーボードの電気的状態をリセットする目的もある。 放電においてはマザーボードは電池によって電気を供給されているため、完全にリセットはされないからだ。

GIGABYTE製のマザーボードのCMOSクリアは、「電池を抜いて放置」であった。

しかし解決しなかった。

メモリ

メモリはある程度互換性がある。つけ外しも割と簡単だ。

比較的問題が生じやすいハードウェアであり、検証する価値はある。

メモリを交換して起動したが解決せず、一方もとのメモリは別のPC上で問題なく動作した。

電源

電源の故障もありがちだが、やや検証しづらい。 起動するのに十分な容量をもった電源で規格が合うものであれば使えるが、両方の接続を外し、供給側についてはケースにもよるが取り外しまではしなくても良いものの、配線はやり直す必要がある。

メインとCPU、そして必要ならビデオカードの3箇所への接続が必要なので忘れないように。

今回は解決しなかった。

CPU

いよいよ最後の検証項目である。

CPUを交換し、結果が変わらない、つまり動作しないPCはCPUを替えても動作しないし、動作しないPCについていたCPUで他のPCが動作するのであればマザーボードの問題、動作しないPCが逆になるのであればCPUの問題で確定である。 なお、確定のためにもう一度戻す必要もある。もう一度組み直したら直るようであれば接続の問題だからだ。

しかしここで事件が起きた。

検証に使ったB550/3700X PCからRyzen7 3700Xを取り外そうとしたとき、CPUクーラーが外れず、CPUもろともソケットから外れるという事故が起きた。 通称スッポンである。

これで盛大にピンが曲がり、欠損もしてしまった。 こうなるとごく一部の特殊な人以外にとっては一巻の終わりである。

Ryzenはピンを固定しているだけでCPUを押さえつけておらず、しかもRyzenのリテールクーラーは猛烈に接着されるグリスである上に、外すのが大変なものなので、細心の注意を払うこと!

その注意を払わなかった私は、4万円ほど払ってRyzen5 5600Xを購入することになった😭😭😭😭😭

そして最終的に

3700Xは犠牲となったが、問題としてはマザーボード(X570S UD)の問題であるとほぼ確定できた。 (3700Xを挿して動作しないことを確認することはできなかった。)

そこでパソコンショップアークに連絡し、保証修理取次をお願いすることになった。

アークは対応は丁寧だが、再現しないとダメということなので、再現性が低い問題は対応してもらえないかもしれない。 そこが難しいところだ。まぁ、メーカーPCでも再現性が低い問題はあまり対応されないし、Lenovoのワークステーションでも対応されなかったが。

なお、PC関連の保証/修理対応は大抵の場合箱や付属品も含めたすべてが必要になる。 捨ててしまわないように注意すること。

アークでも症状が再現したとのことで、修理送りとなった。

余談

3700Xと5600X

1世代新しいが、1クラス下のプロセッサへの変更。

Zen3プロセッサには5700Xというモデルはなく、Ryzen7は5800Xのみとなった。 Zen2においては3700X, 3800Xという2モデルがありはしたものの、TDP 65Wの3700XとTDP 105Wの3800Xであったし、3800Xの性能と価格がやや微妙でRyzen9 3900Xのほうが魅力的であったことからあまり売れないCPUであった。

だが、Zen3ではTDP 65Wの高性能モデルは消滅してしまったわけだ。

Zen3ではRyzen7 5800X, Ryzen7 5800X3D, Ryzen9 5900X, Ryzen9 5950XはすべてTDP 105Wで、Ryzen5 5600Xと2つのAPUが65Wとなっている。 ベースクロックは5800X3Dと5950Xだけが低いが、5950Xは最大ブーストクロックは最も高い。

Zen2では際立って魅力的なモデルであった3700Xのポジションが空いてしまったが、現時点では3700Xと5600Xがほぼ同価格(5600Xが少し高い)で販売されている。

そして基本的にこの2つのCPUの性能は「同程度」である。 コア数をフルに活かせるマルチスレッド処理では3700Xのほうが速いが、多くの処理では5600Xのほうが僅かに速い。

これはコア数が3700Xのほうが13%多い一方、AMDの公式発表では19%向上したIPCという性能向上が拮抗しているのだろう。

最低限欲しいコア数というのもあるのだが、基本的にはコア性能が高いほうが使いやすい。同等の性能を持っているのであればコアが少ないほうが良いと考えて良いだろう。

これを機に性能を上げてもよかったのだが、やっぱり金銭的な問題があったのと、B550マシンは寝室置きなのでそもそもCPU性能を盛りたいということがない。

mmutils/mmffrなどのことを考えると総処理時間では(無限に処理すべきものがあると仮定した場合)コア数が多いほうが有利な傾向ではあるが、実際には「時間の長いソースを性能の低いホストが拾ってしまい、全体の処理時間を大幅に伸ばす」ということが発生したりするため、あまりシングルスレッド性能が開いてしまうと使いにくい。

将来的にはさらに性能の高いPCが導入されるだろう。 寝室PCとして3700X/5700XTは十分な性能を持っており、当然ながら(現在最高峰である)5950X機に関しては性能を問題とする余地がない(ビデオカードは置いといてだが)。 このため当面性能改善を要求する考えはない(少なくともRyzen7000は狙っていない)し、長期に渡ってこのまま使う可能性もある。VP9エンコーディングが速くなれば話は変わるが、その判断がされるレベルだと少なくとも現在の12倍程度は速くならねばならず、この先数世代で実現するようなものではない。現実的にはAV1デコーディングができねばならないという状況になることだが、その場合でもビデオカード交換で済ませるかもしれない。

これを考えると次の状況は現在のPCよりも圧倒的に速いPCが追加され、5950X機をスライドするか、あるいは5950X機を単純な計算リソースにするかみたいな判断を行う段階が来ることになる。その状況で例えば5950Xが寝室に来て5600Xがリビングに行ったとして、「ああ、5600Xじゃなく5950Xにしてたらなぁ」となることは考えにくい。 その時には5950Xのコア性能は相対的に低いわけで、5600Xの総合的な処理性能に不足があるのであれば寝室に5950Xを持ってくれば良いのだし、計算リソースとして見ればコア性能が同じ5950Xと5600Xの価値は(総量的変化を置いておくとして)変わらない。 こうした想定を踏まえると5800Xあるいは5900Xを選択することによって得られる利益は非常に限定的だ。

そのため実益を見ればこのマシンにお金をかけて性能を伸ばすよりも6コアでもZen3コアがあれば十分という判断だった。

もちろん、それは私が既に5950Xを持っているからの話であって、3700Xがメインだったときに大して5950Xがメインになったことで得た利益は非常に大きい。

AM4とスッポン

実はAMD Ryzenが採用するAM4、とてもスッポンしやすいことで知られている。 純正クーラーはさらに左右に金具をテンションかけてひっかける構造なので剥がすときに傾ける必要があり、この問題を助長する。 さらに純正クーラーはものすごく接着されてしまうグリスを問題をさらに悪化させている。

AMDは責任取らないよという姿勢だけれど、問題そのものは認識しているのか、Ryzen7000から採用されるAM5はかなりしっかり固定できるようになっているようだ。よかったよかった。

なおIntelがどうなのかは知らないけど、AMDは既知の不具合に対しても対応は非常に渋い。 3700Xに不具合があったため起票したのだが、メモリはマザーボードのQVLにあるものでないとダメだということだったり、別のマザーボードで検証しろと言われたりしてなかなか大変だった。 再現性があって問題が明らかなのであればショップに頼んだほうがいい。