【arrowhead】東証、システム障害の原因を特定「自動切り替えできない設定値になっていた」

1 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:19:43.53 ID:mHWZLexh9

https://www.itmedia.co.jp/news/articles/2010/06/news063.html

東京証券取引所は10月5日、株式売買システム「arrowhead」(アローヘッド)で1日に発生した障害の原因を特定し、
4日中に修正したと発表した。

障害は、ストレージ内でメモリ故障が起き、サブ機にも切り替わらなかったことが原因。
メモリ故障による障害が起きた際、自動切り替えできない設定値になっていたという。

レス1番の画像サムネイル
東証のニュースリリースより

arrowheadのユーザー情報などを格納するストレージ「共有ディスク装置」の1号機に搭載されたメモリが故障したことに起因。
1号機が障害を検知すると、切り替え用設定値に従って自動で2号機に切り替わるはずが、切り替わらなかった。

調査したところ、メモリ故障が原因の障害パターンが発生した際、自動切り替えできない設定値になっていたという。
設定値を変更すれば、自動切り替えできることが判明。4日にシステムに適用し、自動切り替えが動作することを確認したという。

稼働前のテストでは、1号機と2号機相互の死活監視を途絶えさせても、自動切り替えできていたという。

1日の障害では、東証の全取引が終日停止した。

2 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:20:39.18 ID:L5/gZAjz0
富士通みたいな三流企業に頼むから..
3 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:21:24.97 ID:qRKH1gbk0
その設定ファイル誰がイジったんだろう
4 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:21:27.10 ID:fGgYG4e80
ズコーッ
5 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:21:31.97 ID:ZRiN9kgt0
マヌケだな
これは責任問題になるんじゃないの?
6 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:22:42.17 ID:1RNLgHuO0
これとトランプ入院が被ってたら危なかった
7 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:23:06.37 ID:vEsvHRMt0
なんでちゃんとテストしないのか 学校でと避難訓練とかしてるよ 誰か教えてあげて
8 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:23:43.23 ID:qhqrSfVi0
白谷愛糞くんの正拳
9 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:24:08.36 ID:Z4dz+iRs0
テスト仕様書作った奴の責任
13 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:25:15.20 ID:94EVU6u60
>>9
指摘しなかったレビュアも同罪
10 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:24:13.62 ID:wnuFp19A0
アホかよw
実際に故障を模してチェックしていなかった
ってことだわな。
15 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:25:39.43 ID:ncNd4fUz0
>>10
何を今更
Cocoaで散々見てるだろ
しっかり金入れない体質から来てるんだろなぁ
23 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:27:28.32 ID:5rYQ2Cp40
>>10
本当これ
普通に考えたらメモリが壊れたときの試験くらいやるだろう
31 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:29:01.29 ID:dK+RAv710
>>23
メモリのフォールトインジェクションは難しいよ
ハード開発ならまだしも SI ではやってないケース多いと思う
32 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:29:42.60 ID:5rYQ2Cp40
>>31
難しいからという理由で試験をしないの?
システム開発するだけの能力がないだけじゃん
38 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:30:37.49 ID:rnhKsn300
>>32
お金次第だね
11 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:24:58.80 ID:wCAym03X0
現場猫のIT版だな

他の人が設定チェックしたと思ったから
自分はチェックせずOK出した

12 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:24:59.34 ID:wSNxoi4y0
よくわかんねえが、男女関係で言ったらメインの男に捨てられたオンナが
183センチでしか設定してなかったんで、せっかくの174.6センチの
高学歴で家柄良すぎで文京区の大名屋敷の跡地の古いが広い家に住んでて
両親大学教授でイケメンでスタイルよくて、超一流企業勤務でそろそろ
管理職各停で人望もある好青年の求愛をことわっちまう的な?
14 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:25:34.11 ID:285UV9Lv0
富士通は、何も責任取らないの?
東証は被害者?
26 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:15.52 ID:FMK74fvs0
>>14
責任は感じるもの
16 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:25:59.01 ID:9R8kjFVk0
BPSなら
17 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:26:01.12 ID:BFv4oEuc0
だから、何でそんな設定値になっていたの?
34 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:30:00.24 ID:Z9VtS4AW0
>>17
私の推測では
テストするために設定値を書き換えて
テスト終了後に元に戻して無かったんじゃないかな?
37 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:30:15.13 ID:vKpg23bp0
>>34
あるある
54 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:19.04 ID:YqClLMvv0
>>34
それだな
18 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:26:07.40 ID:Z9VtS4AW0
なんだか残念な話しだね
19 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:26:08.59 ID:rnhKsn300
切り替え忘れが悪いんじゃなくて、切り替え忘れを検知する仕組みが必要だね
20 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:26:34.02 ID:iCnk7iea0
あたおか韓国人の嫌がらせか
21 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:27:00.35 ID:5rYQ2Cp40
糞富士通にちゃんと賠償させろよ
22 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:27:12.95 ID:dK+RAv710
Linux だと panic_on_unrecovered_nmi かな
デフォルト 0 の罠パラメーター
24 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:27:57.99 ID:gTcTDDlD0
納品時チェックでは動いたって書いてあるんだから後から誰かが弄ったんじゃないの?
25 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:11.20 ID:96plqbZV0
こういうのって定期的にチェック入れるもんじゃないの?
稼働前にテストしたっきりで以後ずっとノーチェックだったのかな
30 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:59.63 ID:5rYQ2Cp40
>>25
稼働させたら後は知らなーいくらいのノリだったんだろ
定期的に障害発生しても問題ないかのテストを行うべきだったね
27 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:47.15 ID:zOVuViLL0
ノーテストで本番リリースか、さすが富士通クオリティ。
28 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:48.15 ID:ACojoJAR0
これ、富士通側の責任?
29 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:28:54.85 ID:f7QHiBIi0
えー
テストしてないの
他にもしてないテストあるだろう
正直に言いなさい
47 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:01.55 ID:Z9VtS4AW0
>>29
設定値があるって事はテストしてるはず
つまり想定されてた障害のケース
33 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:29:45.34 ID:vKpg23bp0
設定値変えても記録残さない
ITあるある
35 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:30:06.17 ID:cNMqgY+P0
これが日本だ!
みたか海外どもめ
36 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:30:09.88 ID:nEWdQhPv0
設定値って01じゃなくてしきい値でもあるのか
42 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:32:08.00 ID:mUZq41dj0
>>36
当たり前だろ
ログの一文からしか分からないケースだってあるぞ
39 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:31:21.33 ID:c44/fwDg0
ネットワーク疎通監視までしかしてなかったとか?
44 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:32:15.46 ID:vKpg23bp0
>>39
heartbeatはやってて、止まってても切り替える設定外れてたのかと
40 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:31:32.68 ID:KsbitBZU0
はい
人為ミス
損害賠償
41 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:31:56.02 ID:sB6ZeGpv0
>メモリ故障が原因の障害パターンが発生

想定外のパターンが発生?
あらゆる障害を想定しているんじゃないんだな

48 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:02.01 ID:vKpg23bp0
>>41
設定値を直したら切り替わったんだこら想定内だよ
55 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:26.00 ID:sB6ZeGpv0
>>48
なるほど、想定内か。
43 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:32:14.76 ID:gjp0Xxar0
単体でテストしてたのかな
45 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:32:34.50 ID:kViVbxOM0
なんぼに設定したんや
46 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:32:48.51 ID:xlSZ0RKp0
ファーーーーーーwww
49 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:25.29 ID:efzloHP+0
どうして自動切り替えできない設定値になっていたのかが書いてない
60 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:54.11 ID:vKpg23bp0
>>49
そういう作業って記録残さないんだよね~
50 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:31.71 ID:3mO21dmu0
事故ってほんとうにささいな所で起こるもんだよなぁ
51 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:31.80 ID:SjLTd/TO0
結局富士通か。あまりタイトな設定値にすると誤作動するから設定値弄ってたんだろw
52 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:33:58.66 ID:Z8nKf4At0
誰がいじったのか
53 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:06.73 ID:vKpg23bp0
切り替わる設定はした
だが、そのあと設定値をいじくって切り変わらなくなってた
56 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:34.85 ID:QJBemXNn0
ダメな会社だな
57 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:47.08 ID:A4eeMpFH0
ズコー
58 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:50.41 ID:vGJkq1zd0
テロ確定って事?
59 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:34:51.96 ID:4pNk7DA40
とりあえず、取引できなかった1日分の金利を補償して
61 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:35:01.22 ID:3mO21dmu0
むしろ毎週自動的に設定値が変化してプライマリが変わるぐらいの設計のほうが正しいってこと?

バックアップ機に切り替わったとしても1日の取引に耐えられるかの保証はないわけで

62 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:35:14.80 ID:SSrBOh7+0
ヨシッ、アル
63 名前:押しボタン式の匿名希望者 投稿日時:2020/10/06(火) 11:35:20.23 ID:xlSZ0RKp0
ハートビートは見てましたが心停止したら蘇生せずにそのまま死んでいただく仕様でした

自己責任ですのでういあー自民党

コメント

タイトルとURLをコピーしました