[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[debian-users:45022] ルートパーティションの破損
お世話になります。小林@長野です。
# 長文失礼しますm(__)m
私が管理しているサーバが、8月、先週、そして昨日と連続してルートパー
ティションにエラーが発生し、Read Onlyでリマウントされてしまい、サー
ビスが停止してしまう現象が発生しました。
経過を説明しますと、
当初(2004年7月だったと・・・)
DELL PowerEdge 400SC
/dev/hda WD800
/dev/hda1 /boot 4GB ext3
/dev/hda2 swap 1GB
/dev/hda3 / 75GB ext3
/dev/hdb WD800
/dev/hdb1 /var 50GB ext3
/dev/hdb2 /home 40GB ext3
bind9
apache
apache2
squid
subversion
ProFTP
Postfix
ssh
webmin
という構成で、Woodyをインストールし、ほぼ1年程度問題なく運用できて
いましたが、今年8月頃にメールの送受信が出来ないとの連絡を受け、
sshやwebminで接続を試みましたが接続できない状態でした。
# サーバは新宿にあり、私は長野在住です。
そこで、コンソールからログインしてもらって、リブートしてもらいまし
た。その結果は、biosが「ブートデバイスが見つからない」(意訳)とい
うメッセージを表示して、立ち上がらなくなってしまいました。
現象としては、パーティションテーブルが壊れてしまったようです。
このときは単なるディスクの障害だろうと安易に判断して、/dev/hdaの
WD800を新しいWD800と交換し、sargeをインストールしました。
/dev/hdbはバックアップとしてそのまま残し、/一本で構成しなおしまし
た。
その状態で運用することおおよそ2ヶ月、先週の26日になってふたたびメー
ルの送受信が出来ないとの連絡が。このときは、たまたまsshをつないだ
状態だったので、みると/(/dev/hdb3)がRead Onlyになっていました。
そのため、ログの類も更新できなかったらしく、大本のエラーがなんであっ
たかは確認できませんでした。
とりあえず、
# e2fsck -n /
してみると、
e2fsck 1.37 (21-Mar-2005)
e2fsck: Attempt to read block from filesystem resulted in short read while trying to open /
Could this be a zero-length partition?
といわれました。
どうし様もないので、/dev/hdaをパーティションから切りなおして
sargeをインストールしなおして、昨日朝(10時ごろ)に運用を再開しま
した。
ところが、昨夜(21時前ごろ)、/dev/hdb2の旧/homeのデータをcpで
/dev/hda3の/homeに戻している途中で、
cp: cannot create regular file `./?????/.bashrc': Read-only file system
cp: cannot create regular file `./?????/.bash_profile': Read-only file system
cp: cannot create regular file `./?????/.alias': Read-only file system
cp: cannot create regular file `./?????/.cshrc': Read-only file system
cp: preserving times for `./?????': Read-only file system
という様にエラーになり始めました。
/var/logを調べてみたのですが、最後のログは、
Oct 31 20:26:47 localhost kernel: kjournald starting. Commit interval 5 seconds
Oct 31 20:26:47 localhost kernel: EXT3-fs warning: checktime reached, running e2fsck is recommended
Oct 31 20:26:47 localhost kernel: EXT3 FS 2.4-0.9.19, 19 August 2002 on ide0(3,66), internal journal
Oct 31 20:26:47 localhost kernel: EXT3-fs: mounted filesystem with ordered data mode.
でした。
他にはエラーらしきものは確認できないのですが、何が問題なのでしょう?
今現在は、sshもつなぎっぱなし(切ってしまうと2度とつながらなくなる)
の状態です。
最初のときはHDDが壊れたのだと思ったのですが、こう続くとなると、そ
れ以外の原因もあるのではないかと思うのですが、助言をいただけると助
かります。
--
KOBAYASHI Masao mailto:koba@xxxxxxxxxxxx