Amazon.co.jp ウィジェット サーバ(玄箱)日記 Archive - PC破壊日記的ブログ

Home > PC破壊日記 > サーバ(玄箱)日記 Archive

サーバ(玄箱)日記 Archive

HDDが盛大にぶっ壊れた件→10/9奇跡的にデータ救出成功

このエントリーをはてなブックマークに追加

突然ですが、HDDが壊れてしまい、録画用に使用していたサーバーが起動不能になりました。
まあ、HDDが壊れるのはいつも突然なのですが。

単純に「立ち上がらねぇのはシステム損傷かなぁ~、もしくはBIOSでこけたかな」と楽観視していたら、まさかのHDD死亡というオチ。
しかも、容量が3TB(ST3000DM001)のはずなのに、600PB(≒600000TB)なんていうとんでもない値を返す始末。
・・・あれ・・・デジャヴ・・・(昔MOディスクでも同じ現象に出会った記憶があり)
たとえ正常にSMARTデータが読み出せても、閾値を100倍ほどに超える桁違いのReallocated Sector countの数。
中に入っていた録画データはすべて御釈迦に。
カツカツ言ってますしね。独特の故障音が。

ちなみにこの容量を復旧しようとすると平気で1000万円を超えます。さすがにやってられません。
それだけのお金をかけるぐらいなら別の方法で調達した方が安上がりです。(二度と手に入らないデータもあるけど)

というわけで、故障報告でした。
初期不良ではありませんが、これで日記は1年継続です。

---(10/9追記 この話には続きが・・・)---

続きを読む - HDDが盛大にぶっ壊れた件→10/9奇跡的にデータ救出成功


 

Linux LVMボリュームが壊れたときの対処法 on 仮想環境

このエントリーをはてなブックマークに追加

本日、仮想環境(Oracle VM VirtualBOX)上のCentOS 5.6がシャットダウンすら受け付けない完全フリーズ状態に。それを強制終了したら、今度はパーティションがない!と、kernel panic!を吐いて終了していました。

これでは起動すらできません。つまり、データを吸い出すことができないのです。
困ったので、以下の手段をとりました。

1.仮想HDDのバックアップ
実HDDでは簡単にコピーはできません(ddコマンドとかで完全コピーとかの手段が必要)が、仮想環境用の仮想HDDなので、とりあえず仮想HDDファイルをコピーしました。
これで、万一復元に失敗しても、バックアップファイルを使えば再度挑戦できます。

2.新しく仮想環境を作り、そこに壊れたHDDを追加でマウント

3.testdiskを用いて、HDDのパーティション復元を試みる
使い方はここ(@IT)とかここを参照のこと。
これで、パーティションの解析を行った結果、QuickSearch出元のパーティション構成は復元できました。

しかし、このHDDは、実はLVM構成。
HDDの拡張が自由にできる半面、壊れたときの復帰は難しいのだとか。
そして今回、復元用の仮想環境までもLVM構成で作ったため、困ったことに。

以降は「続きを読む」から・・・。

続きを読む - Linux LVMボリュームが壊れたときの対処法 on 仮想環境


SSH公開鍵認証のトラブルとその解決メモ

このエントリーをはてなブックマークに追加

SSHでの公開鍵認証で1時間以上トラブったので
ここにメモ。

とりあえず公開鍵認証できるところまで。鍵のみでの認証は他のサイトを参考にしてちょうだい。


1.SSHサーバ側の設定変更。
sshd-configの以下の部分を変更。

#Port 22

Port (適当な番号に)
クラック/ハッキング対策

RSAAuthentication yes
PubkeyAuthentication yes
AuthorizedKeysFile .ssh/authorized_keys
この三行がコメントアウトされていたらコメントを外す。

PermitEmptyPasswords no
これは空パスワードの不許可。コメントアウトされていたら外す。

2.ssh鍵生成
Teraterm、PuTTY、linux系のOSでのssh-keygenなど、お好きな方法で。
ただ、PuTTYの生成するのは形式が変なので、
"Load existing key file"で再度秘密鍵を読み込んであげると、
公開鍵の情報が出ます。

3.サーバーに公開鍵をコピー
sshで従来通りログインして、まずはホームディレクトリに移動。
その後、
mkdir .ssh
chmod 700 .ssh
cd .ssh
cat >> ./authorized_keys 
<ここで、ssh公開鍵(id_rsa.pubとか)の中身を丸ごとコピペ、その後ctrl+d>


4. パーミッション変更
chmod 600 authorized_keys 

5.ログインテスト

このパーミッション、所有権でハマりました・・・。
CentOSの場合、
.ssh オーナーはログインするユーザー、パーミッション700
.ssh/authorized_keys オーナーはログインするユーザー、パーミッション600

これで無いと必ず蹴られるようです。

ああ・・・時間がかかった・・・。

とりあえずログインできるまでなので、しっかりとした設定は他のサイトを見てちょうだいな。
もう疲れました・・。



 

epgrecで録画できない、予約できない場合の対処法

このエントリーをはてなブックマークに追加

LinuxでPT1/PT2などでのキャプチャを実現する、epgrec。
このソフト?を使えば、Windowsに比べ比較的安定しているLinuxサーバで予約録画が実現するので大変便利です。(時間追従に微妙に対応していないので延長とかに対応できないのが残念ですが・・・)
携帯での予約録画も、別途iモード用のphpを導入すれば可能になります。

しかし、このepgrec、様々なトラブルに見舞われました。
もちろんepgrecだけの問題ではないのですが、windowsに比べ原因が発見しづらく、修復までに無駄に時間を使うこともしばしば。

 そこで今回は、トラブルが起きたときにどこを見ていったらいいのか、私が経験したトラブルを元に記載していきます。

続きを読む - epgrecで録画できない、予約できない場合の対処法


  

Microsoft Office Excel 2010において、Webからのコピペが遅い場合の(無茶な)対処法

このエントリーをはてなブックマークに追加

間が一ヶ月ほど開いてしまいました。お久しぶりです。
今回は、近日発売されるMicrosoft Office 2010について。
ベータ版でのことなので製品版とは多少違うかもしれません。

6/17に発売される本製品、Office 2007の時の反省点を踏まえ、
比較的使いやすくなっています。
特に、ファイルメニューが左上の球型アイコンから、リボンに独立して存在するようになりました。
ここをクリックすると、Excelの全面にファイル関連メニューが表示されます。
他にも、リボンの自由な編集が可能になったり、と細かな変更点もうれしいところ。
しかし、改善点に混じって、少し、いや、かなり困ったことが。


Excel 2010において、Webページ(ホームページ)から全部、又は一部をコピーし、
Excelに貼付(ペースト)する際に、Excel 2007以上に貼付完了まで待たされます。
Excel 2007以前は長くても5秒程度待たされるだけで済んでいたのですが、
Excel 2010では60秒(1分)以上がざら。下手すると300秒(5分)ぐらい待たされます。
何故これほど遅くなってしまったのか。

一応フォーラムに投稿したのですが、全く答えは得られず。
誰も経験していないのでしょうか。もしくは、こんな物と我慢しているのでしょうか。
我慢はいけません。改善しなければ。

ということで、どんなことをすれば速くなるのかと、Excelの挙動をいろいろと観察。
すると、なにやらステータスメッセージに「サーバーに接続しています」の文字。
ということは、何かしらのネットワークアクセスがあることになります。

ここで、コピペ前にネットワーク(LAN)ケーブルを外しておけば、コピペ自体がすぐに終了することを確認
(ipconfig /release でIPアドレスを開放しても良い。ただしDHCPでIPアドレスを得てないとダメ)


このときと前後して見ていたサイト
セキュリティ・ダークナイト 連載インデックス - @IT -
を参考に、昔やってたパケットキャプチャ解析を行うことに。

すると、いくつかのHTTPアクセスを確認。
すると、User-Agentが「Microsoft Office ?」で始まる特徴的なアクセスがありました。
アクセスする先を確認すると、ほぼ全てがコピペ元のWebページがあるサーバに対して行われています。
見た感じ、CSSファイルの取得がメインですが、それ以外も結構あります。
こんなにアクセスがあると、どこかで待たされた時に異常に反応が遅くなるのは自明の理。
ならば、どうアクセスを遮断するか。

LANケーブルを外す/IPアドレス開放は他のアクセスも遮断するのでできれば避けたい。
ファイアウォールでExcelのアクセスを全て遮断してみましたが、むしろコピペに余計に時間がかかるように。
どうやら反応が返ってこないと待ち続けるので、余計に遅くなるようです。
つまり、Dropさせるのはダメと言うことになります。


ならばどうするか。
あとできるのは、Proxyを経由させてExcelからのアクセスのみエラーを返し、それ以外を通常通り通過させられないか。
それを検討していたところ、ちょうどsquid Proxy serverでできそうな雰囲気。
ならば、ということで、録画鯖(ubuntu linux)にsquid3を導入し、User-agentにてExcelからのアクセスを拒否させたところ、
見事にExcelのレスポンスが改善しました。
設定するのは面倒ですが、特に不具合も無さそうですし、このまま使い続けることにします。


以下、「続きを読む」より、squid3の設定を簡単に書いておきます。

続きを読む - Microsoft Office Excel 2010において、Webからのコピペが遅い場合の(無茶な)対処法



ネットにつながらないトラブル発生、原因は回線終端装置の故障

このエントリーをはてなブックマークに追加

先の続き。
重大なトラブというのは、このネットに接続できないトラブルでした。

といっても、先日ニュースにもなった回線解約云々じゃないですよ。
私は一応普通に働いていますし、解約されたら他の手段を使えば良いだけですし。

閑話休題。
今回のトラブルは、B-ONUのSTATUSランプが赤色の点滅を繰り返すという状態です。
電源スイッチを押しても反応はなく、ACアダプタを挿抜しても赤ランプの点滅は止まらず。
FIBERランプはしばらく消灯のあと、緑ランプに変化します。
他のランプ(LINK/FULL)は点灯していません。

全くの原因不明で、心当たりがあるのが午前中の障害情報のみ。
真夜中(midnight)でしたが、とりあえずフレッツの故障サポートに電話することに。
番号は分かりませんでしたが、携帯サイトがあったのでそこで電話番号を確認。
録音での応答でしたが、真夜中にもかかわらず折り返しの電話がありました。

電話での確認結果はONU(回線終端装置)の故障ではないかとのこと。
そして日曜日の朝、来てもらうことに。
その前の盛大な片付けは正直大変でした・・・。

んで、修理担当の方が来て、ONUの交換を実施。
しばらくすると、STATUSランプは緑に復帰しました。
その作業時間は約1時間。まあそこそこ早いほうじゃないでしょうか。


まあこれで、インターネット回線は復帰したわけですが、実際この間は大変でした。
この時に前後して買っていたHDD(WD20EARS、ST32000541AS)のテストを新サーバ機で実施しようとしていたのですが、ubuntu live CD(8.04LTR desktop)にsmartmontoolsを入れる方法がない。
EMチャージを仕方なく使用し、そこからtarボールやrpmパッケージを拾ってくるものの、インストールは叶わず。しかもLANポートがどうやっても使えず。
仕方なく、Win7-32bitのディスクとwin32用smartmontoolsをダウンロードするが、Win7上でsmartctlを実行してもテストができない。
結局、WinXPSP2をインストールしてテストを実施しました。

そして初期テスト完了後、さあディスクをフォーマット(全セクタ0書き込み)しようとしたら、ubuntu上でddコマンドを実施しようと、ls /dev で見てみると、
/dev/sdaや/dev/hdaが存在しない。
よく見ると、IDEコントローラ、LANコントローラを認識していないのです。
これではそもそもディスクを認識していないので、いかなるコマンドも実施することができません。
結局、ネットが復帰するまで待つハメになりました。
(最終的に、ubuntu 10.04 beta2のディスクを作って解決しました。)

ネット一つないので大騒動ですな・・・。


 

新サーバ構築を検討、玄箱Proは引退をさせることに。

このエントリーをはてなブックマークに追加

唐突に始まった買い物衝動。
今回は、新サーバの検討です。

というのも、一応理由があって、
1.いま手持ちにあるPT2 残2枚。持ってるだけなのも勿体ないので、何らかの形で動かせないか、使えないか。
2.今の録画サーバはエンコードも兼ねているだけあってちょっと消費電力が多い。常時稼働は避けたい。
3.常時稼働させてないと、リモートでの録画ができない時間帯が生まれる。

と3つの理由がありました。
3.については常時稼働させるにはサーバ機として常時稼働させる方が都合が良い。
2.については、録画PCは休止状態も安定しているので休止状態をメインで使う。
1.について、サーバとして稼働させるのに相性の良いLinux系でもPT2を使うことができるらしい
以上のことを考慮し、新サーバを作りたい、と考えました。

しかし、今のサーバ群は全てPCIスロットをそのまま使うことができません。
玄箱Pro(KURO-BOX/PRO)はそもそもPCIスロットがありませんし、
DNRH-001サーバはPCIの位置が特殊で使いにくい。
また、どちらもスペック不足(特にメモリ)。
そこでちょうどAtom D510シリーズが発売されたので、それを使って新サーバを組むことにしました。

構成は以下の通り。
マザーボード+CPU:ASUS AT5NM10-I
メモリ:DDR2-800 1GB*2=2GB
HDD:未定
ケース:MX1201-BK(岡谷エレクトロニクス、200W)
拡張ボード:earthsoft PT2
シンプル構成で考えました。
拡張ボードを付けられるケースで最小サイズと思います。
実はこれ、UPS(APC BR1200LCD-JP)の天面サイズと、ケースを縦置きしたときの幅がぴったり。思った以上に上手く配置ができました。

これからサーバの構築ですが、ここで新たな問題が発生しました。
サーバの問題じゃなく、それ以上の問題が。。。、。


 

ネットワーク構成を変更、ルータ2台を併用する荒技に

このエントリーをはてなブックマークに追加

今まで、1台のルータでマルチセッションを行っていましたが、
ルータの有効活用、安定性を考え、2台のルータを併用することに。
ルータの特性上、UPnPが使える/使えないの問題もありましたし・・・。

このとき、心配になるのはループ。
どこかでループ構成があった場合、永遠にパケットが行き来し、正常な通信が行えなくなります。

で、どうやって構築するか。
ルータ2台でマルチセッションを構築する場合、ONUとルータの間にHubを挟み、
分岐する必要があります。
また、2つのルータの配下を同一LANネットに配置するため、2つのルータ間をつなぐ必要があります。(繋がないと2つのルータ下のLANが分断されてしまうため、相互にアクセスが出来ない。)
実はループを心配していたのはこれ。ルータ下のLANを相互接続するとループ構成を描かないか心配だったのです。

んで、接続変更。
最終的に以下の構成ができあがりました。
net_kousei.gif

ルータ二台がそれぞれPPPoEセッションを張り、ルータ以下のLANをHubを介して相互接続。
ルータはそれぞれNetGenesis SuperOPT GFiveとWZR-HP-G300NH。
無線LANに接続中のDSもインターネットのみにつながる構成になっています。

負荷をある程度分散するため、鯖グループとPCグループ他は別のゲートウェイ
(ルータ)を通過するようにしています。

5ポートは以前からあるHubを使用しましたが、3ポートは新しく購入したBUFFALOの
これ>モバイル・コンパクト3ポートスイッチングHub| BUFFALO バッファロー
を使用しました。
これ、今回の使い方はひどすぎると思いますが、
実はこの製品、かなり使える一品です。
USBからも電源が取れるので、付属のLANケーブルでPCと接続し、残りの2ポートを使って、あるLANの間に挟めばそのネットワークを使えます。(も一つLANケーブル用意した方が良いかな)
故障解析等での現場での作業に最適な一品です。電源コンセント不要ですし。
ポートが空いていない場合が多いですからね、完成したネットワークは。

これで変わり種ネットワークが完成。
ついでにDHCP Failover構成を作っておきました。

しばらくこれで運用します。
外部含めてGigabitLAN構成になるまでは。

本当はInternetの利用を完全に負荷分散したいのですが、IPnutsによる構成か高価なルータが必要なようで・・・。
こればっかりはお金がないと出来ないので保留。


BUFFALO 3ポート コンパクトスイッチングハブ LSW-TX-3EP/CUB
バッファロー (2009-08-11)
売り上げランキング: 5635

レニる=Debian 5.0 lennyをKURO-BOX/PROにインストールするの巻

このエントリーをはてなブックマークに追加

今回、HDDのSMART情報が取れないことで有名なOEM版のHDDを積んだ
KURO-BOX/PROについて、今回、比較的エラーの少ないHDDへの換装を開始。

今回は、すでにリリースされていたDebian 5.0 lennyをインストールすることにしました。
このバージョンから、玄箱Proは正式対応のようです。

今回は、完全にエレキジャックさんのHPを参考にして作業していました。
http://www.eleki-jack.com/Kurobox-pro2/2009/03/debian-gnulinux-50-lenny.html

今回のlennyでは、なんとssh2接続でアクセスしセットアップを実行することが可能。
シリアルコンソールが不要になる「かも」しれません。

んで、一度目のセットアップ後、再起動するとなぜかTFTPブート待ちを永遠に繰り返す状態に。
u-bootブートオプションを修正してみたのですが、結局動作してくれず。
カーネルの読み込みに失敗している模様。

ならば、ということで、エレキジャックさんの所にあるパッケージを修正して、あらかじめある程度容量確保できるように変更、し、HDDのパーティションを空(全消し)に。
そして、sda2(2個目のパーティション)にルートパーティションを、sda1(1個目のパーティション)にext2ファイルシステムで/bootを設置。
他は適当に設定したところ、見事に起動完了。

意外と苦労しましたがこれにて完了です。
あとは各種ソフトのインストールです。
まあ、lennyになったからって特に気を張る必要はなかったですが・・・。
手順忘れてて焦りはしましたが。

HDDの交換 on Linux(Debian) with Dump/Restore/grub

このエントリーをはてなブックマークに追加

昨日から本日にかけて、旧HDD(WD3200JB)から新HDD(HD502HI)へのデータ移行を開始。
Samsung HD502HIを選んだ理由は、
・安さ(4980円ぐらいだった)
・別に容量は今以上ならそれほど重視しないが、だいたい釣り合いが取れるレベルのものとして500GBが妥当と
・回転数5400rpm(7200は熱くなるので却下)
・プラッタ容量(大きければ高速、軽量)
こんなところです。
プラッタ500GBならディスク1枚で軽いし、何より高速。
回転数は5400rpmで抑えられているので、発熱量が少ない、省エネ。
あとは安いんですよね・・・他に比べて。

んで、データの移行を開始。
相変わらずSmart Long Test→ゼロフォーマット。
その後、メインマシンにubuntu Linux CDブートを突っ込んでそこでfdiskにてパーティション作成。
/boot、swapはシリンダ数を同じにして、他をちょっと容量大きめにしました。
フォーマットはGPartdにおまかせすることに。
あと、/bootがあるパーティションにブートフラグを設定するのを忘れずに。
(fdiskコマンドでも出来る)

そしてそれぞれにディスクラベルを設定。(e2label /dev/hda1 /boot という風に)
この辺はいまのサーバと全く同じ構成になるように設定。

そして切り離し、USB接続にてサーバ(DNRH-001)に接続。
ここで、dump/restoreコマンドについて、以下のページを参考にしました。
この場を借りて厚く御礼を申し上げます。

無憂樹 HDD換装観察日記
Psychedelic Lodge ≫ Blog Archive ≫ LinuxサーバのHDD交換

これらを参考にしながら、以下の方法でバックアップを実施。
本来ならシングルモードでやるべきなんですけど、機材の関係上、リモート作業で行っているため、作業中はネットワークケーブルを抜く荒技を使ってます。
0.dfコマンド、cat /etc/fstabで今のパーティション構成を確認。
1./mntを作成(すでに出来ていたら空にする or umountでマウント解除)
2.旧HDDのパーティションに対応する新HDDのパーティションを/mntにマウント。
今回は/dev/hda5(旧)/dev/sda5(新)の対応になっていたので
mount /dev/sda5 /mnt
3.カレントディレクトリを新HDDに変更(cd /mnt)
これを忘れないでください。次のコマンド(resotore)はカレントディレクトリに展開するからです。
忘れると今のファイルシステムをぶっ壊すこともあります。

4.カレントディレクトリが変わったことを確認。
5.「dump 0uaf - / | restore xf -」を実行。
dumpコマンドのハイフンの後のスラッシュは、ルートフォルダを示しています。
ここ「/」は、バックアップする元の場所に応じて書き換えてください。
たとえば、/bootなら「dump 0uaf - /boot | restore xf -」

「-」は標準出力/標準入力を示しているようです。これをパイプでつないで、
dumpコマンドで出たデータを直接restoreコマンドに流します。
6.処理が終わったらcd / してumount /mntでアンマウント
7.これを必要な回数繰り返す。
/boot、/、/varと分けているなら、それぞれ移動元/移動先を確認しつつ、上のコマンドを実行する必要があります。

全てのパーティションのdump/restoreが終わったところで、HDDを付け替え。
今回はParallelATA→SerialATAへの移行なので、別途SATAD-IDEを使って変換。
今回は手持ちがこれしかなかったので・・・。

当然この状態ではブートが出来ない(grubがインストールされてないので)ので、以下のHPを参考にしてgrubをインストールすることに。
さすがに画面がないと難しすぎるので、ディスプレイ/キーボードを接続。
GRUBのセットアップ
GRUB のインストール

まずは、Super Grub Disk Homepageを使ってブートCDを作成。
USB接続CDドライブをサーバに接続し、CDブート。
grubが立ち上がるので、Webを参考にしながら、以下のコマンドを入力しました。
これは構成により変わると思いますが・・・。
grub> root (hd0,0)
grub> kernel /vmlinuz-xx・・・ root=/dev/hda5
grub> initrd /initrd-xx・・・.img
grub> boot
/bootのあるパーティションと/(ルート)のあるパーティションが違うので、
root=にてルートフォルダのあるパーティションを指定。
initrdも必要でした。(これがないとkernel panicが発生した)

無事に立ち上がったら、grubのHDDへのインストールを。
頭のパーティション構成が同じ、/boot/grubも生きていたので、
which grubでgrubコマンドを探し、
一応/boot/grub/menu.lstの内容を確認してから
grub実行→ルート変更 root (hd0,0)→setup (hd0)
successと出たら成功。quitで抜けます。

んで再起動。

きちんと起動できました。
しかも心なしか速くなってます(40MB/s→100MB/sですものねぇ)

HDD換装の大騒動もこれで完了。
2年は持つでしょう。

・・・逐次(差分)バックアップも考えるかなぁ。

故障するHDD・・・さすが梅雨時、です

このエントリーをはてなブックマークに追加

どうしても季節の変わり目は何かしら故障するようです。
今年はそれがHDDに集中しています。
さすがに都市伝説の崩壊・・・か?
まあでもまだデータが正常な機能復帰ができないレベルまで・・・って1回あったか。
しかし、これまでの故障の少なさは奇跡的とも言えます。

今回のHDDの故障疑いが出ているのは、
前回の記事にもあったST3750640AS
さらに、 ST3320620AS
あとは、サーバ用HDDのWD3200JB
前回のものを含めて4台です。

ST3750640ASについてはReallocated_Sector_Ctが4(Thresholdが0x36=54)のため、安全を見込んで代替HDDを準備し、すでに交換完了。
ST3320620ASについては、Current_Pending_Sector/Offline_Uncorrectableが各3。このため、一度0書き込みで様子見をして、上のHDDと交換するか思案中。ここは一応テンポラリレベルのHDDなのでまあ吹っ飛ぶこと前提で。

しかし、今回の最大の強敵はWD3200JB。
すでにReallocated_Sector_Ctが常識を越えた値を示していました。
(Thresholdの約4倍の値)
よくこれで完全復帰不能クラッシュ起こらなかったなぁ・・・と感心します。

こいつについては、ddコマンドでのセクタダンプでは危険と考え、他の方法を探していたら、dump/restoreコマンドでやる方法を発見。

・・・この辺は次回の記事に。

サーバのHDDの空き容量には十分注意しましょう

このエントリーをはてなブックマークに追加

本日副鯖(キャッシュDNS系担当)にて色々と作業をしていたら、なぜかメインマシンの
外部接続全般が不調に。
コマンドプロンプトでnslookupしてみると、どうもDNSが引けない模様。

ん?と思って、ふと今副鯖にて作業している内容(HDDを喰う作業)を思い出し、
duコマンド、dfコマンドを実行。

/ 13G/13G 100%
・・・・・
( д ) = ・ ・
だめじゃんw空き容量ないじゃんw
しかも、/home用に取っておいたドライブがどうもマウントされていない。
各種ログにもディスクフルエラーが記録されています。

これはいけません。
まずfsckで空きパーティションの状況チェック。
いきなり/homeはマウントできないので、別フォルダに空きパーティションをマウントして
/homeの内容をすべてコピー。
コピーが終わったら元の/homeの中身を削除。
(いきなりmvコマンドかけるとPermission Deniedの部分があったら困るため)

そして、/homeを起動時にマウントできるようにして再起動。
空き容量が一気に増えて元通りになりました。

・・・鯖復帰時に手を抜いたのが原因でした。

このあと、各鯖でローカルDNSの調整/DHCPの調整、連携を実施。
ついでにSambaでWINSサーバも。
これらを設定しておかないと・・・ねぇ。

これでかなりローカルが便利に。
手は抜くもんじゃないですね。

KURO-BOX/PROでAPC社製UPSを認識させる方法

このエントリーをはてなブックマークに追加

KURO-BOX/Pro(玄箱Pro)をAPCUPSDを使ってUPSを認識・制御させ、
同じUPSにつながっているマシンに停止信号を送るようにするべく、まずはUPSのUSBケーブルを
KURO-BOX/PROに接続。
しかし、エラーを出して認識していない模様。

kernelは2.6なので、以下のコマンドで確認。
cat /proc/bus/usb/devices
しかし、UPSだけはDriver=(none)となり認識していない模様。
この状態でapcupsd.confを設定しapctestを実行しても認識されていない。

ここで、webを検索して以下のページを発見。
miy's 雑記帳 KURO-BOX/PRO プリント・サーバー化http://miy.21.dtiblog.com/blog-entry-2.html
sushi-k日誌2 ≫ KURO-BOX/PRO Debian上でカーネルのセルフコンパイル(メモ)http://w3.quake3.jp/sushi-k/wp/?p=73
これらの情報に感謝しつつ、まずはモジュール化作戦。
.configを開いて編集、apcupsdのドキュメントを参考にしながら
CONFIG_USB_HIDDEV=y
とかを書き換え、モジュールのコンパイル開始。

・・・・しかし、HIDDEVはモジュール化されないため失敗。

仕方がないので、カーネルコンパイルを行う事に。
sushi-kさんが作成したカーネルソースはセルフコンパイル用にできていたので、
それらを参考にしつつカーネルコンパイル、コピー、新カーネルで再起動。
すんなり再起動して、きちんと認識してくれました。

これで動かなければMini-ITXでマシンを作るつもりだったので、そのお金が浮きました。
よかったよかった。

あとはネットワーク系の設定とかだな。

ddclientがうまく動かない@debian

このエントリーをはてなブックマークに追加

久々にサーバ関係の記事でも。

私のほうで管理しているサーバは、ダイナミックDNSサービスを利用して運営しています。
まあ、かなりトリッキーな方法で運営をしているんですけどね。

しかしここ最近、ルータの突然死らしき症状でつながらないことが多々発生し、
そのたびにルータの再起動をしているのですが、どうもダイナミックDNSサービスの
アップデートプログラム ddclientがうまく動いていない模様。
よく見ると、プロセスが「チェック待ち」で完全に固まっているようです。
つまり最初の1回しか更新できてない。

これではらちがあかないので、一回aptitude purgeで削除し、ソース・・・というか
http://ddclient.sourceforge.net/ に公開されている
最新版を展開し、使用することに。

展開し、ddclientを指示どおりにコピー。
confファイルをコピー&内容に従って編集し、アップデートテスト。
ファイル名を間違えるミスがあったものの何とか成功。

ここで、cronを使って更新作業を行うことに。
cron用のサンプルスクリプトも含まれていたので、これをコピーし、
10分ごとに定期更新、3日ごとに強制更新するように変更。

これで今のところ安定稼働しているようです。
きちんとsyslogにもメッセージ残ってるし。

しばらく様子を見守ります。
突然死の原因を探るのが先かも知れませんが。
(プロバイダの問題では無さそう。NTTの回線問題かも)

死亡の原因はマスカレードテーブル枯渇

このエントリーをはてなブックマークに追加

あれからメーカーと色々話し合ってある程度結論が出ました。
Super-OPT GFiveの再起動の原因。
結論は「IPマスカレードテーブル枯渇によるもの」のようです。
もちろん、真原因は究明中のようですが・・・。

んで、これの回避方法を。
1.まずDNSサーバ(キャッシュサーバ)をLAN内に準備します。
 私はKURO-BOX/PROにdjbdnsを使ってDNSサーバを作りました。
2.各マシンの問い合わせをこのDNSサーバに向ける。
 Windowsは省略。Linuxは/etc/resolv.confのnameserverの項目をそのサーバのIPアドレスに。
 その後/etc/init.d/network restartでネットワークの再起動を。
3.DNSの問い合わせ方法を通常通り、もしくはプロバイダのDNSへのFORWARDONLYにする。
 通常通りというのはDNSサーバがルートサーバに問い合わせて、たとえば.jpを管轄するサーバに問い合わせて、・・・のように通常通り名前解決をする方式。
 FORWARDONLYはプロバイダのDNSサーバに名前解決を丸投げする形。

この方法で回避できました。
ルータのProxyDNSサーバ機能を使わないで、とのことです。
(ルータのIPアドレスを指定しない)

よく見ると、秒間300回/のDNS問い合わせのUDPが発生していたようで。
そりゃ厳しいわな・・・。

なにはともあれ、回避方法も分かったので一安心です。

Apache2でアクセスログが取れていない、その原因は・・・?

このエントリーをはてなブックマークに追加

Apache2のログが取れていません。
errorログのみが取れている状況です。
今までこんなことはなかったので、驚いています。

そこで、/var/log/apache2/を確認。
数分経っても、何らかのアクセスをしても0バイトのまま変化しません。
消しても再生成される気配もなし。
なんでじゃ?

で、相変わらずwebで情報収集。
Apache2のマニュアルを見ると、ログ関係は
ErrorLog、CustomLog、LogFormatの3つのディレクティブが関係していそうです。
Errorlogはきちんと取れているので放置。
調べていくとどうもCustomLogがありません。

そこで、Apache2をインストールした直後はどうなるかを見るため、
別のサーバ(apache2インストール前)にてインストール後defaultを確認。
すると、CustomLogが残ってあるじゃないですか!

Webminで手抜きをするとダメね・・・。
肝心な部分までも消してしまうんだものね・・・。

CustomLogで指定してやると、見事にアクセスログが取れました。
よかった・・・。

これでとりあえず復帰かな。
あとはmrtg,webalizer(webdruid),snmp,ftpともりだくさん。
いつ終わるのやら。

まあそれが終わったら次はバックアップ対策なんですけどねorz

LinuxでUPSを管理するdaemon、apcupsdを使う

このエントリーをはてなブックマークに追加

UPS一台でサーバ/メイン/サブ/ルータその他の電源管理は限界だと感じ、
昔使っていたAPC APC ES 500 BE500JPを復帰させることに。

こいつでサーバ1台を集中管理します。

んで、このAPC UPSをなんとかLinuxで管理できないものか。
そこで、genpowerのキーワードで検索していると、なんとAPC UPSの管理用に
apcupsdというdaemonがあるとのこと。
Windows、Linux、Macに対応し、ネットワーク経由で複数のマシンに情報を渡すことも可能とか。
これはすばらしい。

そこで、早速apcupsdをinstall。
aptitude install apcupsd
(あとでソースから入れ直しました。)

APC ES 500はUSBケーブルにて接続しているので、
/etc/apcupsd/apcupsd.confを,以下のように編集。
※編集した部分のみ書いています。

UPSCABLE usb
UPSTYPE usb
DEVICE
TIMEOUT 300

これで、apctestを実行・・・しかしFATAL Errorで蹴られます。
なんで・・・?と/devを見るとUSBデバイスとして認識されていません。
うーん・・・と思って、本体を見ると、
なんと
※つながって※いませんでしたorz
そりゃ無理だ。

んで、USBケーブルを接続して再度チェック。
apctestで認識されたので、今度は
/etc/init.d/apcupsd start
して
apcaccess status
で状態を確認。
認識されたので、今度はコンセントを抜いて動作テスト。
きちんと5分後shutdownされました、
ES500なら40分ほど耐えるようなので、十分でしょう。
さあつぎはサーバの他の設定だ。
まずはapache2だけでも・・・。

つぎはサーバが死亡、やはり停電が原因・・・

このエントリーをはてなブックマークに追加

次はサーバーが死亡しました。
DNRH-001に最初から搭載している簡易UPSでは、
どうもバッテリが死んでいるらしく、1秒と持たないようです。
それが原因からか、コンセントを抜くと即電源が落ちてしまいました。

そして、ついに起動不可に。
いきなりError15を出してgrubが落ちています。
どういうことだ・・・

ということで、まだ持っていたubuntu 8.0.4LTRのディスクでCDから起動を試みました。
なんとか起動し、ディスクの内容を除いてみると衝撃の事実が。

なんと、/etc、/boot、/var、/tmp、/rootがすべて消失しています。
つまり、ほとんど何も残っていません。
これでは起動するはずがありません。
しかも設定ファイルやログファイルなどが消えています。
これは致命的なダメージです。
1年間のログデータがすべて消失したわけですから・・・。

嘆いていても仕方がないので、まずは無事だった/homeフォルダの救出に。
しかし、ubuntuのCD起動はsudoを許し、su rootを許可しない。(というかrootのパスワードが不明)
これではデータの救い出しがままなりません。

そこで、各サイトを回ってみると、
sudo passwd rootでrootのパスワードを無理矢理変えればいいようです。
これは盲点。たしかにその通りだw

そしてrootになり、tarballを作って他サーバ、Windowsにftpで転送。
データを救い出したところで、いよいよ再インストールと相成りました。

linuxはマジで停電に弱いです。
ext3ジャーナリングファイルシステムが相当のダメージを受けています。
よほどフリーズしてにっちもさっちもいかない状態でない限り、電源強制断はオススメしません。
可能な限りshutdown/halt/rebootの使用を推奨します。

玄箱Pro不調の原因は本当にHDDかよ?!

このエントリーをはてなブックマークに追加

ここ最近、玄箱Proの調子がおかしいです。
再起動してあげると、警告音とともに、DIAGランプが6回点滅。
この警告は、HDDエラー関係です。

そこで、何度か再起動して、さらにSCON-KIT/PROで接続して起動プロセスを見ていると、
なぜか数回に一度、何事もなく起動する。

そこで、何事もなく起動した時を見計らって、fsckをかけてHDDエラーをチェックすることに。

すると、なぜかとんでもないエラーの数々。
サイズ異常報告(0byteなのになんと1EB(10^18)以上の表示)とかわけがわかりません。
最初は手動でyes(修復)していたのですが、途中で面倒くさくなって自動修復に切替。
しかし、ついには修復できずに音を上げてしまいました。

結局、ディスク交換することに。
手持ちの160GB薄型と取り替え・・・あら?
中に入っているのも同じだ(汗)

どうりで壊れやすかったのか・・・。

あ、壊れやすいのと交換したからまた壊れるかもw

Debianをインストールし、鯖設定し、その他いろいろ・・・

このエントリーをはてなブックマークに追加

今日いつまで激しく作業していればいいのやら。
最初からいろいろインストールしておくと後が大変なので、最初は最低限の状態にして、
必要なものをインストールすることに。
まずはssh、そしてDNS、DHCP。NTPも。
今サブサーバに移行している機能をそのまま移行し、サブはキャッシュサーバに。
測定用にSNMP。これがまたも苦労した。コミュニティ名とホスト名は完全に一致(サブネット指定ならその範囲内のIPアドレス)
していないと全く受け付けてくれないとは・・・。
なんか前回もこれで苦労した気が。

あとは、mrtgとApache、Webdruid。
・・・あれ?
ftp忘れてたよ・・・。

備忘録代わり

ubuntu linux、インストールできず・・・

このエントリーをはてなブックマークに追加

DNRH-001にubuntu linuxをインストールするべく、インストールディスクを作成。
USB接続のCD-ROMを使い、インストールすることにしました。
このマシン、OSが起動しないとUSB1.1接続でしか認識しないようで、非常に遅い。
それでもかまわないので、インストールを実行したところ、なぜかプログレスメーターが固まる。
そのまましばらく放っておいたら、なんと突然大量のエラーメッセージが。
どうもエラーが出たまま先に進むことはできなさそうなので、インストールはあきらめることに。
しかたない、ここは名刺サイズのデータ量でもインストールできるdebianにしますか。
ネットワーク関係はKuro-BOX/PROに移してあるのである程度はできますし。

DNRH-001、届く!

このエントリーをはてなブックマークに追加

玄箱HGの故障のため、注文しておいたファンレスマシン、DNRH-001。
ちょっと図体は大きいものの、簡易UPS搭載、全体的な性能も上です。
唯一GigabitLANでないのが悔やまれますが、LANポート2個搭載。
さらにWindowsXP Homeがついて19999円(けっこう安いイオシス)。
かなり安価です。
ちゃんとVGA、USB*4、PS/2*2、サウンド機能もあります。
調べによると、どうもレジなどのPOSシステム系で使われていたものだとか。
ファンレスなのも納得です。

さて、システムのバックアップが終わったら、ちょっと改造を加えて使いますかね。
Gigabyte i-RAMに使っていた512MBのDDR-DRAMに差し替えて、さらに、
ファンレスではHDDあたり(直下に電源がいて熱源になっている)が危なそうなので、
12cmの静音ファンを取り付けることに。
HDDとの隙間がないので、M3の長めビスで固定しました。
HDDに吹き付ける方向です。

サーバ、2台とも死亡!サブは何とか復帰したが・・・。

このエントリーをはてなブックマークに追加

私が管理している自宅鯖(管理は当たり前か)が、2台とも吹っ飛びました。
fsckに耐えられなかったようです。
・・・というわけでもなさそうですが。

一応、サブであるKURO-BOX/PROのほうは、強制電源断/電源再投入で復帰してくれましたが、
メインであり、不具合バリバリのKURO-BOX/HGのほうは完全に死亡。
HDDの故障というわけでは無さそうです。HDDエラーLED(赤色点滅*5回)ですが、どう見ても違うので。

一応、HDDのフォーマットや交換を計5回ほど繰り返しましたが、EMモードで復帰したのは3回だけ。
そのいずれもが通常モードに移行できず死亡。
100回ほど電源スイッチを押したかな・・・40回ほどは電源を入れ直した気がする。
ガワを取り外して様子を見ると、Realtekチップが異常に熱い。
Realtek Semiconductorの「RTL8110S」らしいのですが、こんなに熱くなるものか?
USB-Aコネクタを分解したものをヒートシンク代わりに付けてみたのですが、正直殆ど何も変わらず
どこでも温度計の計測では60℃付近をふらふら。
LANケーブルをつなぐとノイズが出るし・・・。

しかし、多分原因はこれでしょう・・・。スペックシートがないから分からないが・・・。

でも、どうにもなりません。
起動しないわけですし。

仕方がないので、サブ鯖にメインサーバでやっていた2つの機能を移行したものの、今の状態では非常に怖い。
なので、かつて検討していたMini-ITXマシンである、DNRH-001
(株式会社イオシス販売、http://iosys.co.jp/shop/event/dnrh_001/)
を購入検討することにしました。
LANが100Mbpsなのが気になりますが、Webサーバとファイル転送時でない限りGigabitが無くても大丈夫かな・・・と。
さて、注文かけますか・・・。

Debian on virtualPC2007

このエントリーをはてなブックマークに追加

今私が管理している各サーバは画面を持たないサーバ群なので、管理が大変です。
telnet/sshでつなげばいいのですが、文字入力とかで一部微妙な部分があったので、
せっかっくVT機能を持ったCPUを持っているので、VirtualPC2007上でDebianをインストールしてみることに。

LANポートが2つあるマシンなので、一つをPC用、一つをvirtualPC用にすることに。
virtualPC用のほうはコントロールパネルのネットワーク接続で、Virtual Machine Network Service以外のチェックを全て外してWindows上では認識できないように設定。
この状態でDebianのネットワークインストールイメージをマウントし、インストール作業開始。
x-Windowシステムでちょっと不具合出るも、設定変更で無事解決。
直し方とかはここ>http://d.hatena.ne.jp/hake/20070901/p1
とかここ>http://luke.skr.jp/hsj/?VirtualPC%2FDebian%20Etch
とかを参考に(感謝)

んで、動かしてみたのですが、正直爆速すぎますって・・・。
今まで遅いのになれすぎたせいか、Webmin、aptitudeとかの反応も驚異的。
どんだけ今まで遅かったんだよ・・・。

緊急用のサーバとしても使えそうです。
良い感じ。

nano+SSH接続で画面が分裂する問題(未解決)

このエントリーをはてなブックマークに追加

こちらはまだ解決していないので、皆様に有力な情報を提供できないのが残念なのですが、
ページエディタ nanoとsshを併用すると、1ページ以上スクロールした時点で画面の半分しか更新されず、
表示が無茶苦茶になってしまいます。
ただ、ファイルの内容には影響はないようです。

何でこの現象が起きるんだ?と思って、旧鯖 玄箱HGに接続すると、こちらは問題なし。
また、玄箱Pro+シリアル接続だとこちらも問題なし。
SSH接続のみのようです。

そこで、さらなる調査をすることに。
玄箱HGにおけるnanoのバージョン:1.2.4
kuro-box/Proにおけるnanoのバージョン:2.0.7
このバージョンの違いに何かありそうです。

しかし・・・これ以上解決することができず。
最初からコンパイル/メイク/インストールをしてみたものの、症状は改善せず。

いったいどうしたら解決するんだ・・・。

ProFTPdで認証までに長い時間がかかる問題

このエントリーをはてなブックマークに追加

私の管理する鯖ではいまFTPサーバソフトとしてProFTPdを使用しているのですが、
これに接続しようとすると何故か認証に長い時間がかかります。
最悪の場合、タイムアウトすることも・・・。

いままでこの現象について探していたのですが、その当時は原因および解決方法を探すことはできず。
しかし、ここ最近になってその解決法が記載されているページを見つけることができました。
そのサイトはこちら>
掲示板の情報:http://sakaguch.com/PastBBS/0015/B0008323.html
サイト:http://www.aconus.com/~oyaji/ftp/proftpd.htm
この情報を掲載してくれた/書き込んだユーザーに感謝します。

で、その解決方法とは。
UseReverseDNS off   (DNS逆引きを停止:時間短縮にはさほど効果なし)
IdentLookups off     (Identの停止:xinet.d設定の変更によりパラメータが有効になる。効果絶大)
を、proftpd.confに追加するというもの。

これを設定すると、1秒以内に認証画面になるようになりました。

しかし・・・正しい解決方法はないものか?
ちょっと気になります。

rrdtoolでMRTGの代わりをさせる。

このエントリーをはてなブックマークに追加

MRTGに見切りを付けて、rrdtoolにてその代わりをさせることにしました。
もうデータふっとびはこりごりです。

なにせ、rrdtoolにすると、MRTGのデータ取得をrrdtoolに切り替えるだけで、
・20%ほど軽くなる
・ログ用のスペースが一定(容量固定)
になるんですよ。

んで、各種ページを参考に、MRTGのデータ記録領域をrrdtoolに変更。
・・・あ、グラフ書かれないんだった。

そこで、mrtg-rrd、14allを使おうとしたものの、いずれもオンデマンド生成。
さらに、mrtg.cfgへのアクセス許可が要る。
そして、パスワード認証領域に置くと、なぜか認証が終わらない(何回も認証要求が出る)
・・・使い物になるか?!

そんなわけで、グラフ作成を自力ですることに。
一応、1日分の簡単なグラフは書けるようになりましたが、
正直GPRINTとPRINTが全く動作してくれません。(これを使うとsegmentation fault、セグ落ちしてしまう)
つまり、数字(今のデータ)が書けないのです・・。
なにか間違っているんだろうか・・・。

フロントエンドを使うのも良いが、ある程度決まったデータしか取れないし・・・。
なにより無駄に機能追加することになるので、玄箱にはつらい。

自力でがんばるか・・。

続きを読む - rrdtoolでMRTGの代わりをさせる。

MRTGのログが飛ぶ問題・・・だれか・・・

このエントリーをはてなブックマークに追加

MRTGのログが記録されない(グラフが描かれない)問題で、
一応グラフが描かれない問題は解消されたものの、結局ログが飛ぶ問題は解消されず。

Webで検索しても該当する文書は全くなし。
ただ、一つだけ光明が。

それは、同じmrtgの作者が公開しているrrdtool。
「ラウンドロビンデータベース」を作成して記録するそうです。
ちょっと手間が増えるけれどもmrtgにも使用可能とか。

・・・検討してみるか。

mrtgのログ故障問題とその簡易対処

このエントリーをはてなブックマークに追加

私が管理しているサーバには、mrtgをインストールしているのですが、
このmrtg、なぜか不定期にログが飛ぶ。
正確には、ログをmrtgが認識せず、結果としてmrtgの解析がそこで停止しているのである。

この原因を探るべく、mrtgのエラーログをあさっていたら、どうもログ内の日付が逆転しているらしい記述を発見。
そこでログを見ると、どうも先頭の列が日時管理らしく、ここが一部桁落ちしたり何故か桁増加したり、項目が少なかったり逆に多かったり、という症状が見受けられた。
そこで、今まで手動修復していたのだが、これを自動でやる方法はないものか。

そこで、以下のスクリプトを組んでみることに。
#!/bin/sh
sleep 60
pushd /var/log/mrtg/

LOGFILENAME=cpu.old
if [ -e "$LOGFILENAME" ]
then
grep ".*" -m 1 $LOGFILENAME >old_$LOGFILENAME
grep "[0-9]\{10\}[[:space:]][0-9]\+[[:space:]][0-9]\+[[:space:]][0-9]\+[[:space:]][0-9]\+" $LOGFILENAME >>old_$LOGFILENAME
mv -f old_$LOGFILENAME $LOGFILENAME
fi

LOGFILENAME=cpu.old
に、全てのログファイルと一個づつ記載して、同じ物の繰り返し(笑
やっていることは、mrtgが記録している各データのログの形式を参考に、
・1行目はそのまま出力
・2行目以降は定型フォーマット(10桁数字-space-任意桁数字-space-任意桁数字-space-任意桁数字-space-任意桁数字)
をgrepで検索して正しい物だけを抽出。

これでしばらく様子見です。

LinuxをメディアサーバーにしてXBOX360からアクセスしてみるテスト

このエントリーをはてなブックマークに追加

せっかくXBOX360を購入したので、何かゲーム以外の使い方はないものか。
そういえば、WidnowsMediaConnectの機能があるな・・・。
メディアサーバーにアクセスしてそこから再生できないかな?

とかんがえて、googleでXBOX360からメディアサーバにアクセスする方法を探してみることに。
すると、uShareを使用すればいいようである。

しかしこのセットアップが非常に大変でした。詳細は「続きを読む」から・・・


続きを読む - LinuxをメディアサーバーにしてXBOX360からアクセスしてみるテスト

mrtgでKURO-BOX/PROのHDDの温度を取る方法

このエントリーをはてなブックマークに追加

玄箱Pro(KURO-BOX/PRO)で、HDDの温度を記録してMRTGでデータ収集されている方は多いと思います。
しかし、今現在インターネットで公表されている殆どのサイトでは、
「??のエラーは出ますが無視してください」というメッセージが書いてあります。

このなかで、「過去のログファイルがない」「現在のログファイルがない」のエラーはまあ初回起動時は出ますが、
このほかに、「HDDのデータは一つしかないので、OUTデータについてエラーが出るが無視してください」というのもあります。
少なくともこれは回避可能では?と思い、mrtgが収集するデータ構造を探ることに。

すると、以下の構造であることを発見。
100[enter]
250[enter]
つまり、1行に数字だけのデータ、それが合計2行ある。
この形になるよう出力すればいいのである。

そこで、以下の方法をとることに。
ただし、これは玄箱Pro(KURO-BOX/PRO)のみ可能と考えてください。

条件:miconaplがカスタム版であること。
標準装備のmiconaplは玄箱独自の物のため、googleとかでmiconaplの代替品/代替方法を探してください。
例:http://www.nk.rim.or.jp/~jun/kpro_memo/kpro_micon.html
例:http://nice.kaze.com/kuro-box-pro.html
条件2:smartmontoolsがインストール済み、設定済みであること
以下のサイトを参考にしました。
http://kuroboxpro.blog114.fc2.com/blog-entry-15.html

さて方法です。
1.温度データを測定し、データ出力をするシェルスクリプトの作成。
/etc/temp.shを作成(名前・場所は任意でも良いけど)
temp.shの中身を以下のようにする。

smartctl -d marvell -a /dev/sda | grep -i temp | awk '{print $10}'
miconapl -a temp_get |grep 'temp=' | sed -e 's/[^0-9+\.]//g'

2.mrtg.cfgを修正
HDDの温度測定部分のみ示します
# HDD Temperature
#Target[hddtemp]: `smartctl -d marvell -a /dev/sda | grep -i temp | awk '{print $10}'`
Target[hddtemp]: `/etc/temp.sh`
MaxBytes[hddtemp]: 100
Title[hddtemp]: HDD Temperature
PageTop[hddtemp]: <h1>HDD Temperature</h1>
Options[hddtemp]: growright,absolute,gauge,nopercent,noinfo
WithPeak[hddtemp]: ymw
YLegend[hddtemp]: Temperature
ShortLegend[hddtemp]: C
LegendI[hddtemp]: Temp:
LegendO[hddtemp]: Temp(MiconAPL):
Legend1[hddtemp]: HDD Temperature in Degrees Celcius
Legend2[hddtemp]: HDD Temp on miconapl

3.念のため、mrtgの過去のログファイルを削除または別フォルダに移動
4.mrtg実行

これでエラー無くデータを取れるようになります。

ちなみに、smartmontoolsとmiconaplで取得できる温度には差があります。

前者はHDDのSMART情報、後者はマザーボード上の温度センサであるためです。

MRTG(SNMP)でCPUとメモリの状態が取れない、その解決法

このエントリーをはてなブックマークに追加

今日、MTGで取得したデータを見ていたら、ネットワーク関係のデータが明らかにおかしい。
そこで設定関係を見直したら、なんと前のマシンに対してデータの取得をかけていた模様。
設定ファイルをそのままコピーしていたのがあだとなりました。

そして、設定を修正して再度データの取得を試みると、今度はCPUとメモリの状態が取れていない。
そこで、動きを注意深く観察することに。
mrtgの実行ログを見ると、どうやらSNMPからのデータが取れていない。
SNMPのログを見ると、SNMPからの反応がない「No Response from localhost」との回答。

ここで悩むこと数時間。
SNMPの設定以外でアクセス制限はかけていないので、ほかに見るところがない。
googleで検索していたら、同じような症状に陥った人を発見。
そこによると、以下のように編集したらいいようです。

1.SNMPの起動状態を確認する。
$ ps ax | grep snmp
28896 ? S 0:00 /usr/sbin/snmpd -Lsd -Lf /dev/null -u snmp -I -smux -p /var/run/snmpd.pid 127.0.0.1
29057 pts/0 S+ 0:00 grep snmp

2.上記の結果の中、snmpを起動するコマンドライン中に127.0.0.1が含まれた場合は、以下の修正を行う。
(上記の結果は含まれているので以下の修正を実行)
/etc/default/snmpd 
の中から、
SNMPDOPTS
の行を探し、
127.0.0.1
の部分を削除。

3.snmpdを再起動
/etc/init.d/snmpd restart

これで、データを取れるようになりました。

しかし、原因がわからないのも気分が悪いですな。解決したのはいいのですが・・・。

半田付け、へたくそになったなぁ・・

このエントリーをはてなブックマークに追加

そして届いたシリアルコンソールキット、SCON-KIT/PRO。
しかし、半田付けに異常に手間取ってます。

久々にやったら、半田ブリッジをやってしまいました。
半田吸い取り線を勝っておけば良かったか?と後悔。

しかし、常識を越えた方法で無理矢理直しました。
ブリッジ部分をラジオペンチで掴んで薄くして、はみ出た部分をはさみで切断。
これで半田量を少なくして、再度熱して溶かし、ブリッジを解消。
我ながら、とんでもない修復方法だな・・・

そしてテスターで測定。
まあ、ブリッジ状態の確認ですが。

すると、一箇所反応がおかしい。
よく見ると、空中を極細の半田でつながっていたので、はさみで切断。
その後、シリアルコンソールキットを接続したところ、見事に成功。

苦労した・・・。
久々に。。。

あとは設定の移行か。
いつ完了するんだ、本当に。

シリアルコンソールキットは必要かも・・・。

このエントリーをはてなブックマークに追加

Kuro-box/Proを購入し、色々なサイトを参考にDebian etch化を実施。
しかし、いきなりwgetでこけるとは・・・。
どうも、nsswitchが邪魔をしているらしい。
これはWindowsからファイルを転送することによって解決。

そしてetch化を完了。
玄箱HGではどうしても出来なかったのよね・・・。何故か・・・。

そして、システムのバックアップとかを取ろうとしたら、どうもu-bootの起動設定をいじる必要があるとか。
それはシリアルコンソールキットがないと難しいそうです。

ううむ・・・やはり必要なのか。
しかし、この付近で売っているところがない。
仕方がないのでtwotop通販で購入します。
安価だし、在庫もあったしね。

玄箱Proに、謎のコネクタがあって、そこからもシリアルコンソールかを出来るのですが、そこまでの加工の腕がないのと、常時接続に向かない(底面にあたる部分なの)ので、これは実施しないことに。

いろいろ手間がかかってます。

何故か玄箱Proを購入

このエントリーをはてなブックマークに追加

なぜか今日、LANボードとともに玄箱Pro(Kuro-box/Pro)を購入。
ついでに安い160GBのHDDを。
HDDの方が安いんだよな、実際。(玄箱Proが18000円前後、HDDが6000円弱)

というのも、今の玄箱HG、いつ死ぬか分からない状態で稼働しているのです。
実際、いままでに数回Apacheが固まったのか、無反応になることもしばしば。
ついでに他のサービスを巻き込み死んだ状態になることも。(一応telnetは動いていたが)
ならば、最初からLINUX BOXである玄箱Proにしてしまおうではないかと。

このときはまだ後の苦労を知らなかったのです・・・。
単純に移し替えで済むかと思いきや、まず共存状態を維持しなければならないのよね。

さて、いつ完了するのやら。

コンピュータ名とWINSとSAMBA

このエントリーをはてなブックマークに追加

先週、DNSとDHCPにてコンピュータのIPアドレスと名前の管理を行ってきましたが、
Windowsと親和性の高いのは、やはりコンピュータ名そのものです。
ワークグループ内のコンピュータの一覧は、コンピュータ名でしか普通出ません。

このコンピュータ名の管理を担うのが、WINSです。
WINSでのコンピュータ名の収集・管理には条件があり、
1.サーバマシン(Windows2000Serverなど)がある場合はそこが管理(マスタブラウザとなる)。
2.サーバマシンがない場合は、Windows2000以上の、そのワークグループ内で最初に起動されたマシン
が管理することになっているようです。

2.の場合、そのコンピュータがダウンすると、約15分の間、コンピュータ名の一覧が出なくなるようです。

ここで、このサーバ機能をLinux(玄箱)で実現できないのか。
とおもってSAMBAの設定を見たら、WINSサーバとして稼動可能との設定を発見。
早速有効にして、DHCPでのIP配布時にもWINSの設定を提供するようにしました。

すると、きちんと玄箱でマスタブラウザとして機能し、そこで集中管理できるようになりました。

これでさらにネットワークが使いやすくなりました。
問題は玄箱が落ちたときかも・・・(汗

DDNSモード(DNSとDHCP)の時の注意

このエントリーをはてなブックマークに追加

今までの各種設定を経て、
サーバは常に固定IPアドレスを配布
他はDHCPによる自動割り当て、
そしてそれをDNSサーバに転送して自動的にPC名とIPアドレスを登録させる、
いわゆるDDNS動作をさせることにしました。

しかし、一部のマシンのマシン名が登録されません。
なぜかWindowsXPマシン2台だけが登録されないのです。
他のWindowsVistaマシンとWindows2000マシンの方はちゃんと登録されるのに・・・。
なぜか逆引きレコードしか登録されないのです。

そこで、該当のマシンのワークグループ名を見直してみました。
すると、なんとワークグループ名がデフォルト(WORKGROUP)。
正常に登録できたマシンは別のワークグループ名になっているので、ここが問題と判断。
また、ネットワーク接続のTCP/IP設定を見直すことに。

詳細設定の「DNS」で、
・プライマリおよび接続専用のDNSサフィックスを追加する
・この接続のアドレスをDNSに登録する
にチェックを入れ、他は外すか空欄にしてみました。

リースタイムの関係か、すぐには反映しなかったので、
dhcpd.leases、およびBINDのジャーナルファイル(ドメイン設定ファイルと同じフォルダにある.jnl)をリネームして、dhcpdとnamedの再起動をしました。

すると、やっと登録されました。
良かった良かった。

思いつきでインストールは大変ですよ。みなさん。

再起動で何故か直った玄箱

このエントリーをはてなブックマークに追加

結局、DNS正引き問題は全く解決できず。
ついに、私の玄箱HGでは禁断の手段、再起動に打って出ました。

私の玄箱は、再起動を一度実行すると二度と復帰しないことで有名です。
ちょっと設定を加えただけで(Apache2をインストールしただけ、など)すぐに再起動できなくなるのです。

案の定、やはり再起動に失敗。
別の何もデータのないHDDを付けて起動をしてみて、起動に成功するのを見計らって、
元のHDDを接続。
その状態でLANケーブルを接続しないで起動することを見てから、ケースを装着。
そして元の電源コンセントに接続。
すると起動に失敗。

・・・やはり・・・修復しないといけないのか・・・。
と思って、玄箱HGを私の耳に直接接触させて、HDDのアクセス音を直に聞くことに。
すると、なんと起動するではありませんか!!!!!
なんと・・・しかしなぜ・・・


私の玄箱HGは私と接触させた状態で起動しないと、起動してくれないようです。
よく分かりません。

DHCPはうまくいったのだが、DNSがうまくいかない・・・。

このエントリーをはてなブックマークに追加

一応、DHCPの設定は完了し、きちんとIPアドレスが配布できることを確認。
しかし、DNSの方がうまくいかない。

まず、PC名とIPアドレスの逆引きは成功。(ただしドメイン名で)
正引きも成功。
しかし、外部のドメイン名となると一切成功しない。
googleで検索してみると、forwarderオプションにて外部のDNSに問い合わせを転送することが出来るようです。
しかし、設定をかけた後にDNSサーバを再起動しても全く直らず。
digコマンドで外部のDNSサーバを指定して検索をかけてもダメ。

・・・あれ?
そもそも外部のDNSと通信できてない?
と思ってルータのIPアドレス(簡易DNS機能付き)を指定するも、やはりダメ。

いったい原因は何なんだ・・・。

D・N・S!D・N・S!

このエントリーをはてなブックマークに追加

私のマシン群は1台が固定IP、他が変動IP(DHCP)にて設定しています。
しかし、時々コンピュータ名でIPが探し出せないときが。
WINSの関係もあるのでしょうけど・・・。

それならば、せっかく玄箱HGというLinuxサーバがあることだし、こいつにDHCPサーバを任せて、さらにこいつでDNSサーバを起動し、簡単にIPアドレスを引けるようにしようではないか、と思いつきました。

基本的に、LANカードのMACを調べ、一致する物には固定IPを配布するように、DHCPを設定してみることに。

ここで一つ問題が。
LANカードのIPは、該当パソコンを起動してIPCONFIGなどで調べられます。
無線LANでも、たいていはそのカードに書いてあります。

しかし、液晶テレビには、どこにも記述してある箇所がありません。
さあ、どうやって探すか。
どうも、この液晶テレビ LC-32BD1は、普段はインターネットに接続しない模様。
なので、普段は検索できません。

そこで、わざとインターネット接続を発生させてみることに。
これはNHLデータオンライン(デジタル放送のデータ放送を利用)
玄箱DHCPサーバにてIPを配布しているので、そこでIPアドレスを確認。
そこに記述されていました。

もう一つは、液晶テレビのIPアドレスを確認する。もしくは固定する。
その状態で、まず一度インターネットに接続させ、その後数十分以内に別のマシンから
該当のテレビに対してPINGを発行する。
そして、次のコマンドを実行する。
arp -a
これを使うと、先ほどまでに通信していたマシンのIPアドレスとMACアドレスの対応が出ます。
これを参考にします。

さて、今後の設定、うまくいくのだろうか・・・。

玄箱、復帰の見込みが立った?

このエントリーをはてなブックマークに追加

ここ数週間、さんざん悩まされてきた玄箱。
そろそろ解決方法が見いだせてきた気がします。
どうも私の玄箱HGは、EMモードに一度はいると、二度と通常モードに戻ってはくれないようです。
戻すには、HDDの消去→ルート(システム)パーティションの全消去→セットアップが必要なようです。

この修復をするにあたり、色々なサイトを見て回りました。
そのサイトの方々には感謝の意を。

「続きを読む」をクリックすると、私が行った作業内容が見れます。
ほんの一部ですけど・・・。

続きを読む - 玄箱、復帰の見込みが立った?

やっぱり立ち上がらない玄箱

このエントリーをはてなブックマークに追加

結局あの後一つ手を加えるだけで死亡。
HDDの消去を何度やればいいんだよ・・。
そのたびにログが飛ぶ・・・。

そもそも、etch(Debian4.0)へ更新しているのが原因かも知れません。
4.0は安定運用報告自体が少ないですしね・・・。
あまりメリットがないようですし。

この辺結構難しい問題なのよね・・・。

立ち上がらない玄箱、そして

このエントリーをはてなブックマークに追加

ついに玄箱が立ち上がり失敗。
何度やっても起動してくれません。かならずDIAGが6回点滅します。
LANケーブルを抜くとたまに起動してくれるのですが、そんな不安定な状態をいつまでも許すほど私は気が長くありません。

そこで、インターネットを駆使して、まずEMモードへ変更し、再セットアップするも、何かが足らないらしく、起動してもアクセスできない、さらにまだまだ起動失敗を繰り返す。

もうこうなったら、と思い、ちょうど480GB combine→750GB(ST3750640AS)へと移した際に余った160GBのHDD(WD 160GB)に入れ替えるとこに。
そして起動・セットアップ。
前よりもスピードアップしてます。さすがに容量が上がっただけあります。コッチの方が新しいしね。

あとはアップデートか・・・。

ちなみに。
玄箱うぉううぉう♪にて提供されているdebianパッケージ、そのままだとwoody(3.0)です。
そこまでのセットアップ方法は別のサイトにお任せするとして、
(参考:http://www.ellinikonblue.com/PukiWiki/index.php?Debian%20%B8%BC%C8%A2%A4%CB%A4%B9%A4%EB
source.listをたとえば以下のようにして、
deb http://ring.sakura.ad.jp/pub/linux/debian/debian/ sarge main contrib
(他は#を頭に付けてコメントアウト)
まずsarge(ver3.1)にアップデート。
apt-get update
apt-get dist-upgrade
で進めます。
後は私は以下のサイトを参考に進めました。
http://www.bnote.net/kuro_box/kuro_debian_sarge.shtml

後はうまく立ち上がってくれるか。
まだetch化が残っているけどね・・・。

アクセスログ解析失敗の真犯人は?

このエントリーをはてなブックマークに追加

昨日のアクセスログ解析失敗。
原因が判明いたしました。わざと404エラーを出して。
それは、「Apache2でない、別のHTTPDが立ち上がって、Apache2が起動失敗」していたというものです。
そのプロセス名は、「thttpd」。
玄箱の管理用としても使っているシンプルなWebサーバソフト。
それの設定がいつの間にか復活し、ポート80を占有してしまっていたようです。
これでは確かにApacheが起動できません。

設定を変更し、thttpdをポート99999(起動不可能)にしてみたら起動しなくなりました。
まあ、生かしておいてもいいのですが・・・。

んで、アクセスログがまた取れるように。
thttpdのアクセスログはあまりにも少なすぎるため、使えないと判断して破棄しました。

この間に起動失敗が十数回。
何が起こっているんでしょう。
コンソールが見れないので何とも掴みようがありません・・・。

アクセスログが更新されません

このエントリーをはてなブックマークに追加

私が自宅で建てている自鯖。
HTTPアクセスのみ公開し、そのアクセス解析を行っているのですが、そのログが数日前からぷっつりと途絶えてしまいました。
ダウンロードは明らかにあるはずなのに、0。
これはいったいどうしたものか・・・・。

考えられる原因は、
1.ログが取れていない(Apacheの不具合)
2.ログは取れているが、解析に失敗(解析ソフトの不具合)
3.ログは取れて、解析は出来ているのに表示できない(また別の不具合)
4.その他
う?ん、いったいどれなんだ。

時刻同期とNTPサーバ

このエントリーをはてなブックマークに追加

私はテレビ番組をキャプチャして保存している関係上、時刻同期はかなり重要な問題です。
ちょっとでもずれるぐらいならまだマージンが持てますが、さすがに1?2分のズレともなってくると
頭が切れたりします。

今回、何気に玄箱の時刻を見たら、なんと4分のズレが。(電話の時報との比較)
そこですぐに、NTPサーバ(+クライアント)の見直しを。

設定 /etc/ntp.conf
を一覧した後に、ntpq -pを実施すると、fukuoka-uサーバに時刻同期している模様。
しかし、これだけずれるようでは危険です。

そこで、googleでNTP関連をあさっていると、NTPサーバ一覧みたいなサイトを発見。
そこでも、fukuoka-u系は死亡しているか非常にずれるとの書き込みが。

そこで、RING Project(ラウンドロビン)、jpix(日本のインターネットの中継を担う大御所のひとつ)、
mfeed、自分の住所に近そうな所、プロバイダ提供のもの、
そしてSTRATUM=1の所を適当に1個選択してつっこんでおきました。(あんまり必要ないんだけどね。)
登録数はなんと10個。多すぎ。

これで様子を見たところ、STRATUM=1か2のところで安定。
ntpq -pで状況も確認。
時刻も正確になりました。

皆さんもお気をつけください。

csvファイルを使ったデータベース検索の作成

このエントリーをはてなブックマークに追加

私の携帯ではExcelファイルを閲覧することの出来る機能が付いています。
Picsel Viewerというソフトにて、俗に言うオフィスソフトで作成したファイルを見ることが出来ます。

しかしこの機能、まず検索が出来ません。
また、ちょっと文字化けを起こします。

後者は必要な部分が文字化けしないのでさほど問題にはしていませんが、問題は前者。
検索が出来ないので、あらかじめソートしておいたファイルを保存しておいてそれを見ているのですが、順次検索&2000弱に渡る項目をチェックするのは非常に大変な作業です。

そこで、CGIで何とか出来ないかと探していたら、CGIROOMにcsvファイルを検索するデータベースCGIを発見。
それとEXCELファイルをCSVに変換したファイルを用いて、検索システムを完成させました。
ファイル変換・転送の手間はあるものの、便利なものです。
一部のキーワードとジャンルを指定するだけで探したい物が楽に出てくるようになりました。

ちなみに、強烈なアクセス制限とパスワード認証をかけているので、他の方は基本的に見ることは出来ません。
あしからず。

標準OSでの鯖構築に失敗

このエントリーをはてなブックマークに追加

玄箱HG、標準OSでの鯖構築に失敗。
というのも、DynbamicDNSのクライアント、ddclientが正常動作していません。
ついでに、openssh、opensslも。
どっちかはCDに入っていないのですが。

結局、debian化を実施することに。
昔挫折したことがあったので、今回は本を参照してでも成功させたいです。
というわけで構築開始。
・・・・・・・
・・・・・・
・・・・・
何とか完了?
debian化は成功。NTP,DDNS、HTTP鯖、SAMBAともに成功。
あとはセキュリティ対策しようか。80番ポート以外封鎖しているからある程度は大丈夫とは思うが・・。
webalizerもインストールしたいところ。アクセス解析したいしね。
もしくはMRTG。
問題は玄箱HGのスペックで耐えきれるかどうか。負荷かけすぎて死んだら元も子もありません。

鯖構築の内容検討

このエントリーをはてなブックマークに追加

せっかく(と言うか明確な目的があって)KURO-BOX/HGを買ったので、どうするかを検討してみました。
NFS(これは本来の機能)
ま、HDD容量は80GBの物を使おうとするので、あくまで一時的な転送用ですけど。

HTTP鯖
借り物のサーバでは空き容量なんてたかが知れています。(ここのサーバも借り物、1GB)
ついでにいうなら、大きなサイズのファイルを置くと転送量が爆発的に増大します。
多少遅くても、自宅鯖から配信する方が現実的だと思ったので。

後は内部の話。DynamicDNSは導入する予定ですが。
基本的に外向けはHTTPのみ。
というか、それ以外今の時点では必要性を感じませんし。

さて、うまくいくのかいな。

Index of all entries

Home > PC破壊日記 > サーバ(玄箱)日記 Archive

2進数時計
※クリックで読みやすくなります。
※この時計の時刻は、閲覧しているパソコンのものであり、必ずしも正確な時間とは限りません
Search
Feeds

Google Adsense
Tag Cloud

このページの最初に戻る