nDiki : 2006年06月上旬

2006年6月1日 (木)

Hyper Estraier で社内 Web コンテンツ検索

昨日の自分のノート PCHyper Estraier の試用を踏まえて、社内のサーバに Hyper Estraier を設置する。

インストール

いまだ Red Hat Linux 8.0 であるサーバに、昨日と同様に Hyper Estraier 1.2.7 を /usr/local/hyperestraier-1.2.7 以下にインストール

この環境では ./configure 時に iconv が見つからないため、最初に libiconv 1.9.2 を /usr/local/hyperestraier-1.2.7 に入れ、続けて QDBM、Hyper Estraier の順にインストール

estwaver + estmaster でクローリング + 文書登録も問題なく完了。

search_ui がうまく動かない。

検索をしようと http://ホスト:1978/node/ノード名/search_ui にアクセスするも、検索フォームを含め何も表示されない。あれ? 他の管理ページは問題なく表示されるのに search_ui だけ駄目。

GNU Wget だときちんと HTML を GET できるのだけれど、FirefoxInternet Explorer からだと駄目である。

いろいろビルドしなおしてみたけれどやっぱり駄目なので、今回は結局 estmaster をやめて CGI プログラム版の UI を使うことにした。 こちらだとクローリング中は検索ができなくなってしまうけれど、夜中に cron で回すから別にかまわないか。

インデックスの方針

以下のような感じでクロールし、登録することにした。

  • 社内メイン Wiki、自分の社内 Blog、公開 Web サイトのトップページをクロールの種文書とする。
  • それと社内メイン Wiki の更新情報ページも種文書とする。
  • 社内のサーバ、および公開 Web サイトのみクロールするように allowrx、denyrx を設定。
  • Wiki の編集ページ等をクロールしないように denyrx を設定。
  • 1日1回深夜に cron でインデックスを更新。
  • revisit は3日に設定。
    • いくつかの種文書は -revcont 付きで estwaver を実行しても毎回巡回して欲しいのだけれど、それはいまのところできないようだ。

特定の WikiBlog 内のみを検索したい時は、検索インタフェースの方で URL を指定絞り込めば良いので、それほど規模も大きくないし全部ひとまとめにインデックス化することにした。

後は使いながら微調整していくこととしよう。

スポンサード リンク
[ 6月1日全て ]

2006年6月2日 (金)

定例ミーティング内容を Podcast で共有するか

伝え聞くところによると、本社の人が「その話初耳」という不満をまたもらされていたとのことである。

「本社での定例ミーティングの内容が伝わってこない」という不満を東京スタッフが口しているのをほとんど耳にしないということは、やはり実質東京サイドで回っているということなのだろう。

もちろん「聞いてないよ」問題に対する問題意識は多くの人が持っているが、なかなか改善されていないのが実情である。

「サイトマネージャを置いて、重要事項はサイトマネージャ間で共有し各サイトで周知徹底する」

という案も出たがそういえば先に進んでいないな。

この方法の問題は、情報の選別が行われてしまうこと、要約が行われることによりコンテキストが欠落してしまうこと。 これは議事録にしても同じだ(もっとも今は定例ミーティングでは各自必要事項をメモするだけにとどまり、議事録すらまとめておらず、基本的なところで問題があるとも言えるのだが)。

で、ふと思ったのだがミーティングを録音して Podcast にし、聞いてもらうといのうはどうだろうか。 はてなみたいに社外公開はもちろんしないとしても、東京側の定例ミーティングの空気がより本社にも伝わるのではないかと。

「聞く側の負担がどの程度か」「Podcasting したとして聞いてくれるのだろうか」というのが懸念かな。 ま、いろいろ工夫はできそうだ。

準備も手間もそれほどなさそうだし、まずはとにかくやってみますか。

満5年を向かえた結婚記念日

naney:159003495

大きなトラブルもなく無事満5年の結婚記念日を迎えた。

焼きそばディナーでお祝い。

[ 6月2日全て ]

2006年6月3日 (土)

FoxyProxy と autossh で社内 Web ページを閲覧

メンテナンス等のため社内 Web サイトを社外から閲覧する必要がある場合 SSHport forwarding を使ってアクセスしていたのだが、その都度 Firefoxproxy を変更したりするのが面倒だった。

そんな折 FoxyProxy という Firefox 拡張機能があることを知った。 これは登録された URL パターン毎に、自動的に proxy を切り替えてくれるという優れもの。 これは便利。

autosshport forwarding (SOCKS サーバ)を開いておくようにして、社内のホスト名/IP アドレスURLの時はそこを経由するようにしておくと、いつでも Firefox から閲覧できるようになる。

 autossh -N -f -D8090 <中継するホスト名>

ロットリングのミニボールペンハイテックC

naney:159837878

常時携帯メモ帳 RHODIA No11 用にロットリングエスプリムーブを使っている。 伸縮するボディを持ち、携帯するときは短いのに書く時には十分な長さになる便利なミニボールペンだ。

このエスプリムーブ、携帯にはいいのだがボールペン書き味は自分にはどうもしっくりこなかった。 ちょっと太めで、黒くない黒なのでメモ書きにはイマイチな感じだ。

ということでリフィルを交換することにした。 エスプリムーブリフィル4C 互換リフィル (D型)である。 ちょうど「ステーショナリーマガジン No.002」に、4C ボールペン替え芯記事があり国内外のリフィルの一覧が載っているので、これを見つつ候補をチョイス。

今回は人気の高いパイロットハイテックC ゲルインクボールペンにしてみることした。

4C 互換リフィルを使っている「ハイテックCスリムス」用のリフィル LHRF-20C4-B (0.4mm) を買ってきて交換。

お、これは書き易い。黒も締まっているしいい感じだ。 油性ボールペンと違って書いた線も安定しているし、満足満足。

リフィルは高めで210円(税込)。ハイテックCはインクの減りが早いということなので、コストパフォーマンスは悪いのがちょっと辛いが、しばらくはこの「エスプリムーブ + ハイテックC」で使ってみることにしよう。

image:ISBN:4777905438

[ 6月3日全て ]

2006年6月4日 (日)

奥歯にアルミホイル

昨日昼過ぎに用事を終えたと合流して、アトレ恵比寿で食事をした。 久しぶりにつばめグリル。

つばめグリルといえば、やっぱり「つばめ風ハンブルグステーキ」。 アルミホイルにくるまっている奴。 ウマ。

ん? なんか右の奥歯に違和感が。 なんか、ジュワァーっていう感じ。

まさか。

と思ったが、どうにも取れずに食事終了。 洗面所で鏡を覗きこんだら右下の奥歯に、アレが貼りついてた。

あー気持ち悪い。

[ 6月4日全て ]

2006年6月5日 (月)

プラークコントロール良くできてますね

先週に引き続き歯の定期健診2回目。

右上奥歯をフロスするとたまに血がでると話をしたら、実際にフロスを通して問題ないかチェックしてくれた。どうやらパチンとやって歯茎が切れるパターンらしい。 歯に沿わせていれるようにとの事。 帰りにフロスの仕方の紙を貰った。

先週歯石取りを終えて、今日はエネメル質を強くするで磨きである。

「プラークコントロール良くできてますね」と誉められてかなり嬉しかった。 「指導を浮けたことがあるか?」と聞かれたのだが、特に無し。 ソニッケアー + フロス + リステリンのおかげか。

歯と歯の間に着色汚れがつきやすいとのこと。唾液等口腔内がそういうタイプなのかもしれないらしい。 歯医者の機械でしかとれない部分なので、普段は通常通りのブラッシングで。 それとコーヒーを飲んだ後のうがいの励行。

結果今回の定期健診も虫歯なし。

良かった良かった。

第6回 社内 Perl 勉強会

リャマ本を使用した社内 Perl 勉強会の6回目を開催。 今日は7人。

今日は「初めてのPerl 第3版」第7章「正規表現の基本」が範囲。

今回は5問のうち最初の3問は正規表現によるパターンを考える形式。

今回の反省点

正規表現というと、Perl 初心者がひっかかる一つの鬼門である(少なくとも私のまわりでは正規表現でビビる人が多かった)。 それを承知の上かリャマ本では章を分けて簡単なところから少しづつ取り組むようになっていて、アレルギー反応がおこりにくいようになっている感じだ。

実際、今回の勉強会でも特につまづいている人はいなかったようだ。

今回は追加ネタとして、正規表現と正則言語と有限オートマトンの話をちょっとだけしたのだけれど、反応はあまり良くなかった。

本当はこういう基礎的な部分に興味を持ってもらうと、深みのある(?)プログラムが書けるのだけれどなかなかそこまではいかないかな。

社内勉強会としては、追加ネタは実用的な方が良いのかもしれない。

今回は1時間5分。

[ 6月5日全て ]

2006年6月6日 (火)

WiKicker 0.32 リリース - ページ部分編集のバグ修正

2006年5月28日以来、約1週間ぶりのリリース。

最初の見出しの前の部分を「ページ部分編集」して保存すると、先頭を編集したにもかかわらず、ページの最後に追加されてしまう問題を修正。

[ 6月6日全て ]

2006年6月7日 (水)

名刺の肩書が「ディヴィジョン マネジャー」に

5月に組織変更を行いプロジェクトチーム制になった。 その時に応じて複数のプロジェクトチームに出たり入ったりするようになるので、名刺にはなんて書いておこうかという話になったのだが、結局「ディヴィジョン マネジャー」になった。

何をやっているのか良くわからない感じではあるけれども、実際そんな感じといえばそんな感じなので、まいっか。

それより電話番号が +81 表記でなくなったのが、残念。 ガイジンからかかってきてら、それはそれでかなり困るのだが、何となく気にいっていたので。

[ 6月7日全て ]

2006年6月8日 (木)

WiKicker 0.33 リリース - [[index:descendant]] を追加

2006年6月6日以来、2日ぶりのリリース。

zakwa 氏からの要望により、 機能を追加。

[ 6月8日全て ]

2006年6月9日 (金)

誕生日()

早めに会社をあがってケーキを買って帰宅。

[ 6月9日全て ]

2006年6月10日 (土)

11:00 床屋 - 果てしない夢を

BEST The Single Collection - 軌跡 -

いつものアドバンストヘアーナカタニで。

2006年4月8日以来、約2カ月ぶり。

前髪が目にかかって邪魔くさいので少し短めにしてもらった。

果てしない夢を*1がかかっていた。この曲がまだ外で聞けるなんて。長嶋氏の歌声は結構貴重かも。

*1ZYYG,REV,ZARD&WANDS フィーチャリング・長嶋茂雄

Plaggerインストールが大変なので XML::RSSRSS から JavaScript コードへ変換するスクリプトを自作

一昨日社内メイン Wiki のレイアウトを変更してサイドバーを設けたので、徐々に増えてきた社内 Blog の ヘッドラインをそこに表示することにした。

最初は Plagger を使ってみようと思ったのだが、依存 CPAN モジュールが多くて CPAN.pm を使ってもなかなかインストールが終わらない。

ということで今回は Plagger を見送って、XML::RSS でちょちょっと aggregator を自作して済ますことにした。

基本的には nDiki 用に書いた「はてなブックマーク上の最新ブックマークを表示するためのコード(2005年5月16日)」をちょっと修正して利用。 HTML フラグメントを生成するかわりに、JavaScript IncludeJavaScript ファイルを生成するように変更した。

これで社内 Blog が読まれる回数も増えるかな。

WiKicker における PageName 最長文字数

WiKicker では PageName を エンコードした文字列を URI に埋め込んだり、サーバで保存する際のファイル名にしたりしている。 このため、PageName の最長文字数はそれらの最長文字数に依存しているはずである。

今まで確認を後回しにしていたのだが、新しい機能の追加の際に確認しておく必要があるので調査してみた。

WiKicker実装

WiKicker実装がらみとして最長を決める要素としては

がある。

仕様等による制約

  • HTTP では URI の長さには制限なし (RFC2616 3.2.1)
  • Web サーバは Request-URI が長いと 414 Request-URI Too Long を返す (RFC2616 10.4.15)。Apache は LimitRequestLine ディレクティブにより、URI を含むリクエスト行のサイズを制限することができる(配布時には 8190)。
  • Internet Explorer が扱える URL の長さは 2083文字。
  • ext2ファイル名は 255文字まで(増やすこともできる)。
  • 手元の Linux 2.6.15 で試したところ、パス名は 4095文字まで。

WiKicker で問題が出ない PageName 最長文字数

上記の中ではファイル名による制約が一番大きい。

WiKicker 内部でファイル名として base64 (の亜種) でエンコードしたものを使っているので、元の文字列はは最長 189バイトまでなければならない。base64 だと3バイトで4文字になるため、189バイトで 252文字となる。

WiKicker ではここでさらにファイル名に ',v'、'-lock' をつける事があるので、実際には元の文字列は最長 186 バイトまでとなる。

PageName が 186 バイトまでだとすると、URL エスケープしたとして558バイト。 WikiEngine のスクリプトの URL や他のパラメータとあわせても、これぐらいなら大丈夫のはずである。

ということで WiKicker では Linux 上だと通常 PageName は 186 バイトが最長と言ってよさそうだ。 日本語の文字はだいたい UTF-8 で3バイトになるので、62 文字までということになる。

そのうち、WiKicker に制約チェックを入れることにしよう。 そのうち。

[ 6月10日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィでマネージャー・プロダクトオーナーをしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

follow us in feedly

※内容は個人的見解であり所属組織とは関係ありません。

月別インデックス
Process Time: 0.044999s / load averages: 1.44, 1.45, 1.33
nDiki by WATANABE Yoshimasa (Naney, Google profile)
Powered by DiKicker