nDiki : WWWOFFLE

2000年9月8日 (金)

Linbot の文字化け、とりあえず delegate で対応

2000年8月25日メモした WWW リンクチェッカ Linbot。 便利だが、日本語が化ける。 ということで、とりあえず delegate をかませて fetch されてくるものを日本語 EUC に統一してしまう事に。

 $/usr/sbin/delegated -P8084 FTOCL=-euc SERVER=http PROXY=localhost:8080:*

として delegated を起動。 Linbot の proxy で 8084ポート指定して、WWWOFFLE と Linbot の間に delegated をかます。

これでとりあえず Linbot の出力結果で日本語タイトルが化けなくなった。 delegate 使うの初めてだけど、こんな感じでいいのかな?

ちょっと気になるのは、delegate でひっかかるページ(とても時間がかかるページ)があるということ。 普通の Web ブラウザから、上記起動の delegate 経由でアクセスしてもひっかかる。 WWWOFFLEオフラインにしているからスパッっと返ってくるはずなんだけど。 delegate が何かのタイマウト待ちでもしているんだろうか。

追記

やはり遅かったのは名前解決のタイムアウト待ちで、delegated のオプションに RESOLV="" としておけば、とりあえず名前をひかなくなる。(2000年9月11日追記)

スポンサード リンク
[ 9月8日全て ]

2000年10月1日 (日)

Web広告に興味を持つ

私はあまりWeb 広告のある Web ページは好きではない。 理由は、

  • 不必要な帯域を使う。
  • ページ閲覧が遅くなる。
  • 広告画像の分だけ表示領域が狭くなり、コンテンツを見るのにスクロールが必要になりがち。
  • 本来見たいコンテンツが見にくくなる。
  • キャッシュの容量を食う
  • ほとんどの広告がうるさい(アニメーション)
  • バナーのデザインが派手でページにマッチしない

等。まぁ嫌いだという人は、同じような理由が多いのではないだろうか。

広告があるけれどコンテンツが見たくて何度も定期的にアクセスするページ」は、proxy広告をロードしないようにしている(WWWOFFLE の DontGet 機能)。 まぁ、そういうページはタイトル画像やアクセスカウンタも DontGet してしまうのだが。

ということで、もちろん拙作のページにも広告は掲載してこなかった。 といってもいままで大学のサーバで公開していたので、それ以前の問題としてもともとマズいし。

また、各 Web サイトアイコンを使ったリンクというのも、重いのであまり好きじゃない。 リンク先のイメージが沸くかというと、そうでもないし。 アニメ絵系のは、それ系かなとは思うけど。

で、なぜ今回興味を持ったかというと「今ホスティングサービスを受けている会社(ソリッドネットワークス株式会社※)の現状はどうかな」、と全文検索していたらその会社の広告を出している人を発見。

hosted by ……. なんてページのどっかに書いてもいいかなと前から思っていたんだけど、まぁその部分を広告経由のリンクにしてもいいかなと。

もちろん、広告収入でサーバ代の一部でも pay できたら嬉しいというのもある。

ということでその広告を斡旋しているらしい ValueCommerce に登録してみた。 3営業日以内に審査の結果連絡とのこと。

ついでにメジャーどころの、valueclick の方も登録してみた。 こちらは10営業日以内の審査とのこと。

今後どうなるか楽しみ。 審査自体通らなかったりして。

もし、サイトの品を落とさないようにできそうな、広告配信サービスがあったら実験的に掲載してみようかな。

追記

※現在は社名変更し株式会社NEXON JAPAN。 ソリッドネットワークスホスティングサービスへのリンクを追加。(2001年8月5日)。

[ 10月1日全て ]

2001年5月15日 (火)

21:10 安部 竜治さんに捕捉されているのを発見

mknmz-wwwoffle をご存じでいらっしゃる。 mknmz-wwwoffle、はやく WWWOFFLE の圧縮機能に対応しなきゃなぁ。

[ 5月15日全て ]

2001年9月17日 (月)

[ mknmz-wwwoffle ] ギリシャから「win32 で動かないよ」

ちょうど、新婚旅行に行ってきたギリシャドメインの人から、mknmz-wwwoffle が win32 でうまく動かないよというメールを頂く。 Namazuギリシャでも使わてれいるんですねぇ。

mknmz-wwwoffle の win32 対応は TODO のまま。 path の処理等をサボっているのでそのままでは動かないはず(試してみてもいないので不明)。 せっかくの機会なので win32 対応するかな。

Win32NamazuWWWOFFLE (と要求ライブラリとかPerlとか)をセットアップするのがちょっと面倒かな。

[ 9月17日全て ]

2001年10月2日 (火)

25:45 Apache Proxy で アンテナの ?%MM%%DD%%HH%%TT% 除去

最近、アンテナを活用するようになった。 が、アンテナの多くは URL の末尾に更新時間情報(?10021446 等)をつけるため、本来同じ URL のページが違う URL で、どんどんキャッシュ proxy (WWWOFFLE)にたまってしまう。

そこでブラウザと WWWOFFLE の間に aAache proxy を挟んで ?10021446 等を取り除いてしまうことにした。 RewriteRule の substitution の最後に ? をつけないと query string が除去できない事に気が付かなくて随分はまった。

とりあえず、うまくいったみたいなのでコンピュータ日誌の10月2日のところに、設定をまとめておく。

Apache Proxy で アンテナの ?%MM%%DD%%HH%%TT% 除去

アンテナページの多くはリンクURLに更新日時を付加する。 例えば

 http://www.naney.org/personal/diary/hns/

が、10月02日 14:46 に最終更新されているとう情報を取得すると

 http://www.naney.org/personal/diary/hns/?10021446

という、URL を持つリンクをアンテナページに生成する。 ページが更新されるとURLも変化するので、(Mozilla, Internet Explorer 等の)以前にアクセスした事のあるリンクの色を変えるブラウザでは、更新されたことを確認しやすい。

が、これはキャッシュ proxy には仇になる。 更新されるたびにURLが変化するということは、そのURLごとにキャッシュが作られるということだ。 私の愛用の WWWOFFLE もご多分にもれずそうである。 私は3ヶ月間キャッシュを保持するようにしているから、一日に3度更新されるページをアンテナのリンク経由で見ると、約90のコピーがキャッシュされる事になる。 そして、最新以外のキャッシュは(通常)2度と利用されることもない。 もはや、その URL ではアクセスされないから。

これはもったいない。 ようは、アンテナ経由でのアクセスの ? 以下を削除してキャッシュすればいいのだが、WWWOFFLE にはあいにくそのような機能はない。 そこで、URL を書きかえる proxy をブラウザと WWWOFFLE の間にカマせようということになる。

 Mozilla -> rewrite proxy -> WWWOFFLE -> target site

ここでは、Apache を rewrite proxy にすることにしてみた。 Apachemod_proxyproxy になるし、mod_rewriteURL を柔軟に変更できる。 もともと、自分の Web サイトのチェック用にローカルマシンで Apache も常時起動しているので設定を変更するだけだ。

とりあえず、大抵のアンテナは ?と8桁の数字(「なつみかん」でいうところの?%MM%%DD%%HH%%TT%)を付加するので、これをもぎとればよい。 以下、httpd.conf の修正。

 LoadModule proxy_module /usr/lib/apache/1.3/libproxy.so
 LoadModule rewrite_module /usr/lib/apache/1.3/mod_rewrite.so

とモジュールをそれぞれ有効にする。rewrite_module より proxy_module を先に Load するようにする(デフォルトでは逆順なので注意)。

そして、httpd.conf の最後に

 ProxyRequests On
 ProxyRemote * http://127.0.0.1:8080/
 NoCache *
 <IfModule mod_rewrite.c>
 RewriteEngine on
 #RewriteLog /tmp/rewrite_log
 #RewriteLogLevel 9
 RewriteRule ^proxy:(.*)\?[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]$ $1? [L]
 </IfModule>

を追加。ProxyRemote で、WWWOFFLEproxy を指定。 RewriteLog, RewriteLogLevel はうまく書き替らない時に有効にしてログを確認するのに使う。 最後の RewriteRule で実際に書き替えを行う。 ポイントは $1? と、置換後の文字列指定で最後に ? をつけること。 これをつけないと query-string が削除されない(これに気が付くのに随分かかった)。

後はブラウザ側の http プロキシ先を 127.0.0.1:80 にすれば OK。

無条件に ?と8桁数字が末尾にくれば、取り除いてしまうので荒っぽい RewriteRule だ。 だが上記のような query string を使っているページは(多分)そうないから、とりあえず、これで良しとしよう。 困ったら直せばいい。

追加リンク

[ 10月2日全て ]

2001年12月5日 (水)

[ Java ] 22:30 Cocoon2 はどうかな?

最近、本サイトの生成フレームワークを一新すべく模索中(現在は XML + 自作 Perl スクリプト)。 今の最有力候補は XML + Ant + Xalan。 他にいろいろ見ていたら、Cocoon 2 はどうかなと。 XML から XSLT 他を用いて HTML とか WML とかを生成する server application なんだけど、ローカルで立ちあげて Wget とかでローカルに静的なファイルとして落とせば、それをサーバに置けるんじゃないかなぁ。 すぐ思いつく問題は、

  • 「make 的(必要なファイルのみの)更新」(毎回すべて更新されるとサーバへのアップロードで困る)、
  • SSI がちょい面倒?」(Coccoon 2 では処理しないでそのまま出力させる)、

「コンテントネゴシエーションまわり」(en, と ja を別々のファイル名できちんととりだせるか)

等々。ドキュメントだけ静的にアーカイブしたものとかあるから、静的なファイルに落とせるんだろうなとは思いつつ。 とりあえず、インストール。 まず先に Tomcat

 cd /usr/local
 tar zxvf jakarta-tomcat-4.0.1.tar.gz

次 Cocoon 2

 cd /usr/local
 tar zxvf cocoon-2.0-bin.tar.gz
 cp /usr/local/cocoon-2.0/cocoon.war /usr/local/jakarta-tomcat-4.0.1/webapps/

Tomcat がデフォルトで 8080 ポートをつかうのだが WWWOFFLE が既に使っている。 Tomcat の方をずらすより、WWWOFFLE の変更の方が勝手がわかるのでそちらをずらす。 で

 /usr/local/jakarta-tomcat-4.0.1/bin/startup.sh

で起動。http://localhost:8080/cocoon/ に Galeon でアクセス。 一発目は非常に遅い。他のページも一度目は閲覧は遅いがキャッシュが効くので次からはそれほどでもない。

とりあえず、ドキュメントを読んでいろいろ調査。

[ 12月5日全て ]

2001年12月25日 (火)

12:30 「日記文中の他ページリンクへどの程度ジャンプするか?」by やまぐう

私は、とりあえずおもしろそうな記事中のリンクを、(Galeon なので)がんがん別タブで開く。 日記記事を読んでから、リンク先のタブを順番にチェック。

オフラインの時もガンガン、別タブで開いて WWWOFFLE のリクエストにため。 次のオンライン時にまとめて fetch (このパターンの場合は結局後で見ないものもあるけど)。

追記

URLhttp://www.konlab.j.dendai.ac.jp/... から http://www.lomelette.org/~yamagu/... に修正 (2002年12月25日)

22:00 User-Agent=DoCoMo/Galeon

WWWOFFLE の CensorHeader Section で、

 <http://mobile.yahoo.co.jp/*> User-Agent = DoCoMo/Galeon

とかしてみる。

[ 12月25日全て ]

2002年12月16日 (月)

去年の今ごろ

2001年12月16日より。

*1といっても打ち合わせ先の会議室とか

[ 12月16日全て ]

2004年12月26日 (日)

久しぶりに WWWOFFLE

ノート PC に久しぶりにインストール正月は常時接続ではなくなる(場合によってはダイヤルアップも不可に)ので、今のうちに必要なものはできるだけキャッシュしておくように。

[ 12月26日全て ]

2005年8月2日 (火)

例によってPHS接続用に WWWOFFLE を設定

夏休みでしばらく数日(常時接続ではない) PHS 接続生活になるので、例によって WWWOFFLEインストール。しばらくは WWWOFFLE + Privoxy の2重 proxy 生活。

今回はDNS キャッシュサーバとして pdnsd も入れておく。

あわせて resolvconf パッケージもインストールして、ifup / ifdown の実行などで問い合わせにいく DNS サーバが変わっても pdnsd が追従するように設定(というか pdnsd のデフォルトの pdnsd.conf がそのようになっている)。

これで /etc/resolv.conf はいつも

 nameserver 127.0.0.1

にしておけるので 実際に問い合わせにいく DNS サーバが変わっても WWWOFFLE再起動が必要なくなる。


[ Debian ]

[ 8月2日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

月別インデックス
Process Time: 0.061412s / load averages: 0.59, 0.49, 0.50
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker