nDiki : RSS リーダ

RSS リーダ - RSS reader

関連情報

2006年3月3日 (金)

サーバ高負荷状態につき DiKicker 機能修正とサーバ設定変更

www.naney.org をホスティングしているサーバが重いと思ったら、同じサーバ上のあるユーザの CGI プログラムが5プロセス無限ループしてるっぽい……。 load average 20前後。

あおりを受けて、nDiki が大変なことになっている。

nDikiSpeedyCGI を使っているのだが、バックエンドの speedy_backend が捌ききれず、フロントエンドの speedy が大量に待ちに入ってしまっている。

MaxBackends を調整しても駄目(下手にバックエンドプロセス数を増やしても、結局処理が追いつかない)。

ということで急遽対策。

高負荷時にはてなブックマークへのアクセスを停止

load average が高い時には、はてなブックマーク上の検索結果を表示させるために行なっているはてなブックマークへのアクセスを休止するように変更。 24時間に設定してあるキャッシュの有効期限が切れていても、高負荷の時にはアクセスにいかないようにする。

これで DiKicker の処理時間を短縮。相手側サーバへの負担も軽減。

Google Desktop からのアクセスを一時的に拒否

おかげ様でここ最近 nDikiRSS へのアクセス数が増えてきている。 ありがたい事である。

しかしながら DiKickerRSS レスポンスは、あまり賢くなく毎回データベースから最新記事情報を抽出して生成しているため、それほど処理が速くない。

なのでアクセス頻度を高くしている RSS リーダがどこかで同時に起動しているとちょっとしんどい。 特にここ最近 Google Desktop からのアクセス数が増えている感じ。

さすがに今日はサーバの負荷が高く処理が追いつかなくてどうしようもないので、一時的に Google Desktop を拒否することに。

.htaccess に設定を追加。

 BrowserMatch "Google Desktop" denybrowser
 deny from env=denybrowser

近日中に、RSS 処理を改善してすぐに解除する予定。

robots.txt に Crawl-delay: を追加

効果があるかどうかは不明だが、Crawl-delay: に対応するというクローラ (Slurp、msnbot) 向け設定を追加。

 User-agent: Slurp
 Crawl-delay: 20

 User-agent: msnbot
 Crawl-delay: 20

アクセス数としては Googlebot と Slurp がダントツ。 しかし Google は無下にする訳にもいかないしなぁ。

スポンサード リンク
[ 3月3日全て ]

2006年3月6日 (月)

DebianRSS リーダフレッシュリーダー」をインストール

2006年3月1日にリリースされた RSS リーダ フレッシュリーダー(Fresh Reader)を昨日 Debian GNU/Linux sid 環境へインストールして試用を開始してみた。

Debian GNU/Linux sidインストール

ノート PC 上で動いている Apache2 にインストールPHP が必要なので、libapache2-mod-suphp をインストールしておく。

 apt-get install libapache2-mod-suphp

他のプライベートな Web サイトと分離するために、バーチャルホストを1つ作ってそこへインストールすることにする。 libapache2-mod-suphp を使って、自分のユーザ権限で db に書き込むように設定。 また自分だけが使えるようにアクセス制限しておくことにする。

/etc/apache2/sites-available/freshreader を作成:

 <VirtualHost *>
   ServerAdmin naney@naney.org
   ServerName freshreader
   SuexecUserGroup naney naney

    DocumentRoot /var/www/freshreader
    <Directory />
      Options FollowSymLinks
      AllowOverride None
    </Directory>
    <Directory /var/www/freshreader>
      Options Indexes FollowSymLinks MultiViews ExecCGI
      AllowOverride All
      Order deny,allow
      Deny from all
      Allow from 127.0.0.0/255.0.0.0 ::1/128
    </Directory>

    ErrorLog /var/log/apache2/error.log
    LogLevel warn

    CustomLog /var/log/apache2/access.log combined
    ServerSignature On
 </VirtualHost>

で、次にバーチャルホストを有効にする。

 #mkdir /var/www/freshreader
 #chown naney.naney /var/www/freshreader
 #a2ensite freshreader
 #emacs /etc/hosts                # 127.0.0.1 に freshreader を追加
 #/etc/init.d/apache2 reload

続けてフレッシュリーダーインストール。 基本的にはアーカイブを展開するのみ。

 $cd /var/www/freshreader
 $tar zxvfp ~/sffr10lin.tar.gz
 $chmod 700 db

Web ブラウザから

 http://freshreader/freshreader/index.html

にアクセスする。これで基本的なインストール終了。

それから1時間に1回自動巡回するようにしておく。 今回は自分のユーザアカウント (naney) でインストールしてあるので、自分の crontab 設定に追加する。 自分の場合は、1時間に1回 run-parts されるディレクトリがあるので、そこに

 #!/bin/sh
 /usr/bin/php5 -f /var/www/freshreader/freshreader/crawler.php

というファイルを作成しておく。

あとはマニュアルの通りWeb ブラウザでユーザを作成したり、巡回先を登録したりしていく。

感想

現在のところ Web 巡回は

と用途ごとに分散してしまっている。

集約したかったのだが、なかなかこれというのが無かった。

フレッシュリーダーだと

  • MyRSS.jp のエンジンを使って、RSS フィードのないサイトも登録可能
  • ローカルで動かせるので、プライベットネットワーク上の RSS フィード、プライベートな RSS、ローカルホスト上の RSS を集約できる
  • Bloglines に同様の未読管理
  • Web ブラウザベース (記事中のリンクもそのまま Firefox 上で閲覧していける)

と望んでいる機能が入っている。

早速 Bloglines から登録一覧を OPML でエクスポートして、インポート。

動作も軽快だしいい感じだ。 「一度に表示する未読記事の数」が設定できるのが非常に気にいった。

未読記事を表示したらそのページ(タブ)を閉じる前に全部目を通さなければならない(でないと、読んでいないものも既読になってしまう)。 Bloglines だと前回見てからの未読が1度に全部表示されるので、間隔をあけてしまった時に辛い。 この点でフレッシュリーダーは便利。

現在「無制限」「約100件」「約1000件」が選べるが、ここは自由に数値で指定できるとなお嬉しい(50件づつぐらいにきざみたい)。

Web 巡回は、基本的にこれに集約しようかな。

ということでブロガーライセンス(自身でブログ/ホームページを運営されている方向けの優待ライセンス: 無料)を申請。

[ 3月6日全て ]

2006年5月18日 (木)

Google Desktop の web clips で RSS を読む

社内での情報共有を目的に社内 Blog を立ち上げた。次のステップは以下だ。

  • スタッフが定期的に社内 Blog をチェックする/したくなるようにもっていく。

読んでもらえなければ Blog を書くメリットがあまりなくなってしまうので、これは重要だ。 逆に良さがわかってくれば、自分も書こうという人が自然ど増えてくるはず。

まわりを見た感じだと、普段から RSS リーダを使っているというという人はほとんどいないようなので、まずは RSS リーダを普及させる必要がありそうだ。

うちのオフィスでの推奨 RSS リーダの条件としては

  • Windows で動くこと。
  • わざわざソフトを立ち上げてチェックというスタイルだと定着しなさそうなので、常駐型がいいのではないか。
  • 特定の Web ブラウザへの組み込み型ではないこと (人によって使っている Web ブラウザが違ったりするので、推奨しにくい)。

あたりかなと。むろん個人で気にいったのがあればそれにこしたことはないのだが、ここでは初めての人に薦められるものをということで。

Google デスクトップ 3

まずは Google Desktop を試してみる (Windows をメインに使っていなかったため、今までインストールしたことがなかった)。

ウェブ クリップで RSS/Atom フィードを読むことができる。

感蝕は「まあまあ」。 他の機能も含めて使っている場合はいいかもしれないが、巡回用の RSS リーダとして使うにはそれほど良いというほどでもないな。

フィードの表示順がちょっとわかりにくいのと、フィードの URI を誤認するのがマイナスポイント。

[ 5月18日全て ]

2006年8月25日 (金)

社内 Blog をテーマ別に分けるべきか?

会社で

「テーマ別に社内 Blog を分けるべきか?」

という質問をもらった。

私の意見としては、ほとんどの場合分けるべきではないと思う。

  • 分けると閲覧者が巡回する負担が増える (RSS リーダ活用などが浸透していない現状で)
  • Blog の更新頻度が下がる
  • そのテーマが終了した時に、その Blog がメンテナンスされなくなる → 忘れられる → 蓄積された情報が目に触れる機会が減る
  • そのテーマが終了した時に、その Blog がメンテナンスされなくなる → メンテナンスされていない Blog が一つ増える → 社内 Blog が活用されていないという印象が広まる

Blog 分けてそれぞれをきちんと更新していくのは、結構な手間と時間がかかるものだ。

たいがいの場合 Blog のカテゴリ機能やタギング機能を使うことで十分整理でき、その方が効果的に運用できると思う。

[ 8月25日全て ]

2007年8月20日 (月)

Linux 母艦ノート PC を使わずに仕事ができるかチャレンジ

普段仕事では

の2つを使っている。

先日メールGmail にしたことで、母艦が無くてもメールの読み書きができるようになったので、これを機にサブの Windows デスクトップ PC だけで仕事ができるかチャレンジしてみた。

朝出社してバッグからノート PC を出さずに作業開始。

使用したソフトを書き出してみた。

LinuxWindowsポータブル
Web ブラウザFirefox (Iceweasel)Firefoxo
メールMew / GmailGmailo
TwitterFirefox + tweetbarFirefox ( + tweetbar)o
IMESKKuimSKKIMEx
キーバインディングXKeymacs?
SkypeSkypeSkypeo
パスワード管理テキストファイルKeePasso
社内 Wiki 読み書きFirefoxFirefoxo
Excel データ読み書き(していない)Excelx
Word データ読み書きMew + wvHtml (/ OOo)Wordx
PDF 閲覧Adobe ReaderAdobe Readerx
メモhowmGoogle ノートブックo
RSS リーダフレッシュリーダー

「ポータブル」は USB メモリソフトウェアが入れらる、あるいはオンラインサービスとして任意の Windows BOX で使えるならば o 。

Google ノートブック

ちょっとしたメモ書きを Windows 上でして後で母艦で参照するのに、Google ノートブックを使い始めることにした。 テキストファイルに書いて USB メモリに入れてコピーするよりはずっと楽。

使ったアカウント

ネットサービス系で使った/使いたいと思ったアカウントは今日のところは以下。

はてなTwitter は母艦の Firefoxパスワードを暗記させていて覚えていないので、頭に入れておくか KeePass に入れておく必要あり。

中断

午前中は何とかいけたが、Web ブラウザ上の Gmailメールを書き始めたら急にストレスを感じるようになった。

  • 指定した桁で折り返せない (Emacs で使っている fill-paragraph がない)。
  • 固定幅フォントではない。
  • Gmail で複数のメールアドレスを使うため署名を自動挿入できない。このため、手で打つ必要がある。
  • 引用返信が書きにくい。

これらの点は多分 Firefox 拡張機能や、Greasemonkey スクリプトで多分ある程度解消できるのだと思う。要環境整備。

普段使っている RSS リーダが使えないと昼休みに巡回ができなくて淋しいが、こちらはその分他のことに時間が回せて結果的には悪くないかも。

今後順次環境を整備すれば、ライトな作業なら Windows BOX だけで済ませられるようになるかなぁ。

[ 8月20日全て ]

2008年10月17日 (金)

理学系と工学系はちょっと違う - 「理系の人々」

理系の人々

昨日会社で借りたので読んでみた。 エンジニア★流星群@Tech総研連載開始当時にはちょろっと読んでいたんだけれど、RSS リーダーで全文読めなかったのでその後読んでいなかった(肝心の画像ブロックされている)。

「理系の人々」というのは言い過ぎで「コンピュータ系の人々」という内容だけれど、それだけに直球でくる。 面白いけれど1人じゃ面白くない。 皆で読んでネタとして盛り上るための本だなあ。 そういう意味ではやはり Web 上にあることに価値があるのかも。

ツボにはまったのは「理系の分類」。 そう理学系と工学系はちょっと違う(ちなみに自分理工学部の中の理学)。 それぞれ、ちょっとした価値観の違いとプライドがある(はず)。


[ 読書ノート ]

[ 10月17日全て ]

2010年10月1日 (金)

Evernoteデベロッパーズミーティング

naney:5044375882

一昨日、橋本大也氏の情報考学の記事「10月1日開催 Evernoteデベロッパーズミーティング@デジタルハリウッド大学大学院 秋葉原メインキャンパス」で、Evernoteの日本初のデベロッパーズミーティングが開催されることを知った。 会場が秋葉原で会社帰りに寄れるし、Evernote を利用している中で API についてもちょっと興味を持ち始めていたので、いい機会だと参加申し込み。 Evernote 遍歴を整理してみたり。

で、本日退勤後参加してきた。まだ若い企業であること・日本法人「エバーノート株式会社」も今年設立されたばかりであることなどもあってか、即席的だけれどフレンドリーな雰囲気のある、皆でこれから盛り上げていきましょう的な良い雰囲気の会であった。 Evernote 好き度ちょっとアップ。

以下ノート

ウェブサイトエキスパート編集長 馮富久氏

開会のメッセージ。

Seth Hitchings 氏(Evernote Director of Partner Integrations)

「Integrating with Evernote

  • Trunk・Evernote Affiliate Program などがあるよ。
Evernote Site Memory

英語による発表。中島健氏が適宜通訳。

  • ユーザ視点では「適切な記事部分をクリップ」できるようになる。
  • パブリッシャー視点では「アフィリエイトプログラム」により収入を得られる。
  • 「Site Memory」という名前は Evernote ウェブクリッパーでドメイン別にリスト表示できることから「Site + Memory」という意味でつけられた。
  • Button Builder でボタンを作成。By HTML element ID や By DOM element でクリップ範囲を指定できる。

Evernoteサイトメモリー自体は思うところがあってまだ導入してみていなかったんだけれど、話を聞くことでサイトオーナーにもメリットがあることは感じられた。

Web Service API

OAuth も対応しているんだ。 また API を使えば Linux 版クライアントを作れる人は作れるんだな。

途中で Twitter ハッシュタグ指定が。 この時点で #EvernoteJP よりも多く Tweet れている #Evernote を推奨とのこと。

  • Apache Thrift framework を使用。
  • Evernote Markup Language (ENML)
    • en-note
    • en-crypt
    • en-todo
    • en-media

ENML については以前ドキュメントを読んだことがあるので流して聞く。

  • Evernote Bridge for iOS
  • Evernote for Android
    • intents
      • Future releases will feature additional intents for searching and displaying.

Android はやはり intent が強力だね。 今後新しい intent 対応があるとのこと。楽しみ。 個人的にははやくオフライン閲覧ができるようになってくれると嬉しい(すこし前のアップデートで準備段階としてキャッシュ機能が入ったのでもうすぐらしいんだけれど)。

Q & A
  • Q. ActionScript 3.0 からの API 利用は?
    • A. 今は準備していない。
  • Q. API でポカした場合どうなるのか?
    • A. 今までひどい開発者/ソフトウェアは出ていないが最悪ノート消去や・意図しないデータアップロードが考えられる。
    • A. 負荷が高ければ API key を revoke することも。
    • A. 実装したい機能仕様にあわせて権限を限定したキーを発行することも。
    • Q. モバイルからの印刷機能を提供する予定はあるか?
      • iOS 4.2 は OS の機能として。
    • Q. ENML の validating service はあるか?
      • A. サーバサイドで DTD ベースのバリデーションがかかる。
    • Q. サンドボックス環境は?
      • A. ある。
    • Q. サードパーティのものを Evernote クラインアト左下の広告エリアで紹介するようなとはあるか?
      • A. そのエリアには有料広告 または Evernote として面白いものを。
      • A. まずは Trunk へ。Evernote では Trunk を商売の場としては考えていない。
    • Q. サードパーティーがユーザからの課金する仕組みはあるか?
      • iPhoneAndroid 向けアプリはそちらのマーケットで。デスクトップ向けはない。
    • Q. 従量課金のための仕組みは?
      • A. 今のところない。使えるとしたらアップロードデータ量のカウントぐらい。
    • Q. アフィリエイトのトラッキングは動いているの? レポートは?
      • 1カ月周期でメールで。参照された総数と。$10 支払い発生したユーザ数。
      • API 使用量などの統計データは一部とっている。メールで相談を。
メディアプローブ株式会社 渡辺泰氏

デベロッパーズミーティングということで、ぜひ開発者の声をということで今朝プレゼンテーションを頼まれたとのこと。

初代 MacBook Air 用ディプレイ接続のアダプタを忘れたが、会場参加者にもっている人が貸してくれて無事プレゼンテーション。やはり Mac 率高い。

開発している iPhone RSS リーダに求められた「ニュース保存」に対応するために

  1. Twitter
  2. Evernote

と対応していった。EvernoteAPI 対応は1~2日程度+テスト。工数少なく機能実装できたとのこと。メール送信によるノート新規追加を連携としているものが多いが、API 利用することでノート表示などもサポートできるという利点があるなど。

デジタルハリウッド大学教授/データセクション株式会社 橋本大也氏

Evernoteなう」

  • Blog記事解析による Evernote の動向(記事数・共起語の変化・ポジティブ/ネガティブ語)
  • 先日情報考学にEvernoteサイトメモリーボタンを追加。Movable Typoe から Evernote に自動的にノート追加してくれるといいな。
  • Evernote の image recognition では認識した文字列の候補を複数もつことで再現率を上げている。
  • Evernote に送る」それとも「Evernote に保存する」?
    • Evernote としては「クリップする」が一押し。
  • レシートを取り込みたい。
  • Evernote では直接音声認識はないけど、Evernote に追加した録音音声からテキスト化してノートにしてくれる外部サービスはある。
  • GTD については?
  • Dropbox との連携は?
    • 「ぶっちゃけみんな Dropbox ユーザ」
[ 10月1日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

follow us in feedly

月別インデックス
Process Time: 0.053815s / load averages: 0.17, 0.20, 0.17
nDiki by WATANABE Yoshimasa (Naney, Google profile)
Powered by DiKicker