毎秒1000リクエスト を捌く超高速CMS「adiary」
2006/04/19(水)高機能化
プログラムというのは基礎工事さえしっかりしてれば、高機能化は比較的容易です。というわけではてな記法に似た簡略記法が使えるようになって、Amazonアソシエイトも自動挿入など無駄に高機能かつ使いやすくなっています。が、……このblogプログラム、はたして普及するんでしょうか?(^^;
たぶん普及するとしたら、ある時点でどこかで紹介されてその後が指数的になると思われるのですが……。んー読めないなぁ。tDiaryとかMovable Typeとかからのデータインポーター作ればいいのかもしれないけど、それこそ誰かサードパーティー(?)ツールとして任せたいのココロ。
そのためには、こちらのシステムの仕様書をきちんとつくらないとですか(苦笑)
2006/04/18(火)はてな記法の実装
はてなテーマを使用して*1、はてな記法まで実装したら、はてな盗作疑惑ですか(笑) まあどちらも完全互換ではないし、そもそもプログラムはフルスクラッチですから。*2
テキストパーサーの実装は結構頭を使いました。perlの正規表現を使ってこれだけ悩むのだから、Cで構文解析とかやりたくないですね(苦笑) こうやって実際に使い始めるとまともなテキストパーサーはほぼ必須でした。というか、ないと使い物にならなかったです、はい(汗)
テキストパーサーはプラグイン式でいくらでも拡張可能にしてありますので、みなさんお好みのパーサーをご用意くださいませ。TeXライクパーサーとかあったらそれもいいかなと思ったり思わなかったり。
2006/04/14(金)開発のつぶやき
一応使える状態になったので、サイトの日記をこちらに転記したいところ。自動化スクリプトでも書いた方がいいかもしれませんけどね(苦笑)
mixiの方には書きましたけど、元もとblogシステムのベースとなっているcgi用HTMLスケルトンシステム(Satsukiシステムと命名)が非常によく出来ている(自画自賛)ので、それを示すために作ったblogシステムと本末転倒気味ですけど(笑) 目標としてはRubyで動くtDiaryに対する、Perlで動くadiaryぐらいの位置づけになれればいいなーと思っております。Perlといえば、MovableTypeがありますが、あれはmod_perl2非対応なので(そしてDB必須だし、アホみたいに重たいし…)。
Perlは起動が遅いといいますか、インタプリタのPerlスクリプトをコンパイルしている時間が、起動時間の大半(本システムで約80%)を占めます。mod_perlやSpeedyCGIを使えば起動は早くできるのですが、レンタルサーバではそれは無理。データベース(BerkeleyDB含む)必須もレンタルには辛い。
使用するモジュールを徹底的に絞って、不必要なモジュールを直前までロードしないようにし、cgiとしての動作の高速化にはかなり気を使っています。環境非依存も、自前のテキスト型擬似データベース(GROUP BY が発行できちゃう(笑))を作成しました(テキスト型なので万が一の事態にも比較的安心です)。速度の方は、現状データ数がさほど多くないと、本格的なデータベースシステムよりよっぽど高速に動作してます(まだ逆転したことはないです)。個人で(シングルユーザーモード)で使う分にはまったく問題ないと思います。
2006/04/14(金)トラックバック - adiary拡張仕様(日本向け)
トラックバックの技術仕様 Version1.1に対する拡張です。
予備規定
- 文字コードの表示。日本語の文字コードは「EUC-JP」「UTF-8」「Shift_JIS」「iso-2022-jp」のいずれかの文字列を指定すること。
トラックバックフォーム(POSTデータ)の拡張
- トラックバックを受信する場合、未知のパラメータ(key)に対するデータは無視すること(規定外のフォームデータを送信してもよい)。
- charset パラメーター。トラックバックの文字コードを示す。トラックバックが日本語文字を含む場合、必ず含まなければならない。
- x_author パラメーター。その記事を書いた人の名前を x_author として送信することができる(optional)。
トラックバック送信時のヘッダ拡張
- トラックバックを送信時、クライアントはHTTPの定める「User-Agent」ヘッダを送信し、このときblogシステム(など)を名乗ることができる(optional)。
トラックバックURLへのGETの規定
- トラックバックURLをGETした場合、サーバソフトは Content-Type ヘッダに、charset を付加し内部文字コードを示さなければならない。ここで示す内部文字コードでトラックバックを送信した場合、文字化けしないことを保証しなければならない。
例)Contenet-Type: text/xml; charset=EUC-JP
- トラックバックURLをGETした場合、サーバソフトは拡張ヘッダ「X-TB-Accept-Charset」を出力し、トラックバックとして受信可能な文字コードをカンマ区切りで示すことができる(optional)。
例)X-TB-Accept-Charset: EUC-JP, UTF-8, Shift_JIS, iso-2022-jp, iso-8859-1
updates
- 2006/04/14 初版
- 2006/07/24 author を author_name に変更(WordPressでの問題に対応)
- 2006/08/01 WordPressへの対応のため、author_name を x_author に変更(fix)*1