UTF-8 化
このサイトをUTF-8にしたのは良いが、これから問題出そう。
このまま記事を入力し[投稿する]ボタンを押せば当サイトに送信されます。
以下の文章は注意書きです。
名前はかならず記入してください。ハンドルネームでも構いません。
またパスワードを入力することをお勧めします。
その場合他人による *なりすまし* と区別出来るかもしれません。
さらにブラウザでクッキーを有効に設定してある場合あなたの記事は後で修正可能になります。
コメントスパム防止のため記事の内容を機械的にモデレート
(スパムである確率を計算)
する処理を通します。
どのような投稿であれ、たまたま計算誤差によりスパムとみなされ
秘密の場所
に収納される可能性があります。
その場合、管理人が手作業で正規の場所に移動しますのでお待ちください。
-
5
owa
2003/10/02 22:07
id: mJs8kxp1Zus
prob: 1.0%
-
-
LocalFS は UTF-8 未対応、というより
ファイルシステムが未対応なので、なるべく使わない方針でいく。
現状では UTF-8 にした場合、日本語ファイル名はエラーになって使えない。
Python Script で 'context.management_page_charset' を見れば、
エンコードタイプが取得できるので、
どうしても使おうと云うならコード変換を追加するしかない。
RDFSummary は変換するように書き換える。
エンコードのプロパティを追加することも考えられる。
-
4
owa
2003/09/30 22:10
id: mJs8kxp1Zus
prob: 0.0%
-
-
vim-6.1 は UTF-8 も対応している
ということで試してみた。
まずは、使えるエディタがないと始まらないので。
~/.vimrc を修正
---
set fileencoding=euc-jp
set fileencodings=iso-2022-jp,utf-8,euc-jp
---
などとすると、external-editor のペン型アイコンをクリックするだけで、
utf-8 で書かれたページを、そのまま編修することができた。
ちなみに、新規ファイルの場合は vim 起動後
:set fileencoding=utf-8
と打ち込む。
これで external-editor を改造する必要は無さそう。
(仕事は減らすもの;;)
-
3
owa
2003/09/29 22:44
id: mJs8kxp1Zus
prob: 0.2%
-
-
ZenKaiからリンク拝借
http://www.atransia.co.jp/home/ZenKai/Members/kafka/CMFWiki/...
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/105...
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/104...
ついでに
http://www.openi18n.org/subgroups/utildev/dli18npatch2.html
ftp://ftp.ilog.fr/pub/Users/haible/utf8/Unicode-HOWTO-4.html...
http://www.cl.cam.ac.uk/~mgk25/unicode.html#
あと、この辺も
http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.ht...
http://www.debian.org/doc/manuals/intro-i18n/ch-languages.en...
きっと沢山あるだろうけど、後はテーマ毎に少しずつ...
-
2
owa
2003/09/29 22:32
id: mJs8kxp1Zus
prob: 0.0%
-
-
昔突然 XLocale 廃止の話が出て、右往左往したのも懐かしい。
ロケールは glibc でやってよ、X11 ではもう面倒見ないよと云う話。
(↑ちと記憶があやふやだけど) 国内の linux ユーザは困った。
その時、見付けたのが Vine というプロジェクト。
今も Vine を使っているのは、インストールしてすぐに日本語が使え、
C/C++開発環境も十分使えると云う理由が大きい。
きっと UTF-8 移行の時も似たようなことが起きるに違いない。
少しは賢いふりして、今のうちに準備しようと思っただけ。
もし国際化という観点から考えれば、Debian も選択枝のうち。
-
1
owa
2003/09/29 21:48
id: mJs8kxp1Zus
prob: 0.5%
-
-
このサイトの文字コードを UTF-8 にしようと考えた。
まずは問題点から整理しないといけない。
課題-1. コンテンツ
日本語で書いてあるので euc-jp → UTF-8 変換が必要。
(DTML Document, DTML Method, TinyTablePlus)
課題-2. プログラム
文字列処理の見直し(size切り出し、 文字数カウントなど)
(Python Script, External Method, 自家製プロダクト)
課題-3. BBS の RDB (PostgreSQL)
現在データが日本語 euc。UTF-8 に入れ換えるか、入出力時に変換するか。
DB に UTF-8 で収納すれば何も問題なさそうだが?
課題-4. 瓦版の RDFSummary
強制的に euc-jp に変換しているが、環境変数を見て決めないといけない。
象歩BBSの rdf は UTF-8 にしよう。
課題-5. 編集手段
ExternalEditor を多用してるが、euc-jp ←→ UTF-8 変換入れるか、
vim で UTF-8 のまま編集するか。
課題-6. 将棋プロダクト
最初から UTF-8 対応で作る。実はこれが動機かも。
日本語のコメントがどうしても必要みたいなので、考えどころ。
ざっと考えてこんなところ? うまくやるには段取りが大切のようです。
あせらず、急がず、参ろうか。
|