HOME | ドキュメント |  ブログ  |  BBS  |  瓦版  | 将棋プロジェクト |  物置小屋   

ドキュメント 象歩 Web瓦版
 BBSボード RDF
こんにちは (23)
おためし板 (321)
質問箱 (94)
テスト (30)
You散歩 (4)
建築 DIY (6)
MTB (32)
(9)
節電対策 (2)
このサイトに関する話 (186)
Linux (396)
PC用ハードウェア (6)
Vine Linux 野良系 (64)
PC 工作 (31)
ドローン (0)
自家製GAFA (0)
BBS の改良 (105)
Vine Seed (520)
Zope とプロダクト (95)
Web の利用技術 (131)
DB とファイルシステム (63)
Python と C/C++ と... (29)
Zopeプロダクト開発メモ (3)
UTF-8 化 (42)
Mail 環境 (8)
COREBlog (109)
Zope3 (51)
Windows 64bit (19)
Mac (2)
Squeak スクイーク (67)
Django ぶらり一人旅 (3)
64bits (52)
Mono 思いにふける (10)
Mint Linux (8)
CentOS (2)
ディスクトップ (4)
象歩将棋 (478)
将棋よもやま (210)
サイトのデザイン (31)
心配な話 (66)
うそ (21)
うそ総集編 (0)
昔のゲストブック (20)
ボート部 (23)
Web 日記 (199)
 スパム
逮捕しる (20)
スパムお溜り (47)
ごみ箱 (6)
 リンク
kiyoさんのサイト
ペンタ郎の漫漕ブログ
端艇部員日記
TIT漕艇部の練習動画 @YouTube
墨堤の雄 @FaceBook
ペンタ(五大学ミドル) @FaceBook
Facebook
Vine Seed パッケージビルド状況
Vine Linux パッケージ情報
VineLinux バグトラッキングセンタ
VineSeed 開発用 Trac
VineSeed Specs
RPMパッケージの作成方法
Linux Standard Base
Planet Vine
Vine Linux ユーザーフォーラム
Vine Users ML アーカイブ
VineSeed ML アーカイブ
twitter#VineLinux
勝手に将棋トピックス
詰将棋おもちゃ箱

UTF-8 化

このサイトをUTF-8にしたのは良いが、これから問題出そう。


このまま記事を入力し[投稿する]ボタンを押せば当サイトに送信されます。 以下の文章は注意書きです。

名前はかならず記入してください。ハンドルネームでも構いません。 またパスワードを入力することをお勧めします。 その場合他人による *なりすまし* と区別出来るかもしれません。 さらにブラウザでクッキーを有効に設定してある場合あなたの記事は後で修正可能になります。

コメントスパム防止のため記事の内容を機械的にモデレート (スパムである確率を計算) する処理を通します。 どのような投稿であれ、たまたま計算誤差によりスパムとみなされ 秘密の場所 に収納される可能性があります。 その場合、管理人が手作業で正規の場所に移動しますのでお待ちください。

名前  パスワード(任意)

全42件 - 01 02 03 04 05

8  kiyo  2003/11/22 19:45 id: M4qDt4tUHP2  prob: 0.3%
>>6 アダプタ Psycopg は大丈夫なのだろうか?
大丈夫じゃないかなあー。
まだ実験中だけど今のところ良いような
最近 Firebird の方が blob での UTF-8 にバグあるんじゃないかと
騒いでるよー。
うーん、一番安心できると思っていたのに。。。
7  owa  2003/10/04 22:09 id: mJs8kxp1Zus  prob: 0.0%
下調べの最後にコンテンツの変換。
最初は ftp で持ってきて変換して戻すとか、
ZODB ツールを改修して一発で変換することとか考えていたけど、
なぜか気が乗らない... そうだプロダクトを作ろう
とりあえず単純なプロダクト作ってみた。
設定文字コード、タイトル、生データが見えることを確認。
(Folder, DTML Document, DTML Method, Python Script, TinyTablePlus)
web 経由で使える文字コード変換ツールが作れそう。
という理由で、この辺から始めることにした。
1. コンテンツの変換
2. 例外への対応
3. RDB の UTF-8 化
6  owa  2003/10/03 22:38 id: mJs8kxp1Zus  prob: 4.1%
PostgreSQL は UTF-8 対応済みらしいけど、いろいろめんどうかも。
http://search.net-newbie.com/pgsql/multibyte.html
と正式に対応しているらしいので、RDB は UTF-8 に決定。
ターミナル(kterm)で見られるのかとか、dump したもののチェックとか
周辺に難点が見付かる可能性はある。
http://pop-club.hp.infoseek.co.jp/unix/postgres_utf.html
アダプタ Psycopg は大丈夫なのだろうか?
などと心配事があるので、一番後回しにしよう。
5  owa  2003/10/02 22:07 id: mJs8kxp1Zus  prob: 1.0%
LocalFS は UTF-8 未対応、というより
ファイルシステムが未対応なので、なるべく使わない方針でいく。
現状では UTF-8 にした場合、日本語ファイル名はエラーになって使えない。
Python Script で 'context.management_page_charset' を見れば、
エンコードタイプが取得できるので、
どうしても使おうと云うならコード変換を追加するしかない。
RDFSummary は変換するように書き換える。
エンコードのプロパティを追加することも考えられる。
4  owa  2003/09/30 22:10 id: mJs8kxp1Zus  prob: 0.0%
vim-6.1 は UTF-8 も対応している
ということで試してみた。
まずは、使えるエディタがないと始まらないので。

~/.vimrc を修正
---
set fileencoding=euc-jp
set fileencodings=iso-2022-jp,utf-8,euc-jp
---
などとすると、external-editor のペン型アイコンをクリックするだけで、
utf-8 で書かれたページを、そのまま編修することができた。
ちなみに、新規ファイルの場合は vim 起動後
:set fileencoding=utf-8
と打ち込む。

これで external-editor を改造する必要は無さそう。
(仕事は減らすもの;;)
3  owa  2003/09/29 22:44 id: mJs8kxp1Zus  prob: 0.2%
ZenKaiからリンク拝借
http://www.atransia.co.jp/home/ZenKai/Members/kafka/CMFWiki/...
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/105...
http://www.atransia.co.jp/home/ZenKai/Members/kafka/News/104...
ついでに
http://www.openi18n.org/subgroups/utildev/dli18npatch2.html
ftp://ftp.ilog.fr/pub/Users/haible/utf8/Unicode-HOWTO-4.html...
http://www.cl.cam.ac.uk/~mgk25/unicode.html#
あと、この辺も
http://www.linux.or.jp/JM/html/LDP_man-pages/man7/utf-8.7.ht...
http://www.debian.org/doc/manuals/intro-i18n/ch-languages.en...
きっと沢山あるだろうけど、後はテーマ毎に少しずつ...
2  owa  2003/09/29 22:32 id: mJs8kxp1Zus  prob: 0.0%
昔突然 XLocale 廃止の話が出て、右往左往したのも懐かしい。
ロケールは glibc でやってよ、X11 ではもう面倒見ないよと云う話。
(↑ちと記憶があやふやだけど) 国内の linux ユーザは困った。
その時、見付けたのが Vine というプロジェクト。
今も Vine を使っているのは、インストールしてすぐに日本語が使え、
C/C++開発環境も十分使えると云う理由が大きい。
きっと UTF-8 移行の時も似たようなことが起きるに違いない。
少しは賢いふりして、今のうちに準備しようと思っただけ。
もし国際化という観点から考えれば、Debian も選択枝のうち。
1  owa  2003/09/29 21:48 id: mJs8kxp1Zus  prob: 0.5%
このサイトの文字コードを UTF-8 にしようと考えた。
まずは問題点から整理しないといけない。

課題-1. コンテンツ
 日本語で書いてあるので euc-jp → UTF-8 変換が必要。
 (DTML Document, DTML Method, TinyTablePlus)

課題-2. プログラム
 文字列処理の見直し(size切り出し、 文字数カウントなど)
 (Python Script, External Method, 自家製プロダクト)

課題-3. BBS の RDB (PostgreSQL)
 現在データが日本語 euc。UTF-8 に入れ換えるか、入出力時に変換するか。
 DB に UTF-8 で収納すれば何も問題なさそうだが?

課題-4. 瓦版の RDFSummary
 強制的に euc-jp に変換しているが、環境変数を見て決めないといけない。
 象歩BBSの rdf は UTF-8 にしよう。

課題-5. 編集手段
 ExternalEditor を多用してるが、euc-jp ←→ UTF-8 変換入れるか、
 vim で UTF-8 のまま編集するか。

課題-6. 将棋プロダクト
 最初から UTF-8 対応で作る。実はこれが動機かも。
 日本語のコメントがどうしても必要みたいなので、考えどころ。

ざっと考えてこんなところ? うまくやるには段取りが大切のようです。
あせらず、急がず、参ろうか。