UTF-8 化
このサイトをUTF-8にしたのは良いが、これから問題出そう。
このまま記事を入力し[投稿する]ボタンを押せば当サイトに送信されます。
以下の文章は注意書きです。
名前はかならず記入してください。ハンドルネームでも構いません。
またパスワードを入力することをお勧めします。
その場合他人による *なりすまし* と区別出来るかもしれません。
さらにブラウザでクッキーを有効に設定してある場合あなたの記事は後で修正可能になります。
コメントスパム防止のため記事の内容を機械的にモデレート
(スパムである確率を計算)
する処理を通します。
どのような投稿であれ、たまたま計算誤差によりスパムとみなされ
秘密の場所
に収納される可能性があります。
その場合、管理人が手作業で正規の場所に移動しますのでお待ちください。
-
19
owa
2003/12/08 23:56
id: mJs8kxp1Zus
prob: 0.1%
-
-
>>18 owa さんが作るならやめるかも
見なかったことにします。
>> pykf の何処が異常なのですか
pykf 作られた方ごめんなさい。言い方が悪うございました。
まだそこまで手が回ってないだけです;;
とりあえずちょっと修正したところ
'Folder', 'File', 'DTML Method', 'DTML Document', 'Script (Python)'
'ZWiki Page', 'TinyTable'
あたりはエンコード変換できるみたいです。
あとは深追いしません。最初の目的を忘れないようにしないと。
週末あたりに Jexch β版置くつもりです。
-
18
kiyo
2003/12/08 00:56
id: M4qDt4tUHP2
prob: 0.2%
-
-
Jexch-0.1.0.tar.gz 待ってた(頂き^^)
RDB の utf-8化は、まだ先になるけどメモで訪ねたinpboxDBに盛り込もうかと思ってます。
owa さんが作るならやめるかも?
pykf の何処が異常なのですか?
-
17
owa
2003/12/08 00:37
id: mJs8kxp1Zus
prob: 0.0%
-
-
Jexch-0.1.0.tar.gz 置いて見ました
ftp://owa.as.wakwak.ne.jp/pub/Zope/Jexch
まだ未完成だけど使えないことはないです。
絶対に本番サーバでは使用しないでください。
セキュリティについて何も考慮していない上に、
Zope サイトがめちゃくちゃになるかもしれません。
エンコードモジュールの選択は kconv のままにしてください。
pykf はまだ動作が異常です(使いかたが悪いと云う)
ただ pykf が入ってないとコンテンツのエンコードが判別できません。
だからやっぱり今は使わない方が良いと思います。
あと kconv と pykf がインストールされている環境を対象にしています。
もう一つ忘れていたけどコンテンツの変換は DTML しかまだ書いてません。
# だんだん備忘録ぽくなってきた;;
(やっぱり削除するかも)
-
16
owa
2003/12/07 23:21
id: mJs8kxp1Zus
prob: 0.0%
-
-
ちょっと振り返ってみました
1. コンテンツのUTF-8 変換 -- OK
2. スクリプト -- ちょっと直す
3. RDB -- UTF8 にコンバート (kiyo さんのを参考にする)
4. 瓦版の RDFSummary -- 直す
5. ... OK
6. ... OK
というわけで、RDB 移植と RDFSummary の修正だけでいけそう。
段取りは、
0. セコ鯖に Data.fs 移植
1. コンテンツの UTF-8 変換
2. スクリプトや RDFSummary の修正
3. RDB の UTF8 化スクリプト作成
ここまで準備してから...
4. セコ鯖にアドレス変更 (BBS停止)
5. 別マシンで最新 RDB を UTF-8 に変換する
6. セコ鯖で BBS 開始
7. チャン鯖をゆっくり落ち着いて修正
8. チャン鯖にアドレスを戻す。
4,5,6 うまく行けば1分くらいの停止で済みそうだが、
全部やるには一月くらいかかるかも;;
あまりこういう処でぐずぐずしてるのは嫌だす
-
15
owa
2003/12/06 23:53
id: mJs8kxp1Zus
prob: 0.7%
-
-
今いじったら出来ました。
一応検証して 12/14 までにはβ公開予定。
# スケジュールは白紙に;;
-
14
owa
2003/12/05 00:44
id: mJs8kxp1Zus
prob: 0.2%
-
-
いまのうちに UTF8 化しないとまずくない?
戦えないと話にならないので、ツール作成予定を発表することにした。
このツールでできること
フォルダの management_page_charset や基本的なオブジェクトのテキスト
部分のエンコードをインタラクティブに変換すること。
スケジュール
---
0.1.0. UTF-8 エンコード変更処理の実装を完了
0.1.1. β版公開
---
0.3.1. エンコード判別メソッドを独自に作る (精度と信頼性アップ)
0.3.2. 表示用文字列カットメソッド作る
0.3.3. コメントを入れる
0.3.4. セキュリティ関連追加
---
0.5.1. オブジェクトの種類を拡張できるようにリファクタリング
0.5.2. エンコーダの種類を拡張できるようにリファクタリング
---
とりあえず予定だけ。β版は今年中になんとか...
-
13
owa
2003/11/27 00:57
id: mJs8kxp1Zus
prob: 0.3%
-
-
あとでゆっくり見ようと思ったサイト
http://oss.software.ibm.com/icu/download/2.8/index.html
http://www.egenix.com/files/python/unicode-proposal.txt
今作ってるツールで kconv はうまく変換してくれるが pykf は何か変。
文字コードはゆっくり考えないといろいろボロが出そうです。
http://www.python.jp/Zope/download/JapaneseCodecs
-
12
kiyo
2003/11/26 00:14
id: M4qDt4tUHP2
prob: 4.8%
-
-
課題-2 は柴田さんでしょう。
僕じゃないよー。
課題-3 も ここから情報もらったものです。
あたしゃ、何にもしてない。
-
11
owa
2003/11/25 23:31
id: mJs8kxp1Zus
prob: 0.2%
-
-
課題-2,3 を kiyo さんに解決してもらったみたい;;
課題-1 は今作っているツールでいちおう解決する見込み。
ということで、当初の課題は短命で終わるかもしれないのだけど、
実際はこれから発生する問題で、いろいろ続くという予感がします。
とりあえず第一段は今年中に終了させるのを目標としよう。
# 作るのは一割、検証が九割ということですので
過程で作ったものとか、パクって修正したものは、どこかにまとめて置きます。
って終わったみたいだけど、ほとんどこれからです;;
-
10
owa
2003/11/23 23:24
id: mJs8kxp1Zus
prob: 0.0%
-
-
UTF変換プロダクトDTMLで作ってたけど繁雑なので内部でpythonに切替え中。
そろそろ自家製pythonスクリプトが心配になってきた。
文字列をsizeでちょん切るメソッドとか見直さないといけない。
pythonに既にutf対応メソッドあるのかもしれない、全く調査不足。
|