RSS取得後エンコード変更CGI

The T World は UTF-8 で出力しているため、MTRSSFeedを使用する再、ソースとなるRDFファイルのエンコードもUTF-8のものしか正しく表示することができなかった。そこで、Rubyをつかって簡単なCGIスクリプトを作成し、CGI実行時に最新のRDFファイルを取得してUTF-8に変更するようにしてみた。

ファイル名 getrss.rb
引数 rss:ソースとなるRDFファイルのURI
ie:ソースRDFファイルのエンコード
oe:出力するエンコード
使用例 getrss.rb?http://www.randt.jp/index.rdf?ie=UTF-8?oe=UTF-8

rexmlを使用しているが、rexml内でUTF-8に強制的に変換しているように思われる。また、Iconvは UTF-8 から EUC-JP, ISO-2022-JP の変換でほとんどの場合Exceptionを出す。したがって、作り的にはINPUT/OUTPUTは自由にエンコードを指定できるように見えるが、OUTPUTはUTF-8しか実用に耐えない。この辺りは残件。

コメントを残す