タグ

utf8に関するb-windのブックマーク (3)

  • perl - 勝手に添削 - utf8環境でperl::Jcodeのtrが使えないとき : 404 Blog Not Found

    2011年06月10日20:30 カテゴリ perl - 勝手に添削 - utf8環境でperl::Jcodeのtrが使えないとき CPANモジュールガイド 冨田尚樹 前世紀まではそれで正しかったのですが… utf8環境でperl::Jcodeのtrが使えないとき - satoru.netの自由帳 要はtrの中の文字のエンコードをeucにしないとだめらしい。なーんだ単純 21世紀ではEncodeを使っていただいたく。 Perl 5.8.1以降であれば、標準のPerlだけで出来ます。 こんな感じに。 use strict; use warnings; use utf8; binmode STDOUT, ':utf8'; my $str = 'あいうえおぁぃぅぇぉ'; print $str, "\n"; $str =~ tr/ぁ-んヴ/ァ-ンヴ/; print $str, "\n"; ポイント

    perl - 勝手に添削 - utf8環境でperl::Jcodeのtrが使えないとき : 404 Blog Not Found
  • Perl 5.8.x Unicode関連

    -> 趣旨と注意書き -> UTF8フラグ? -> UTF8フラグとPerlIOレイヤ -> UTF8フラグのついた文字列を記述する -> Wide character in print ... -> Encode -> utf8::* -> use utf8; -> use encoding; -> use UTF8 と use encoding -> JcodeからEncodeへ -> 情報源 <- モドル 趣旨と注意書き Perl 5.8.x のUnicode 関連です。 正直、5.8.x は、ネタでしか使ってなかったので(ぉ、ちゃんといじったことがありませんでした。 使ってみると、よくわかんなくなったので、ちょっとまとめてみました。 今でもあんまりわかってないかもしれないので、内容は無保証です。 突っ込み歓迎。 Jcode、Encodeのメンテナの弾さんから、ご指摘いただいたので、

  • Perlによる日本語コード変換のメモ(第二版)

    Perlによる日語コード変換のメモ(第二版) hikoboshi.home / Perlによる日語コード変換のメモ(第二版) 前に書いたときと時代背景も知識も大幅に違うので、書き直してみることにしました。Perl 5.8以降を前提として考えます。 この文章で書く(つもりの)こと use utf8環境での、文字セットの考え方 発生しがちな文字化けとその原因 解決のヒント jcode.pl時代の文字セットの扱い まずは、jcode.plなどが全盛だった時代を思い出してみます。jcode.plの時代は、Unicodeはほぼ使われておらず、JIS, Shift_JIS, EUC_JPあたりの変換を行う事が主でした。実際のコードを見て、扱われ方を考察してみましょう。 #!/usr/bin/perl # jcode.plを用いたコード変換 require 'jcode.pl'; open my $

  • 1