2012.10.07
Perlで文字列の文字コードを判別し、断定出来ない場合は諦める方法
Tips for judging character code in Perl
use Encode::Guess qw/sjis euc-jp/;
my $enc = guess_encoding($判別するテキスト);
if (ref(\$enc) eq 'SCALAR'){諦める場合}
else{1つに絞れた場合
my $euc2=Encode::Guess->guess($判別するテキスト)->name;
if ($enc2 eq 'utf8'){・・・・・};
if ($enc2 eq 'euc-jp'){・・・・・};
}
・guess_encodingは失敗した場合はスカラーで「utf or shift-jis」とか「no appropriate encode」とか返すが、成功した場合に何返しているか分からない。
・guessは結果を事前にリストした文字列で返してくれるが判別に失敗するとdieする。
なので仕方なく2回判別しています。動けばいいです。
Category:Perl・Javascript・python、サーバー管理メモ
コメント
この記事のアクセス数:11322025.01.25正規表現のオンラインWebチェッカー
2021.12.05中国のSippedが50ドルQVGAののToFカメラユニットを今年中に出荷開始。UVC、UART/SPI出力3コメ
2021.12.05Pythonのコードをワンラインで実行形式に変換してくれるPyInstaller1コメ
2021.12.03チャート、グラフを書くのに良さそうなGoogle Chart以外のJavascriptライブラリ5つ3コメ
2021.11.18まだ使ってる?今は非推奨となったJavaScriptの書き方。document.writeが強く非推奨だと!!!?4コメ
2021.10.19PerlのGD::Image->new()は画像じゃないデータを読み込ませるとエラーになることがあるので事前に手動で画像であることを確認した方が良い1コメ
2021.10.12【解決済み】ヨドバシとかZOZOのサイトにどうやってもスクリプトからアクセス出来ない16コメ
2021.08.31現代的なPerlの記述方法一覧2コメ
2021.07.09JavaScriptでワンタッチで仮想キーボードを表示する2コメ
2021.02.10PythonでPowerPointを作るライブラリ「python-pptx」が色々活用出来そう。22コメ
→カテゴリー:Perl・Javascript・python、サーバー管理メモ(記事数:83)
アクセス数の多い記事(過去1ヶ月)
笳�2025.03.20:縺ゥ繧薙↑荳埼�蜷医′繝サ繝サ繝サ(譛ェ蛻�。�)681access
笳�2025.03.14:8蟷エ縺カ繧翫↓繧オ繝ウ繝ゥ繧、繧コ蜃コ髮イ縺ォ荵苓サ奇シ∝ョカ譌�4莠コ縺ァ縲後た繝ュ蛟句ョ、縲�4驛ィ螻九↓荳翫j荵苓サ翫@縺溘Γ繝「(#縺翫〒縺九¢諠��ア)485access
笳�2025.03.16:螟ァ驥上�繝ャ繝「繝ウ繧剃ス吶&縺壽棡豎∫オ槭k縺ョ縺碁屮縺励>縲ょョ峨>邨槭j蝎ィ縺ッ繧ッ繧ス縺ー縺九j(#閾ェ螳�DIY #繝ォ繝シ繝輔ユ繝ゥ繧ケ豢サ逕ィ)446access
笳�2025.03.11:蛻昴a縺ヲ縺ョ辟シ縺崎i縺阪s縺撰シ育黄隱槭さ繝シ繝昴Ξ繝シ繧キ繝ァ繝ウ)縺ョ譬ェ荳サ蜆ェ蠕�♀鬟滉コ句虻繧偵ご繝�ヨ��シ�シ�シ�シ∝━蠕��驟榊ス灘茜蝗槭j蟷エ邇�3��ィ句コヲ(#縺企≡ #繝槭ロ繝シ)363access
笳�2025.03.17:縺吶°縺�i繝シ縺秋D縺ョ譬ェ繧貞穀讌ュ縺励※44荳��繧イ繝�ヨ縲よ怙蠕後�譬ェ荳サ蜆ェ蠕�r蜿鈴��(#縺企≡ #繝槭ロ繝シ)358access