漢字のマッチング

ShiftJIS::Regexp - Shift-JISで書かれた正規表現
http://nomenclator.la.coocan.jp/perl/mod/sjreg-j.htm

JIS X 0208:1997の第一・第二水準漢字;    [\x{889F}-\x{9872}\x{989F}-\x{EAA4}]
JIS X 0213:2004の第三水準漢字;  [\x{879F}-\x{889E}\x{9873}-\x{989E}\x{EAA5}-\x{EFFC}]
JIS X 0213:2004の第四水準漢字;          [\x{F040}-\x{FCF4}]
JIS X 0213:2004の第一から第三水準漢字;  [\x{879F}-\x{EFFC}]
JIS X 0213:2004の第一から第四水準漢字;  [\x{879F}-\x{FCF4}]
CP-932, NEC選定IBM拡張文字中の漢字;     [\x{ED40}-\x{EEEC}]
CP-932, IBM拡張文字中の漢字;            [\x{FA5C}-\x{FC4B}]


ShiftJIS::Regexp
https://metacpan.org/dist/ShiftJIS-Regexp/view/Regexp.pod

Level 1 and 2 kanji by JIS X 0208:1997;   [\x{889F}-\x{9872}\x{989F}-\x{EAA4}]
Level 3 kanji by JIS X 0213:2004; [\x{879F}-\x{889E}\x{9873}-\x{989E}\x{EAA5}-\x{EFFC}]
Level 4 kanji by JIS X 0213:2004;         [\x{F040}-\x{FCF4}]
Level 1 to 3 kanji by JIS X 0213:2004;    [\x{879F}-\x{EFFC}]
Level 1 to 4 kanji by JIS X 0213:2004;    [\x{879F}-\x{FCF4}]
Kanji in NEC-selected IBM extended chars; [\x{ED40}-\x{EEEC}]
Kanji in IBM extended characters;         [\x{FA5C}-\x{FC4B}]


IBM拡張漢字
http://kangxi.cswiki.jp/index.php?IBM%E6%8B%A1%E5%BC%B5%E6%BC%A2%E5%AD%97

薄緑色はJIS第3水準、薄黄色はJIS第4水準に収録されている漢字。薄赤色はJIS第3、第4水準に収録されておらず、JIS補助漢字には収録されている漢字である