精华区 [关闭][返回]

当前位置:网易精华区>>讨论区精华>>编程开发>>C/C++>>编码解码>>乱码大全>>乱码大全(19)──日文和韩文的汉字编码(2)

主题:乱码大全(19)──日文和韩文的汉字编码(2)
发信人: wenbobo()
整理人: wenbobo(2002-12-22 01:27:57), 站内信件
发信人: bluesea (蓝海), 信区: Internet
标 题: 乱码大全(19)──日文和韩文的汉字编码(2)
发信站: BBS 水木清华站 (Tue Apr 14 15:16:09 1998)

乱码大全(19)──日文和韩文的汉字编码(2)

比较理想的方法是安装一套 NJWIN 1.6,特别要注意:在 PWindows 95 中需
要把Option 中的 My Windows Systems 选项设为 Standard English/Western。
( 如果你正在运行金山词霸之类的抓屏翻译软件,最好先关掉鼠标取词功能。)
这样,在 NJWIN 的编码选择菜单中分别去试验日文就韩文的选项。 上面五种编
码都可以被分别识别出来。如果试验不出来,应该考虑这个编码是否有可能属于
UTF-8 编码,请参考《乱码大全》中关于 UTF-8 编码的部分。

还有一种可以试验的方法,就是将邮件拷贝成一个纯文本文件,在文件的开
始加上这样一行:

<PRE>

然后将文件改名为 *.HTM,用 MS-IE 4.0 (需要事先安装日语和朝鲜语组件) 浏
览,逐一改变语言选项。用 Netscape Navigator 也同样可以。它们都无法识别
KHanzi,Netscape 对 UTF-8 的阅读也要打些折扣。其实,KHanzi 就是 KSC 汉
字去掉高位后的结果,和 GB 与 HZ 的关系很相似。类似的还有 BIG-HZ 等。

上面 5 种编码的转换还可以通过软件 MView Convert(下载地址参见“乱码
大全──Unicode(2; UTF-7与汉字乱码)” ) 来转换。另外,除了 KHanzi 之外,
前面 4 种编码还可以被 OutLook Express 予以转换。这需要我们在乱码的前面
加一个“信头”,格式如下:

MIME-Version: 1.0
Content-Type: text/plain;charset="iso-2022-jp"

其中引号以内的东西,可以是前面例子标题中方括号里的内容。注意如果原来有
信头,那么所加的这两行和原来的信头不要有空行,整个信头和正文至少要空一
行。然后将文件改名为 *.EML,然后双击它启动 OutLook Express (需要事先安
装日文和朝鲜语组件)。当然你可能需要经过试验才能获得正确的解码。

上面这几种编码可能会出现在电子邮件或相应的中文网点中。比如:日本的
中文周刊报纸《中文报道》( http://www.ntthi.com/cfm/ ) 的大部分内容就采用
的是 JIS 编码。 当然,编码的转换只适合以上编码中的汉字的转换,做不到翻
译。 BTW,如果你能够阅读日文(网页),却没有合适的日文浏览环境,不妨试一
试 http://www.shodouka.com/   ,这个服务器能够将你指定的日文网页转换成图
像来阅读,从而没有日文环境也能够阅读日文。

--
上帝创造猫,是为了让人类体验抚摸老虎的快乐。

※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 202.112.145.96]


[关闭][返回]