| VB 源码 | VC 源码 | ASP源码 | JSP源码 | PHP源码 | CGI源码 | FLASH源码 | 素材模板 | C 源程序 | 站长工具 | 站长教程 |

安全防范

木马病毒
黑客技术
系统安全
防火墙
安全防范

本类阅读TOP10

·双网卡共享上网解析
·常用端口对照详解
·技巧:多种途径访问局域网中的计算机
·代理服务器使用祥解
·在家远程控制公司的局域网电脑
·在Windows XP****享上网
·最新奇迹****复制漏洞大全(含98c)
·为什么局域网中机器PING通却不能上网?
·局域网共享资源安全防护大全
·远程破OICQ密码给工具QQExplorer ver 1.25介绍

站内搜索

UNICODE、DBCS的一点小知识
发表者: Darkness

首先DBCS是亚洲的字符集,包含了ANSI,ANSI也就是ASCII值为0-255之间的字符,当字符为ANSI时,存放于文件中占用的是一个字节。如果是非ANSI的呢,则占用两字节。用VB的ASC函数可以很容易得到一个字符的DBCS值(或是说ANSI值吧)

假如一个字符得到的DBCS值为&H1234,当然,这个值是转换成了十六进制的,因为对于磁盘存放来说,一般使用位(BIT),即二进制存放,而显示字节呢用十六进制显示则非常直观。存放在文件中即"12 34"(这是用十六进制文本编辑器中查看到的形式)

而UNICODE是世界性的字符集,几乎包含了世界上的所有字符,每个字符都有一个单一的UNICODE值。UNICODE值也是占用两个字节的。但不同的是它虽然也包含了标准的ANSI字符值,但是ANSI字符只占用一个字节,UNICODE会自动在ANSI值后加入一个值为0的字节。比如说一个ANSI值为&h45的字符,以UNICODE形式存放则为"45 00"。至于如何用VB得到一个字符的UNICODE值,ASCW函数可以轻松搞定。但是普通的非ANSI字符以UNICODE形式时则是从右存到左的。比如一个值为&H1234的字符,存为UNICODE时则为"34 12"

知道了这些有什么用呢?UNICODE的意义在于能让不同环境下的操作系统识别。比如说吧,你在中文的操作系统下使用记事本写了一篇文本文章。但你要拿到别的环境下的WIN2K(之所以选WIN2K,是因为WIN2K支持UNICODE,否则用WIN98只能用外接中文平台才能查看)下查看(比如美国的电脑,操作系统为英文,代码页也是美国(WIN2K有设置代码页)),即使该电脑已经安装了中文字体,即使用WORD这样的编辑软件打开也肯定是乱码一堆。这是为什么呢?因为英文的WIN2K操作系统只能识别UNICODE呀!并不能识别咱们亚洲的DBCS码呀!
解决方法只要你把它转换为UNICODE码存放就OK了!像Utrla Edit就能转换。WIN2K里也有代码转换器可以,而WIN2K下的记事本则可以用另chun为UNICODE码。如果你使用的是WIN9X,则可以自己用VB解决了。UNICODE码存放的文本文件与普通的文本文件不同之处仅仅是文件头加了"FF FE"而已。其他的则是代码值不同。只要转换了字符的代码,并在文件前加上"FF FE"这两个字节,就是把这篇中文文章保存为UNICODE格式了!转换成UNICODE格式后,英文操作系统的机器只要用WORD打开你的文件就能查看了!(为什么用WORD是因为它有字体识别功能。普通记事本只把文字链接到系统字体上,而英文系统的默认字体可不是不包含中文的哟!当然就显示不出来啦)


EXE等可执行文件的字串存放格式也差不多都是这样的。不过VB编写的程序有点意思,有些字符以DBCS存放,有些则是以UNICODE存放的。而其他工具编译的文件则大多为DBCS单一类型存放。DBCS存放的字符修改起来非常容易。使用UE这样的十六进制文本编辑器查找要修改的字串,只要把“查找ASCII”打上勾就OK了。但是用UNICODE存放的就不好这么找了。这下我们可以用VB来解决啦!前面已经提到,像一个值为&h1234的字符存放在文件中为"34 12"
那么我们用VB的ASCW函数得到它的十六进制值,再把值反过来不就可以了吗?反过来后再把这个值拿到UE中去搜索,不要把“查找ASCII”选上,这下我们要修改的文字就能找到了!再用VB把要替换进去的文字也转成相同的形式,再到UE里对照相应的值修改即可。


一般来说,VB里事先在开发环境下存放好的字符,如LABEL中的字符,就是以DBCS存放的。而硬编码在EXE中的文字。比如:
MSGBOX "这是编译在代码中的文字"
其中这几个中文字符就是以UNICODE形式存放的。还有资源文件中的字串资源亦是如此。
这样一来,即使软件作者硬编码在EXE中的文字我们都可以随意修改喽。HOHO


希望我写这篇文章对大家能有所帮助。


附:理论上程序使用UNICODE能不受操作系统环境影响,(WINDOWS的帮助上亦是如此之说)。但实际上因为受到字体链接等环境因素影响,并不能正常的显示出文字。要使软件国际化还是建议使用资源文件,多建几个不同代码页的字串表。这样一来方便以后修改,二来对于EXE程序的资源占用也有好处。



相关文章
  • 为什么要担心无线安全性
  • DDOS与DDOS追踪的介绍
  • 日志文件分析技巧
  • 一个号码可以让你取消手机的任何服务项目
  • 如何巧妙提取CHM文档中的GIF文件
  • 网际快车FlashGet使用技巧荟萃
  • ASP下载系统防盗链方法
  • 全面了解系统中 svchost.exe 文件
  • 四个方面谈Win 2000的安全设置
  • ipc$详细解释大全
  • ipc$详细解释大全(2)
  • ipc$详细解释大全(3)
  • ipc$详细解释大全(4)
  • ipc$详细解释大全(5)
  • ipc$详细解释大全(6)
  • ipc$详细解释大全(7)
  • ipc$详细解释大全(8)
  • 教你如何修改文件日期
  • QoS 机制及其互操作性简述
  • 让NFS格式电脑更安全
  • 相关软件

  • 突破屏保密码安全漏洞的源程序  
  • 口今管理器 for IIS,外国人的安全  
  • 封装了NT下底层安全功能的类  
  • 电脑安全卫士  
  • 关于windows nt安全性的程序  

  • 下载首页关于我们广告服务联系方式常见问题隐私声明法律条款本站声明下载帮助发布软件站点地图谷歌卫星地图