字符集编码问题有关转帖(共3篇)如有违权

来自:http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=121&threadID=10601&messageID=161934

论坛首页 ? 技术专区 ? Web Application Development

主题: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

回复: 37   页数: 3   最后提交: Oct 17, 2005 3:28:53 PM

  欢迎, 客人 

 访客设置 

转到  [根类别][版务] ?  论坛工作室[产品专区] ?  Tuxedo ?  BEA WebLogic Server ?  BEA WebLogic Portal ?  BEA WebLogic Integration ?  BEA Workshop ?  BEA General[技术专区] ?  Web Application Development ?  EJB Development ?  JDBC & Transaction ?  Design Pattern ?  Develop Tools ?  J2ME Development[BEA活动] ?  北京 User Group ?  上海 User Group ?  青岛 User Group ?  杭州 User Group ?  天津 User Group ?  广州User Group[小憩一会] ?  程序人生 ?  历史的天空[只读栏目] ?  WebLogic开发 

 

 发新帖 

  回复此主题 

  搜索论坛 

 

  返回到 主题 列表  

回复: 37   页数: 3   [ << | 1 2 3 ] 

phoenixatsh [普通用户]

发帖数: 356

活跃积分: 348

技术积分: 10

可用币值: 288

注册时间: 2005-6-11

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 16, 2005 3:30:23 PM          回复    发消息 

 

GB2312是GBK的子集

--------------------------------------------------------------------------------

blog: http://javaniao.blogdriver.com/

 

 

yexichang [普通用户]

发帖数: 494

活跃积分: 403

技术积分: 0

可用币值: 123

注册时间: 2005-1-31

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 16, 2005 10:00:03 PM          回复    发消息 

 

GB2312是GBK的子集,不过既然有了UTF8还是用这个好,对自己也没有什么影响,还方便以后国际化

--------------------------------------------------------------------------------

 

 

kingyz [普通用户]

发帖数: 51

活跃积分: 47

技术积分: 0

可用币值: 32

注册时间: 2004-4-21

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 9:34:45 AM          回复    发消息 

 

gb2312属于GBK

--------------------------------------------------------------------------------

 

 

focus2004 [普通用户]

发帖数: 106

活跃积分: 86

技术积分: 1

可用币值: 86

注册时间: 2004-8-9

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 9:35:34 AM          回复    发消息 

 

这不是哪个好哪个不好的问题,看你的需要哦,我常用的是GBK

--------------------------------------------------------------------------------

I love Java! 

 

keithhe [普通用户]

发帖数: 568

活跃积分: 499

技术积分: 5

可用币值: 324

注册时间: 2004-4-5

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 9:43:47 AM          回复    发消息 

 

尽量全部采用UTF-8        

--------------------------------------------------------------------------------

胡思乱想,就怕你不敢想 

 

xuefengl [普通用户]

发帖数: 1,009

活跃积分: 962

技术积分: 31

可用币值: 317

注册时间: 2004-2-29

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 10:13:11 AM          回复    发消息 

 

为了避免所有乱码问题,应该全部采用UTF-8,包括Java源文件/JSP/HTML...

将来要支持国际化也非常方便

--------------------------------------------------------------------------------

// see:

http://blog.csdn.net/asklxf/

http://www.j2medev.com/

http://www.crackj2ee.com/ 

 

zhzg605 [普通用户]

发帖数: 1,041

活跃积分: 971

技术积分: 24

可用币值: 306

注册时间: 2004-11-24

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 10:31:32 AM          回复    发消息 

 

建议不要用gbk2312 用gbk 因为有些数据库服务器,或者unix服务的一些

生僻汉字用gbk2312 无法显示。

--------------------------------------------------------------------------------

 

 

shgodttj [普通用户]

发帖数: 234

活跃积分: 200

技术积分: 0

可用币值: 0

注册时间: 2005-3-7

用户状态:正常

 

 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?

提交时间: Oct 17, 2005 3:28:53 PM          回复    发消息 

 

应该全部采用UTF-8

--------------------------------------------------------------------------------

http://www.gody.cn 

 

××××××××××××××××××××××××××××××××××××××××××××××××××××××××××

来自:http://www.mambo.cn/smf/index.php/topic,582.new.html

  中曼中心简练机器论坛

  utf-8技术讨论 (utf-8 Tech)

  服务器设置 (版主: dylon)

  对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解 0 会员 以及 2 访客 正在阅读本篇主题. ? 上一篇主题 下一篇主题 ? 

页: [1]   

 

 作者  主题: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解  (阅读 1720 次) 

zhous

管理员(Admin)

曼波五段

 离线

文章: 590

   对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解

? 于: 七月 02, 2005, 11:22:02 am ? 

--------------------------------------------------------------------------------

来源:Donews 

Unicode:

unicode.org制定的编码机制, 要将全世界常用文字都函括进去.

在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.

UCS:

ISO制定的ISO10646标准所定义的 Universal Character Set, 采用4byte编码.

Unicode与UCS的关系:

ISO与unicode.org是两个不同的组织, 因此最初制定了不同的标准; 但自从unicode2.0开始, unicode采用了与ISO 10646-1相同的字库和字码, ISO也承诺ISO10646将不会给超出0x10FFFF的UCS-4编码赋值, 使得两者保持一致.

UCS的编码方式:

UCS-2, 与unicode的2byte编码基本一样.

UCS-4, 4byte编码, 目前是在UCS-2前加上2个全零的byte.

UTF: Unicode/UCS Transformation Format

UTF-8, 8bit编码, ASCII不作变换, 其他字符做变长编码, 每个字符1-3 byte. 通常作为外码. 有以下优点:

* 与CPU字节顺序无关, 可以在不同平台之间交流

* 容错能力高, 任何一个字节损坏后, 最多只会导致一个编码码位损失, 不会链锁错误(如GB码错一个字节就会整行乱码)

UTF-16, 16bit编码, 是变长码, 大致相当于20位编码, 值在0到0x10FFFF之间, 基本上就是unicode编码的实现. 它是变长码, 与CPU字序有关, 但因为最省空间, 常作为网络传输的外码.

UTF-16是unicode的preferred encoding.

UTF-32, 仅使用了unicode范围(0到0x10FFFF)的32位编码, 相当于UCS-4的子集.

UTF与unicode的关系:

Unicode是一个字符集, 可以看作为内码.

而UTF是一种编码方式, 它的出现是因为unicode不适宜在某些场合直接传输和处理. UTF-16直接就是unicode编码, 没有变换, 但它包含了0x00在编码内, 头256字节码的第一个byte都是0x00, 在操作系统(C语言)中有特殊意义, 会引起问题. 采用UTF-8编码对unicode的直接编码作些变换可以避免这问题, 并带来一些优点.

中国国标编码:

GB 13000: 完全等同于ISO 10646-1/Unicode 2.1, 今后也将随ISO 10646/Unicode的标准更改而同步更改.

GBK: 对GB2312的扩充, 以容纳GB2312字符集范围以外的Unicode 2.1的统一汉字部分, 并且增加了部分unicode中没有的字符.

GB 18030-2000: 基于GB 13000, 作为Unicode 3.0的GBK扩展版本, 覆盖了所有unicode编码, 地位等同于UTF-8, UTF-16, 是一种unicode编码形式. 变长编码, 用单字节/双字节/4字节对字符编码. GB18030向下兼容GB2312/GBK.

GB 18030是中国所有非手持/嵌入式计算机系统的强制实施标准.

 

  已记录 

天下本无事,庸人自扰之??好象有点道理 

 

 

Autoit

曼波三段

 离线

文章: 154

Hi,Mambo, I'm Autoit.

    Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解

? 回复文章 #1 于: 七月 02, 2005, 11:45:36 am ? 

--------------------------------------------------------------------------------

收藏!!! 

 

  已记录 

http://xiaowei.cn 小薇精品婚纱

http://www.123yls.com 伊莉莎数码婚纱

http://www.lishabeila.com 伊莎贝尔时尚婚纱

...会聚 厦门精品婚纱 ... 

 

 

zijie

曼波学员

 离线

文章: 8

   Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解

? 回复文章 #2 于: 十月 13, 2005, 01:07:09 am ? 

--------------------------------------------------------------------------------

好文章

 

  已记录 

 

 

 

 

页: [1]     

 

××××××××××××××××××××××××××××××××××××××××××××××××××××××××××

来自:http://www.hongen.com/pc/newer/ime/problem/problem3.htm

当前位置:洪恩在线 -> 电脑乐园 -> 输入法

 

常见问题解答   

 一.什么是BIG5码? 

 二.什么是GBK?

 三.添加和删除输入法

 四.设置输入法的属性

 五.给输入法定义快捷键

 六.调整输入法的次序

 七.大字符集汉字的输入

 

谈谈您的看法

已有 0 条发言

   常见问题解答

常见问题解答

  六、 调整输入法的次序

  输入法在状态栏有一个图标,点击输入法图标就可以选择输入法。但排第一的图标可以用“Ctrl+Space”热键启动,因此可以将自己常用的输入法排列到前面。

  一个简单的方法,就是先将最常用的输入法删除,再重新安装该输入法,最常用的输入法就安装在前面了。

  第二种方法是通过修改注册表来调整输入法的顺序、增加或删除输入法,甚至可做到Windows 95/98启动后的缺省输入法为汉字而不是英文。 通过对注册表的分析,可以发现在HKEY_LOCAL_MACHINE\SYSTEM\ CurrentControlSet\Control\keyboard layout\下存放着各输入法对应的主键,见下表所示:

  在HKEY_USERS\.DEFAULT\keyboard layout\preload\下则是系统所安装的输入法的主键及键值,其主键为自然数,键值为上表中各输入法对应的主键。例如系统已安装了“智能ABC”、“全拼”和五笔输入法,则可看到如下的主键和键值:

  主键 键值  

  1 00000409   2 E0040804   3 E0010804   4 E0220804   

  下面我们来改变输入法的顺序:

  假设要将输入法顺序变为“英文”、“五笔”、“全拼”和“智能ABC”,可将主键和键值更改如下:

  主键 键值  

  1 00000409   2 E0220804   3 E0010804   4 E0040804

  这时再重新启动计算机,输入法顺序就改过来了。

 七、 大字符集汉字的输入

  大字符集汉字是一种汉字扩展内码规范(GBK)中定义的汉字。使用这个汉字集有利于与港澳台交流,Win95中有五种输入法可以输入GBK汉字。但到了Win98,为了精简系统、优化性能,将GB和GBK两个汉字集的输入法进行了合并。除了区位码和智能ABC外,其他预装的输入法都有GB和GBK两种输入方式,它们在安装时,缺省是GB输入方式,如果要输入一些难检字,如“?、?”,可以切换到GBK输入方式下。

  切换方法为:单击任务栏右侧的输入法图标,选择“全拼输入法”,此时全拼输入法启动了。

  在输入法的状态条上单击鼠标右键,选择“设置”命令。

  在弹出的对话框中,可以看到“检索字符集”一栏,选中“GBK”项,单击“确定”,设置完毕。

  这时再键入“rong”,就能查到“?”字了。

  你可能会问,为什么Windows 98中全拼输入法的缺省设置为“GB2312”呢?原来考虑到GBK大字符集汉字的数量较多,如果只设置为“GBK”大字符集,那么使用全拼输入法会有大量的重码,严重影响输入速度,故而设置了一个GB码与GBK大字符集输入状态的切换开关。这样在一般情况下只输入GB码的汉字,在需要时再打开GBK大字符集的输入开关,以输入GBK大字符集的汉字。

  为什么一些人用的是五笔输入法,却还保留着“全拼输入法”呢?对了,就是为了方便输入一些冷僻字。

上一页 返回到主界面

 

 

谈谈您的看法 已有 0 条发言