来自:http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=121&threadID=10601&messageID=161934
论坛首页 ? 技术专区 ? Web Application Development
主题: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
回复: 37   页数: 3   最后提交: Oct 17, 2005 3:28:53 PM
  欢迎, 客人 
 访客设置 
转到  [根类别][版务] ?  论坛工作室[产品专区] ?  Tuxedo ?  BEA WebLogic Server ?  BEA WebLogic Portal ?  BEA WebLogic Integration ?  BEA Workshop ?  BEA General[技术专区] ?  Web Application Development ?  EJB Development ?  JDBC & Transaction ?  Design Pattern ?  Develop Tools ?  J2ME Development[BEA活动] ?  北京 User Group ?  上海 User Group ?  青岛 User Group ?  杭州 User Group ?  天津 User Group ?  广州User Group[小憩一会] ?  程序人生 ?  历史的天空[只读栏目] ?  WebLogic开发 
 
 发新帖 
  回复此主题 
  搜索论坛 
 
  返回到 主题 列表  
回复: 37   页数: 3   [ << | 1 2 3 ] 
phoenixatsh [普通用户] 
发帖数: 356
活跃积分: 348
技术积分: 10
可用币值: 288
注册时间: 2005-6-11
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 16, 2005 3:30:23 PM          回复    发消息 
 
GB2312是GBK的子集
--------------------------------------------------------------------------------
blog: http://javaniao.blogdriver.com/
 
 
yexichang [普通用户] 
发帖数: 494
活跃积分: 403
技术积分: 0
可用币值: 123
注册时间: 2005-1-31
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 16, 2005 10:00:03 PM          回复    发消息 
 
GB2312是GBK的子集,不过既然有了UTF8还是用这个好,对自己也没有什么影响,还方便以后国际化
--------------------------------------------------------------------------------
 
 
kingyz [普通用户] 
发帖数: 51
活跃积分: 47
技术积分: 0
可用币值: 32
注册时间: 2004-4-21
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:34:45 AM          回复    发消息 
 
gb2312属于GBK
--------------------------------------------------------------------------------
 
 
focus2004 [普通用户] 
发帖数: 106
活跃积分: 86
技术积分: 1
可用币值: 86
注册时间: 2004-8-9
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:35:34 AM          回复    发消息 
 
这不是哪个好哪个不好的问题,看你的需要哦,我常用的是GBK
--------------------------------------------------------------------------------
I love Java! 
 
keithhe [普通用户] 
发帖数: 568
活跃积分: 499
技术积分: 5
可用币值: 324
注册时间: 2004-4-5
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:43:47 AM          回复    发消息 
 
尽量全部采用UTF-8
--------------------------------------------------------------------------------
胡思乱想,就怕你不敢想 
 
xuefengl [普通用户] 
发帖数: 1,009
活跃积分: 962
技术积分: 31
可用币值: 317
注册时间: 2004-2-29
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 10:13:11 AM          回复    发消息 
 
为了避免所有乱码问题,应该全部采用UTF-8,包括Java源文件/JSP/HTML...
将来要支持国际化也非常方便
--------------------------------------------------------------------------------
// see:
http://blog.csdn.net/asklxf/
http://www.j2medev.com/
http://www.crackj2ee.com/ 
 
zhzg605 [普通用户] 
发帖数: 1,041
活跃积分: 971
技术积分: 24
可用币值: 306
注册时间: 2004-11-24
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 10:31:32 AM          回复    发消息 
 
建议不要用gbk2312 用gbk 因为有些数据库服务器,或者unix服务的一些
生僻汉字用gbk2312 无法显示。
--------------------------------------------------------------------------------
 
 
shgodttj [普通用户] 
发帖数: 234
活跃积分: 200
技术积分: 0
可用币值: 0
注册时间: 2005-3-7
用户状态:正常
 
 Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 3:28:53 PM          回复    发消息 
 
应该全部采用UTF-8
--------------------------------------------------------------------------------
http://www.gody.cn 
 
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
来自:http://www.mambo.cn/smf/index.php/topic,582.new.html
  中曼中心简练机器论坛
  utf-8技术讨论 (utf-8 Tech)
  服务器设置 (版主: dylon)
  对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解 0 会员 以及 2 访客 正在阅读本篇主题. ? 上一篇主题 下一篇主题 ? 
页: [1]   
 
 作者  主题: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解  (阅读 1720 次) 
zhous
管理员(Admin)
曼波五段
离线
文章: 590
   对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 于: 七月 02, 2005, 11:22:02 am ?  
--------------------------------------------------------------------------------
来源:Donews  
Unicode:
unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.
UCS:
ISO制定的ISO10646标准所定义的 Universal Character Set, 采用4byte编码.
Unicode与UCS的关系:
ISO与unicode.org是两个不同的组织, 因此最初制定了不同的标准; 但自从unicode2.0开始, unicode采用了与ISO 10646-1相同的字库和字码, ISO也承诺ISO10646将不会给超出0x10FFFF的UCS-4编码赋值, 使得两者保持一致.
UCS的编码方式:
UCS-2, 与unicode的2byte编码基本一样.
UCS-4, 4byte编码, 目前是在UCS-2前加上2个全零的byte.
UTF: Unicode/UCS Transformation Format
UTF-8, 8bit编码, ASCII不作变换, 其他字符做变长编码, 每个字符1-3 byte. 通常作为外码. 有以下优点:
* 与CPU字节顺序无关, 可以在不同平台之间交流
* 容错能力高, 任何一个字节损坏后, 最多只会导致一个编码码位损失, 不会链锁错误(如GB码错一个字节就会整行乱码) 
UTF-16, 16bit编码, 是变长码, 大致相当于20位编码, 值在0到0x10FFFF之间, 基本上就是unicode编码的实现. 它是变长码, 与CPU字序有关, 但因为最省空间, 常作为网络传输的外码.
UTF-16是unicode的preferred encoding. 
UTF-32, 仅使用了unicode范围(0到0x10FFFF)的32位编码, 相当于UCS-4的子集.
UTF与unicode的关系:
Unicode是一个字符集, 可以看作为内码.
而UTF是一种编码方式, 它的出现是因为unicode不适宜在某些场合直接传输和处理. UTF-16直接就是unicode编码, 没有变换, 但它包含了0x00在编码内, 头256字节码的第一个byte都是0x00, 在操作系统(C语言)中有特殊意义, 会引起问题. 采用UTF-8编码对unicode的直接编码作些变换可以避免这问题, 并带来一些优点.
中国国标编码:
GB 13000: 完全等同于ISO 10646-1/Unicode 2.1, 今后也将随ISO 10646/Unicode的标准更改而同步更改.
GBK: 对GB2312的扩充, 以容纳GB2312字符集范围以外的Unicode 2.1的统一汉字部分, 并且增加了部分unicode中没有的字符.
GB 18030-2000: 基于GB 13000, 作为Unicode 3.0的GBK扩展版本, 覆盖了所有unicode编码, 地位等同于UTF-8, UTF-16, 是一种unicode编码形式. 变长编码, 用单字节/双字节/4字节对字符编码. GB18030向下兼容GB2312/GBK.
GB 18030是中国所有非手持/嵌入式计算机系统的强制实施标准.
 
  已记录  
天下本无事,庸人自扰之??好象有点道理 
 
 
Autoit
曼波三段
离线
文章: 154
Hi,Mambo, I'm Autoit.
    Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 回复文章 #1 于: 七月 02, 2005, 11:45:36 am ?  
--------------------------------------------------------------------------------
收藏!!! 
 
  已记录  
http://xiaowei.cn 小薇精品婚纱
http://www.123yls.com 伊莉莎数码婚纱
http://www.lishabeila.com 伊莎贝尔时尚婚纱
...会聚 厦门精品婚纱 ... 
 
 
zijie
曼波学员
离线
文章: 8
   Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 回复文章 #2 于: 十月 13, 2005, 01:07:09 am ?  
--------------------------------------------------------------------------------
好文章
 
  已记录 
 
 
 
 
页: [1]     
 
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
来自:http://www.hongen.com/pc/newer/ime/problem/problem3.htm
当前位置:洪恩在线 -> 电脑乐园 -> 输入法
 
常见问题解答
 一.什么是BIG5码? 
 二.什么是GBK?
 三.添加和删除输入法
 四.设置输入法的属性
 五.给输入法定义快捷键
 六.调整输入法的次序
 七.大字符集汉字的输入
  
谈谈您的看法
已有 0 条发言
   常见问题解答
常见问题解答 
六、 调整输入法的次序
  输入法在状态栏有一个图标,点击输入法图标就可以选择输入法。但排第一的图标可以用“Ctrl+Space”热键启动,因此可以将自己常用的输入法排列到前面。
  一个简单的方法,就是先将最常用的输入法删除,再重新安装该输入法,最常用的输入法就安装在前面了。
  第二种方法是通过修改注册表来调整输入法的顺序、增加或删除输入法,甚至可做到Windows 95/98启动后的缺省输入法为汉字而不是英文。 通过对注册表的分析,可以发现在HKEY_LOCAL_MACHINE\SYSTEM\ CurrentControlSet\Control\keyboard layout\下存放着各输入法对应的主键,见下表所示: 
  在HKEY_USERS\.DEFAULT\keyboard layout\preload\下则是系统所安装的输入法的主键及键值,其主键为自然数,键值为上表中各输入法对应的主键。例如系统已安装了“智能ABC”、“全拼”和五笔输入法,则可看到如下的主键和键值:
  主键 键值  
  1 00000409   2 E0040804   3 E0010804   4 E0220804   
  下面我们来改变输入法的顺序:
  假设要将输入法顺序变为“英文”、“五笔”、“全拼”和“智能ABC”,可将主键和键值更改如下:
  主键 键值  
  1 00000409   2 E0220804   3 E0010804   4 E0040804
  这时再重新启动计算机,输入法顺序就改过来了。
七、 大字符集汉字的输入
  大字符集汉字是一种汉字扩展内码规范(GBK)中定义的汉字。使用这个汉字集有利于与港澳台交流,Win95中有五种输入法可以输入GBK汉字。但到了Win98,为了精简系统、优化性能,将GB和GBK两个汉字集的输入法进行了合并。除了区位码和智能ABC外,其他预装的输入法都有GB和GBK两种输入方式,它们在安装时,缺省是GB输入方式,如果要输入一些难检字,如“?、?”,可以切换到GBK输入方式下。
  切换方法为:单击任务栏右侧的输入法图标,选择“全拼输入法”,此时全拼输入法启动了。
在输入法的状态条上单击鼠标右键,选择“设置”命令。
在弹出的对话框中,可以看到“检索字符集”一栏,选中“GBK”项,单击“确定”,设置完毕。
  这时再键入“rong”,就能查到“?”字了。
  你可能会问,为什么Windows 98中全拼输入法的缺省设置为“GB2312”呢?原来考虑到GBK大字符集汉字的数量较多,如果只设置为“GBK”大字符集,那么使用全拼输入法会有大量的重码,严重影响输入速度,故而设置了一个GB码与GBK大字符集输入状态的切换开关。这样在一般情况下只输入GB码的汉字,在需要时再打开GBK大字符集的输入开关,以输入GBK大字符集的汉字。
  为什么一些人用的是五笔输入法,却还保留着“全拼输入法”呢?对了,就是为了方便输入一些冷僻字。
上一页 返回到主界面
 
  
谈谈您的看法 已有 0 条发言