来自:http://dev2dev.bea.com.cn/bbs/thread.jspa?forumID=121&threadID=10601&messageID=161934
论坛首页 ? 技术专区 ? Web Application Development
主题: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
回复: 37 页数: 3 最后提交: Oct 17, 2005 3:28:53 PM
欢迎, 客人
访客设置
转到 [根类别][版务] ? 论坛工作室[产品专区] ? Tuxedo ? BEA WebLogic Server ? BEA WebLogic Portal ? BEA WebLogic Integration ? BEA Workshop ? BEA General[技术专区] ? Web Application Development ? EJB Development ? JDBC & Transaction ? Design Pattern ? Develop Tools ? J2ME Development[BEA活动] ? 北京 User Group ? 上海 User Group ? 青岛 User Group ? 杭州 User Group ? 天津 User Group ? 广州User Group[小憩一会] ? 程序人生 ? 历史的天空[只读栏目] ? WebLogic开发
发新帖
回复此主题
搜索论坛
返回到 主题 列表
回复: 37 页数: 3 [ << | 1 2 3 ]
phoenixatsh [普通用户]
发帖数: 356
活跃积分: 348
技术积分: 10
可用币值: 288
注册时间: 2005-6-11
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 16, 2005 3:30:23 PM 回复 发消息
GB2312是GBK的子集
--------------------------------------------------------------------------------
blog: http://javaniao.blogdriver.com/
yexichang [普通用户]
发帖数: 494
活跃积分: 403
技术积分: 0
可用币值: 123
注册时间: 2005-1-31
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 16, 2005 10:00:03 PM 回复 发消息
GB2312是GBK的子集,不过既然有了UTF8还是用这个好,对自己也没有什么影响,还方便以后国际化
--------------------------------------------------------------------------------
kingyz [普通用户]
发帖数: 51
活跃积分: 47
技术积分: 0
可用币值: 32
注册时间: 2004-4-21
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:34:45 AM 回复 发消息
gb2312属于GBK
--------------------------------------------------------------------------------
focus2004 [普通用户]
发帖数: 106
活跃积分: 86
技术积分: 1
可用币值: 86
注册时间: 2004-8-9
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:35:34 AM 回复 发消息
这不是哪个好哪个不好的问题,看你的需要哦,我常用的是GBK
--------------------------------------------------------------------------------
I love Java!
keithhe [普通用户]
发帖数: 568
活跃积分: 499
技术积分: 5
可用币值: 324
注册时间: 2004-4-5
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 9:43:47 AM 回复 发消息
尽量全部采用UTF-8
--------------------------------------------------------------------------------
胡思乱想,就怕你不敢想
xuefengl [普通用户]
发帖数: 1,009
活跃积分: 962
技术积分: 31
可用币值: 317
注册时间: 2004-2-29
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 10:13:11 AM 回复 发消息
为了避免所有乱码问题,应该全部采用UTF-8,包括Java源文件/JSP/HTML...
将来要支持国际化也非常方便
--------------------------------------------------------------------------------
// see:
http://blog.csdn.net/asklxf/
http://www.j2medev.com/
http://www.crackj2ee.com/
zhzg605 [普通用户]
发帖数: 1,041
活跃积分: 971
技术积分: 24
可用币值: 306
注册时间: 2004-11-24
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 10:31:32 AM 回复 发消息
建议不要用gbk2312 用gbk 因为有些数据库服务器,或者unix服务的一些
生僻汉字用gbk2312 无法显示。
--------------------------------------------------------------------------------
shgodttj [普通用户]
发帖数: 234
活跃积分: 200
技术积分: 0
可用币值: 0
注册时间: 2005-3-7
用户状态:正常
Re: 网站的字符集选择GB2312好还是GBK好?两者有什么区别?
提交时间: Oct 17, 2005 3:28:53 PM 回复 发消息
应该全部采用UTF-8
--------------------------------------------------------------------------------
http://www.gody.cn
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
来自:http://www.mambo.cn/smf/index.php/topic,582.new.html
中曼中心简练机器论坛
utf-8技术讨论 (utf-8 Tech)
服务器设置 (版主: dylon)
对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解 0 会员 以及 2 访客 正在阅读本篇主题. ? 上一篇主题 下一篇主题 ?
页: [1]
作者 主题: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解 (阅读 1720 次)
zhous
管理员(Admin)
曼波五段
离线
文章: 590
对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 于: 七月 02, 2005, 11:22:02 am ?
--------------------------------------------------------------------------------
来源:Donews
Unicode:
unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.
UCS:
ISO制定的ISO10646标准所定义的 Universal Character Set, 采用4byte编码.
Unicode与UCS的关系:
ISO与unicode.org是两个不同的组织, 因此最初制定了不同的标准; 但自从unicode2.0开始, unicode采用了与ISO 10646-1相同的字库和字码, ISO也承诺ISO10646将不会给超出0x10FFFF的UCS-4编码赋值, 使得两者保持一致.
UCS的编码方式:
UCS-2, 与unicode的2byte编码基本一样.
UCS-4, 4byte编码, 目前是在UCS-2前加上2个全零的byte.
UTF: Unicode/UCS Transformation Format
UTF-8, 8bit编码, ASCII不作变换, 其他字符做变长编码, 每个字符1-3 byte. 通常作为外码. 有以下优点:
* 与CPU字节顺序无关, 可以在不同平台之间交流
* 容错能力高, 任何一个字节损坏后, 最多只会导致一个编码码位损失, 不会链锁错误(如GB码错一个字节就会整行乱码)
UTF-16, 16bit编码, 是变长码, 大致相当于20位编码, 值在0到0x10FFFF之间, 基本上就是unicode编码的实现. 它是变长码, 与CPU字序有关, 但因为最省空间, 常作为网络传输的外码.
UTF-16是unicode的preferred encoding.
UTF-32, 仅使用了unicode范围(0到0x10FFFF)的32位编码, 相当于UCS-4的子集.
UTF与unicode的关系:
Unicode是一个字符集, 可以看作为内码.
而UTF是一种编码方式, 它的出现是因为unicode不适宜在某些场合直接传输和处理. UTF-16直接就是unicode编码, 没有变换, 但它包含了0x00在编码内, 头256字节码的第一个byte都是0x00, 在操作系统(C语言)中有特殊意义, 会引起问题. 采用UTF-8编码对unicode的直接编码作些变换可以避免这问题, 并带来一些优点.
中国国标编码:
GB 13000: 完全等同于ISO 10646-1/Unicode 2.1, 今后也将随ISO 10646/Unicode的标准更改而同步更改.
GBK: 对GB2312的扩充, 以容纳GB2312字符集范围以外的Unicode 2.1的统一汉字部分, 并且增加了部分unicode中没有的字符.
GB 18030-2000: 基于GB 13000, 作为Unicode 3.0的GBK扩展版本, 覆盖了所有unicode编码, 地位等同于UTF-8, UTF-16, 是一种unicode编码形式. 变长编码, 用单字节/双字节/4字节对字符编码. GB18030向下兼容GB2312/GBK.
GB 18030是中国所有非手持/嵌入式计算机系统的强制实施标准.
已记录
天下本无事,庸人自扰之??好象有点道理
Autoit
曼波三段
离线
文章: 154
Hi,Mambo, I'm Autoit.
Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 回复文章 #1 于: 七月 02, 2005, 11:45:36 am ?
--------------------------------------------------------------------------------
收藏!!!
已记录
http://xiaowei.cn 小薇精品婚纱
http://www.123yls.com 伊莉莎数码婚纱
http://www.lishabeila.com 伊莎贝尔时尚婚纱
...会聚 厦门精品婚纱 ...
zijie
曼波学员
离线
文章: 8
Re: 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
? 回复文章 #2 于: 十月 13, 2005, 01:07:09 am ?
--------------------------------------------------------------------------------
好文章
已记录
页: [1]
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
来自:http://www.hongen.com/pc/newer/ime/problem/problem3.htm
当前位置:洪恩在线 -> 电脑乐园 -> 输入法
常见问题解答
一.什么是BIG5码?
二.什么是GBK?
三.添加和删除输入法
四.设置输入法的属性
五.给输入法定义快捷键
六.调整输入法的次序
七.大字符集汉字的输入
谈谈您的看法
已有 0 条发言
常见问题解答
常见问题解答
六、 调整输入法的次序
输入法在状态栏有一个图标,点击输入法图标就可以选择输入法。但排第一的图标可以用“Ctrl+Space”热键启动,因此可以将自己常用的输入法排列到前面。
一个简单的方法,就是先将最常用的输入法删除,再重新安装该输入法,最常用的输入法就安装在前面了。
第二种方法是通过修改注册表来调整输入法的顺序、增加或删除输入法,甚至可做到Windows 95/98启动后的缺省输入法为汉字而不是英文。 通过对注册表的分析,可以发现在HKEY_LOCAL_MACHINE\SYSTEM\ CurrentControlSet\Control\keyboard layout\下存放着各输入法对应的主键,见下表所示:
在HKEY_USERS\.DEFAULT\keyboard layout\preload\下则是系统所安装的输入法的主键及键值,其主键为自然数,键值为上表中各输入法对应的主键。例如系统已安装了“智能ABC”、“全拼”和五笔输入法,则可看到如下的主键和键值:
主键 键值
1 00000409 2 E0040804 3 E0010804 4 E0220804
下面我们来改变输入法的顺序:
假设要将输入法顺序变为“英文”、“五笔”、“全拼”和“智能ABC”,可将主键和键值更改如下:
主键 键值
1 00000409 2 E0220804 3 E0010804 4 E0040804
这时再重新启动计算机,输入法顺序就改过来了。
七、 大字符集汉字的输入
大字符集汉字是一种汉字扩展内码规范(GBK)中定义的汉字。使用这个汉字集有利于与港澳台交流,Win95中有五种输入法可以输入GBK汉字。但到了Win98,为了精简系统、优化性能,将GB和GBK两个汉字集的输入法进行了合并。除了区位码和智能ABC外,其他预装的输入法都有GB和GBK两种输入方式,它们在安装时,缺省是GB输入方式,如果要输入一些难检字,如“?、?”,可以切换到GBK输入方式下。
切换方法为:单击任务栏右侧的输入法图标,选择“全拼输入法”,此时全拼输入法启动了。
在输入法的状态条上单击鼠标右键,选择“设置”命令。
在弹出的对话框中,可以看到“检索字符集”一栏,选中“GBK”项,单击“确定”,设置完毕。
这时再键入“rong”,就能查到“?”字了。
你可能会问,为什么Windows 98中全拼输入法的缺省设置为“GB2312”呢?原来考虑到GBK大字符集汉字的数量较多,如果只设置为“GBK”大字符集,那么使用全拼输入法会有大量的重码,严重影响输入速度,故而设置了一个GB码与GBK大字符集输入状态的切换开关。这样在一般情况下只输入GB码的汉字,在需要时再打开GBK大字符集的输入开关,以输入GBK大字符集的汉字。
为什么一些人用的是五笔输入法,却还保留着“全拼输入法”呢?对了,就是为了方便输入一些冷僻字。
上一页 返回到主界面
谈谈您的看法 已有 0 条发言