当前位置:多学网学习教育电脑学习电脑技巧深入了解字符集和编码 -[专业知识]

深入了解字符集和编码 -[专业知识]

[08-23 23:22:51]   来源:http://www.duoxue8.com  电脑技巧   阅读:124
深入了解字符集和编码 -[专业知识],标签:电脑技巧大全,电脑基础知识,http://www.duoxue8.com
  Ruby有一个内部变量$KCODE用来表示可识别的多字节字符串的编码,变量值为"EUC" "SJIS" "UTF8" "NONE"之一。
  
  $KCODE的值为"EUC"时,将假定字符串或正则表达式的编码为EUC-JP。
  
  同样地,若为"SJIS"时则认定为Shift JIS。若为"UTF8"时则认定为UTF-8。
  
  若为"NONE"时,将不会识别多字节字符串。
  
  在向该变量赋值时,只有第1个字节起作用,且不区分大小写字母。
  
  "e" "E" 代表 "EUC","s" "S" 代表 "SJIS","u" "U" 代表 "UTF8",而"n" "N" 则代表 "NONE"。
  
  默认值为"NONE"。
  
  即默认情况下Ruby把字符串当成单字节序列来处理。
  
  四、为什么会乱码?
  
  乱码是个老问题,从上面我们知道,字符在保存时的编码格式如果和要显示的编码格式不一样的话,就会出现乱码问题。
  
  我们的Web系统,从底层数据库编码、Web应用程序编码到HTML页面编码,如果有一项不一致的话,就会出现乱码。
  
  所以,解决乱码问题说难也难说简单也简单,关键是让交互系统之间编码一致。
  
  五、有没有万金油?
  
  在如此多种编码和字符集弄的我们眼花缭乱的情况下,我们只需选择一种兼容性最好的编码方式和字符集,让它成为我们程序子系统之间
  
  交互的编码契约,那么从此恼人的乱码问题即将远离我们而去 -- 这种兼容性最好的编码就是UTF-8!
  
  毕竟GBK/GB2312是国内的标准,当我们大量使用国外的开源软件时,UTF-8才是编码界最通用的语言。
  
  本文来自 http://www.duoxue8.com 谢谢支

上一页  [1] [2] 


深入了解字符集和编码 -[专业知识] 结束。
Tag:电脑技巧电脑技巧大全,电脑基础知识电脑学习 - 电脑技巧