mysql 5.1 字符集_mysql 5.1 中文字符集问题

MYSQL的字符集支持

  1. MYSQL的字符集支持(Character Set Support)有两个方面:字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。

  2. MYSQL的默认字符集:MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置。那么,默认的配置从何而来呢?

  • 编译MySQL时,指定了一个默认的字符集,这个字符集是latin1;

  • 安装MySQL时,可以在配置文件(my.ini)中指定一个默认的字符集,如果没指定,这个值继承自编译时指定的;

  • 启动mysqld时,可以在命令行参数中指定一个默认的字符集,如果没指定,这个值继承自配置文件中的配置,此时charactersetserver被设定为这个默认的字符集;

  • 当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为charactersetserver;

  • 当选定了一个数据库时,charactersetdatabase被设定为这个数据库默认的字符集;

  • 在这个数据库里创建一张表时,表默认的字符集被设定为charactersetdatabase,也就是这个数据库默认的字符集;

  • 当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集。

    简单总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用latin1存储。不过,如果安装MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把defaultcharacterset设置为UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用UTF-8存储。

  1. 查看MYSQL的字符集(默认情况下,mysql的字符集是latin1(ISO88591) 通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:
  • 命令1:mysql> SHOW VARIABLES LIKE 'character%';
  • 命令2:mysql> SHOW VARIABLES LIKE 'collation_%';
  1. 修改默认字符集:
  • 最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,如:

    default-character-set = utf8
    character_set_server = utf8

    修改完后,重启mysql的服务,使用mysql> SHOW VARIABLES LIKE 'character%';查看,发现数据库编码均已改成utf8。
  • 还有一种修改字符集的方法,就是使用mysql的命令:

    mysql> SET character_set_client = utf8 ;
    mysql> SET character_set_connection = utf8 ;
    mysql> SET character_set_database = utf8 ;
    mysql> SET character_set_results = utf8 ;
    mysql> SET character_set_server = utf8 ;
    mysql> SET collation_connection = utf8 ;
    mysql> SET collation_database = utf8 ;
    mysql> SET collation_server = utf8 ;

    一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。解决方法是在发送查询前执行一下下面这句:SET NAMES 'utf8'。它相当于下面的三句指令:

    SET character_set_client = utf8;
    SET character_set_results = utf8;
    SET character_set_connection = utf8;
  1. 总结:
  • 正确的设定数据库编码:MySQL4.0以下版本的字符集总是默认ISO8859-1,MySQL4.1在安装的时候会让你选择。如果你准备使用UTF-8,那么在创建数据库的时候就要指定好UTF-8。
  • 要保证charactersetclient、charactersetconnection这两个变量与charactersetdatabase一致;同时保证charactersetresults与SELECT返回的结果以及程序的编码一致,这一点相当重要!至于设置的办法,见上文”4:修改默认字符集”。
  • 在插入数据之前,最好加上一句:SET NAMES 'utf8',这一句话等同于:

    set character_set_client = 'utf8'
    set character_set_connection = 'utf8'
    set character_set_results = 'utf8'

    当然,如果整个环境所设置的字符集都为gbk,则此处也要这样设置:SET NAMES 'gbk'
  • 要保证数据库中存的数据与数据库编码一致,即数据编码与charactersetdatabase一致;
  • 要保证通讯的字符集与数据库的字符集一致,即charactersetclient、charactersetconnection与charactersetdatabase一致;
  • 要保证SELECT的返回与程序的编码一致,即charactersetresults与程序编码一致;
  • 要保证程序编码与浏览器编码一致,即程序编码与一致。
赞(9)