时间:2021-07-01 10:21:17 帮助过:24人阅读
Table 12.14 转换函数(Cast Function)
名称 | 说明 |
---|---|
BINARY |
将 string 转换为二进制 string |
CAST() |
将某个值转换为特定类型 |
CONVERT() |
将某个值转换为特定类型 |
BINARY 运算符将紧随其后的 string 转换为 二进制字符串。主要用来强制进行按字节进行比较(byte by byte),字节而不是字符的字符。这使得字符串比较是区分大小写的, 不管原始的列定义是否是 BINARY 或者 BLOB。BINARY 也对字符串末尾的空格敏感。
SELECT 'a' = 'A';
1
SELECT BINARY 'a' = 'A';
0
SELECT 'a' = 'a ';
1
SELECT BINARY 'a' = 'a ';
0
在上面的比较中, BINARY 影响的是整个比较操作; 不管哪个操作数放在前面, 结果都是一样的。
还有一种情况,BINARY 不对等号起作用:
SELECT 'a' = BINARY 'a ';
1
BINARY str 其实是 CAST(str AS BINARY) 的缩写。
有时候, 如果将索引列转换为 BINARY, MySQL可能不会使用索引。
CAST(expr AS type)CAST() 函数接收任意类型的表达式, 并根据指定类型返回相应的结果值, 跟 CONVERT() 很相似, 除了使用的语法形式上有一点区别, 所以请参考下面的 CONVERT() 函数。
CONVERT(expr,type), CONVERT(expr USING transcoding_name)CONVERT()和 CAST() 函数都是接收任意类型的表达式, 并根据指定类型返回相应的结果值。
CAST() 和 CONVERT(... USING ...) 都是标准的SQL语法。而没有 USING 的 CONVERT() 是 ODBC 的语法。
USING 方式的 CONVERT() 在不同的字符集之间进行数据转换。在MySQL中, 转码的名称和相应的字符集名称一致。例如, 下面的语句将字符串 ‘abc’ 从默认字符集转换为 utf8 字符集:
SELECT CONVERT('abc' USING utf8);
转换函数的结果可以是以下这些类型:
BINARY[(N)]
CHAR[(N)]
DATE
DATETIME
DECIMAL[(M[,D])]
SIGNED [INTEGER]
TIME
UNSIGNED [INTEGER]
BINARY 生成的是二进制形式的 string 数据类型。更多细节请参考 11.4.2节, “The BINARY and VARBINARY Types” 。如果传入了可选参数N, 那么 BINARY(N) 的转换结果最多为 N 个字节。如果结果小于N个字节,则用 0x00 来填充。
CHAR(N)的结果为最多N个字符。
一般来说,用不区分大小写的方式并不能比较 BLOB 值或者其他二进制串, 因为二进制串是没有字符集的,因此也没有字母的概念。如果要不区分大小写, 可以用 CONVERT() 将值转换为非二进制的字符串再来比较。比较的结果根据字符集排序而定。例如,假设字符集不区分大小写, 那么 like 操作也就不区分大小写:
SELECT 'A' LIKE CONVERT(blob_col USING latin1) FROM tbl_name;
要使用其他字符集, 只要把里面的 latin1 替换掉就行。为转换后的字符串指定特定的排序规则, 可以在 CONVERT() 函数调用后面跟上 COLLATE 从句, 正如 10.1.9.2 节 “CONVERT() and CAST()” 中所描述的. 例如,使用 latin1_german1_ci 排序:
SELECT 'A' LIKE CONVERT(blob_col USING latin1) COLLATE latin1_german1_ci FROM tbl_name;
CONVERT() 可以在不同的字符集之中进行比较。
LOWER() 和 UPPER() 对于二进制字符串是无效的(包括 BINARY, VARBINARY, BLOB)。要进行大小写转换,需要先将字符串转换成非二进制形式:
mysql> SET @str = BINARY 'New York'; mysql> SELECT LOWER(@str), LOWER(CONVERT(@str USING latin1)); +-------------+-----------------------------------+ | LOWER(@str) | LOWER(CONVERT(@str USING latin1)) | +-------------+-----------------------------------+ | New York | new york | +-------------+-----------------------------------+
转换函数可以用来创建特定类型的列,比如在 CREATE TABLE ... SELECT语句之中:
CREATE TABLE new_table SELECT CAST('2000-01-01' AS DATE);
转换函数也可以用来按定义的单词将 ENUM 列排序 。正常情况下, 枚举列是根据内部的数值表示来进行排序的。按字母排序 CHAR 类型的结果:
SELECT enum_col FROM tbl_name ORDER BY CAST(enum_col AS CHAR);
CAST(str AS BINARY) 和 BINARY str 等价。CAST(expr AS CHAR) 将表达式当作默认字符集来处理。
CAST() 可能会改变复杂表达式的结果,例如 CONCAT('Date: ',CAST(NOW() AS DATE))。
这里就不应该使用 CAST() 来提取不同格式的数据,而应该使用字符串函数,如 LEFT() 或者 EXTRACT()。详情请参考 Section 12.7, “Date and Time Functions”。
要把字符串转换为数值来进行处理, 一般是不需要手工处理的,MySQL会进行隐式的类型转换:
SELECT 1+'1';
2
在算术运算中, string 会在表达式求值阶段转换为浮点数。
如果需要将数字当成字符串来处理, MySQL也会自动进行转换:
SELECT CONCAT('hello you ',2);
‘hello you 2’
在 MySQL 5.6.4之前的版本,用 CAST() 处理 TIMESTAMP 时, 如果不从具体的表中选取值, MySQL 5.6 会在执行转换之前把值优先当成字符串来对待。这在转换为数字时可能会导致截断,如下所示:
mysql> SELECT CAST(TIMESTAMP '2014-09-08 18:07:54' AS SIGNED); +-------------------------------------------------+ | CAST(TIMESTAMP '2014-09-08 18:07:54' AS SIGNED) | +-------------------------------------------------+ | 2014 | +-------------------------------------------------+ 1 row in set, 1 warning (0.00 sec) mysql> SHOW WARNINGS; +---------+------+----------------------------------------------------------+ | Level | Code | Message | +---------+------+----------------------------------------------------------+ | Warning | 1292 | Truncated incorrect INTEGER value: '2014-09-08 18:07:54' | +---------+------+----------------------------------------------------------+ 1 row in set (0.00 sec)
但如果从一张表中选取行时并不会这样,如下所示:
USE test;
Database changed
CREATE TABLE c_test (col TIMESTAMP);
Query OK, 0 rows affected (0.07 sec)
INSERT INTO c_test VALUES ('2014-09-08 18:07:54');
Query OK, 1 row affected (0.05 sec)
SELECT col, CAST(col AS UNSIGNED) AS c_col FROM c_test;
>
+———————+—————-+
| col | c_col |
+———————+—————-+
| 2014-09-08 18:07:54 | 20140908180754 |
+———————+—————-+
1 row in set (0.00 sec)
在MySQL 5.6.4 之后, 修复了这个问题,如下所示:
SELECT CAST(TIMESTAMP '2014-09-08 18:07:54' AS SIGNED);
>
+————————————————-+
| CAST(TIMESTAMP ‘2014-09-08 18:05:07’ AS SIGNED) |
+————————————————-+
| 20140908180754 |
+————————————————-+
1 row in set (0.00 sec)
关于数字和字符串的隐式转换, 参见 12.2节 “Type Conversion in Expression Evaluation”.
MySQL支持有符号的和无符号的64位算术运算。如果您使用的是数字运算符(如加 + 或减 -), 其中的一个操作数是无符号整数, 那默认情况下结果就是无符号数(参见 12.6.1 算术运算符)。可以通过指定 SIGNED 或者 UNSIGNED 来进行转换。
SELECT CAST(1-2 AS UNSIGNED)
18446744073709551615
SELECT CAST(CAST(1-2 AS UNSIGNED) AS SIGNED);
-1
如果有操作数是浮点值, 那么结果就是浮点值, 不受前面规则的影响。(在这种情况下, DECIMAL 列被视为浮点值。)
SELECT CAST(1 AS UNSIGNED) - 2.0;
-1.0
SQL模式影响转换操作的结果。例如:
如果转换零值的日期串为日期, CONVERT() 和 CAST() 都会返回 NULL , 并在 NO_ZERO_DATE 模式下产生警告。
对于整数的减法,如果启用了 NO_UNSIGNED_SUBTRACTION 模式, 减法结果是有符号数,即便其中一个是无符号数。
更多信息请参见 5.1.7节 “Server SQL Modes”。
首先,请查看 BLOB 里面存储的是什么编码的byte。是 utf8 还是其他字符集?
CAST(a.ar_options AS CHAR(10000) CHARACTER SET utf8)
在这里必须指定正确的字符集, 对应于 BLOB 中存储的编码。如果里面存储的是 utf8编码, 那么就是上面这样。如果存储的是 latin1 字符集, 那么就需要设置为 latin1 。