时间:2021-07-01 10:21:17 帮助过:5人阅读
终于有时间继续玩阿里的数据挖掘比赛,第二赛季限定工具,不得不先重拾一下数据库。以下笔记总结自网络教程。
某些数据库系统要求在每条 SQL 命令的末端使用分号
SQL DML 和 DDL
把 SQL 分为两个部分:数据操作语言 (DML) 和 数据定义语言 (DDL)
查询和更新指令构成了 SQL 的 DML 部分:
SELECT - 从数据库表中获取数据
UPDATE - 更新数据库表中的数据
DELETE - 从数据库表中删除数据
INSERT INTO - 向数据库表中插入数据
SQL 中最重要的 DDL 语句:
CREATE DATABASE - 创建新数据库
ALTER DATABASE - 修改数据库
CREATE TABLE - 创建新表
ALTER TABLE - 变更(改变)数据库表
DROP TABLE - 删除表
CREATE INDEX - 创建索引(搜索键)
DROP INDEX - 删除索引
SELECT column_name1,column_name2 FROM table_name
SELECT * FROM table_name
关键词 DISTINCT 用于返回唯一不同的值。
SELECT DISTINCT column_name FROM table_name
如需有条件地从表中选取数据,可将 WHERE 子句添加到 SELECT 语句。
SELECT 列名称 FROM 表名称 WHERE 列 运算符 值
AND 和 OR 可在 WHERE 子语句中把两个或多个条件结合起来。
SELECT * FROM table_name WHERE column_name1=‘XXX‘ AND column_name2=‘XXX‘
SELECT * FROM table_name WHERE (column_name1=‘XXX‘ OR column_name2=‘XXX‘) AND column_name3=‘XXX‘
ORDER BY 语句用于根据指定的列对结果集进行排序,默认按照升序对记录进行排序,如果希望按照降序对记录进行排序,可以使用 DESC 关键字。
SELECT column_name1, column_name2 FROM table_name ORDER BY column_name1 [DESC]
INSERT INTO 语句用于向表格中插入新的行
INSERT INTO 表名称 VALUES (值1, 值2,....)
也可以只在指定列插入数据,没插入数据的列留空:
INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....)
Update 语句用于修改表中的数据。
UPDATE 表名称 SET 列名称1 = 新值1,列名称2 = 新值2 WHERE 列名称 = 某值
DELETE 语句用于删除表中的行
DELETE FROM 表名称 WHERE 列名称 = 值
TOP 子句用于规定要返回的记录的数目。
SQL Server 的语法:
SELECT TOP number|percent column_name(s) FROM table_name
MySQL 语法
SELECT column_name(s) FROM table_name LIMIT number
LIKE 操作符用于在 WHERE 子句中搜索列中的指定模式。
SELECT column_name(s)
FROM table_name
WHERE column_name LIKE pattern
举例:
SELECT * FROM Persons
WHERE City LIKE ‘N%‘ —— "%" 可用于定义通配符(模式中缺少的字母)
% 替代一个或多个字符
_ 仅替代一个字符
IN 操作符允许我们在 WHERE 子句中规定多个值。
SELECT column_name(s)
FROM table_name
WHERE column_name IN (value1,value2,...)
在 WHERE 子句中使用,作用是选取介于两个值之间的数据范围。
SELECT column_name(s)
FROM table_name
WHERE column_name
BETWEEN value1 AND value2
join 用于根据两个或多个表中的列之间的关系,从这些表中查询数据。
SELECT table1.column1, table1.column2, table2.column
FROM table1 INNER JOIN table2
ON table1.column = table2.column
除了 INNER JOIN(内连接),我们还可以使用其他几种连接。下面列出了可以使用的 JOIN 类型,以及它们之间的差异。
JOIN: 如果表中有至少一个匹配,则返回行(INNER JOIN 与 JOIN 是相同的。)
LEFT JOIN: 即使右表中没有匹配,也从左表返回所有的行
RIGHT JOIN: 即使左表中没有匹配,也从右表返回所有的行
FULL JOIN: 只要其中一个表中存在匹配,就返回行
UNION 操作符用于合并两个或多个 SELECT 语句的结果集。
请注意,UNION 内部的 SELECT 语句必须拥有相同数量的列。列也必须拥有相似的数据类型。同时,每条 SELECT 语句中的列的顺序必须相同。
SELECT column_name(s) FROM table_name1
UNION
SELECT column_name(s) FROM table_name2
默认地,UNION 操作符选取不同的值。如果允许重复的值,请使用 UNION ALL:
SELECT column_name(s) FROM table_name1
UNION ALL
SELECT column_name(s) FROM table_name2
按列拼接两条select语句的结果
SELECT INTO 语句从一个表中选取数据,然后把数据插入另一个表中。
SELECT INTO 语句常用于创建表的备份复件或者用于对记录进行存档。
SELECT *
INTO new_table_name [IN externaldatabase]
FROM old_tablename
或者只把希望的列插入新表:
SELECT column_name(s)
INTO new_table_name [IN externaldatabase]
FROM old_tablename
CREATE DATABASE database_name
CREATE TABLE 语句用于创建数据库中的表。
CREATE TABLE 表名称
(
列名称1 数据类型,
列名称2 数据类型,
列名称3 数据类型,
....
)
数据类型(data_type)规定了列可容纳何种数据类型。下面的表格包含了SQL中最常用的数据类型:
integer(size)
int(size)
smallint(size)
tinyint(size) 仅容纳整数。在括号内规定数字的最大位数。
decimal(size,d)
numeric(size,d) 容纳带有小数的数字。
"size" 规定数字的最大位数。"d" 规定小数点右侧的最大位数。
char(size) 容纳固定长度的字符串(可容纳字母、数字以及特殊字符)。
在括号中规定字符串的长度。
varchar(size) 容纳可变长度的字符串(可容纳字母、数字以及特殊的字符)。
在括号中规定字符串的最大长度。
date(yyyymmdd) 容纳日期。
NOT NULL 约束强制列不接受 NULL 值。
NOT NULL 约束强制字段始终包含值。这意味着,如果不向字段添加值,就无法插入新记录或者更新记录。
PRIMARY KEY 约束唯一标识数据库表中的每条记录。
主键必须包含唯一的值。
主键列不能包含 NULL 值。
每个表都应该有一个主键,并且每个表只能有一个主键。
下面的 SQL 在 “Persons” 表创建时在 “Id_P” 列创建 PRIMARY KEY 约束:
CREATE TABLE Persons
(
Id_P int NOT NULL,
LastName varchar(255) NOT NULL,
FirstName varchar(255),
Address varchar(255),
City varchar(255),
PRIMARY KEY (Id_P)
)
一个表中的 FOREIGN KEY 指向另一个表中的 PRIMARY KEY。
CHECK 约束用于限制列中的值的范围。
下面的 SQL 在 “Persons” 表创建时为 “Id_P” 列创建 CHECK 约束。CHECK 约束规定 “Id_P” 列必须只包含大于 0 的整数。
CREATE TABLE Persons
(
Id_P int NOT NULL,
LastName varchar(255) NOT NULL,
FirstName varchar(255),
Address varchar(255),
City varchar(255),
CHECK (Id_P>0)
)
DEFAULT 约束用于向列中插入默认值
下面的 SQL 在 “Persons” 表创建时为 “City” 列创建 DEFAULT 约束:
CREATE TABLE Persons
(
Id_P int NOT NULL,
LastName varchar(255) NOT NULL,
FirstName varchar(255),
Address varchar(255),
City varchar(255) DEFAULT ‘Sandnes‘
)
CREATE INDEX 语句用于在表中创建索引。
在不读取整个表的情况下,索引使数据库应用程序可以更快地查找数据。
您可以在表中创建索引,以便更加快速高效地查询数据。
用户无法看到索引,它们只能被用来加速搜索/查询。
注释:更新一个包含索引的表需要比更新一个没有索引的表更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在常常被搜索的列(以及表)上面创建索引。
在表上创建一个简单的索引。允许使用重复的值:
CREATE INDEX index_name
ON table_name (column_name) 可以有多个column
在表上创建一个唯一的索引。唯一的索引意味着两个行不能拥有相同的索引值。
CREATE UNIQUE INDEX index_name
ON table_name (column_name1,column_name2)
DROP 语句,可以轻松地删除索引、表和数据库。
使用 DROP INDEX 命令删除表格中的索引。
DROP INDEX index_name ON table_name
DROP TABLE 语句用于删除表(表的结构、属性以及索引也会被删除)
DROP TABLE 表名称
DROP DATABASE 语句用于删除数据库:
DROP DATABASE 数据库名称
如需在表中添加列,请使用下列语法:
ALTER TABLE table_name
ADD column_name datatype
要删除表中的列,请使用下列语法
ALTER TABLE table_name
DROP COLUMN column_name
要改变表中列的数据类型,请使用下列语法:
ALTER TABLE table_name
ALTER COLUMN column_name datatype
NULL 值是遗漏的未知数据。
默认地,表的列可以存放 NULL 值。
IS NULL 和 IS NOT NULL 操作符。
现代的 SQL 服务器构建在 RDBMS 之上。
数据库管理系统是一种可以访问数据库中数据的计算机程序。
DBMS 使我们有能力在数据库中提取、修改或者存贮信息。
不同的 DBMS 提供不同的函数供查询、提交以及修改数据。
关系数据库管理系统 (RDBMS) 也是一种数据库管理系统,其数据库是根据数据间的关系来组织和访问数据的。
20 世纪 70 年代初,IBM 公司发明了 RDBMS。
RDBMS 是 SQL 的基础,也是所有现代数据库系统诸如 Oracle、SQL Server、IBM DB2、Sybase、MySQL 以及 Microsoft Access 的基础。
SQL 拥有很多可用于计数和计算的内建函数。
内建 SQL 函数的语法是:
SELECT function(列) FROM 表
AVG 函数返回数值列的平均值。NULL 值不包括在计算中。
SELECT AVG(column_name) FROM table_name
COUNT() 函数返回匹配指定条件的行数,NULL 不计入。
SELECT COUNT(column_name) FROM table_name
SQL COUNT(*) 语法返回表中的记录数:
SELECT COUNT(*) FROM table_name
COUNT(DISTINCT column_name) 语法返回指定列的不同值的数目:
SELECT COUNT(DISTINCT column_name) FROM table_name
FIRST() 函数返回指定的字段中第一个记录的值。
SELECT FIRST(column_name) FROM table_name
LAST() 函数返回指定的字段中最后一个记录的值。
SELECT LAST(column_name) FROM table_name
返回一列中的最大、小值。NULL 值不包括在计算中。
SELECT MIN(column_name) FROM table_name
SUM 函数返回数值列的总数(总额)。
SELECT SUM(column_name) FROM table_name
GROUP BY 语句用于结合合计函数,根据一个或多个列对结果集进行分组。
SELECT column_name, aggregate_function(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name
在 SQL 中增加 HAVING 子句原因是,WHERE 关键字无法与合计函数一起使用。
SELECT column_name, aggregate_function(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name
HAVING aggregate_function(column_name) operator value
例子:
现在我们希望查找客户 “Bush” 或 “Adams” 拥有超过 1500 的订单总金额。
SELECT Customer,SUM(OrderPrice) FROM Orders
WHERE Customer=‘Bush‘ OR Customer=‘Adams‘
GROUP BY Customer
HAVING SUM(OrderPrice)>1500
UCASE 函数把字段的值转换为大写。
LCASE 函数把字段的值转换为小写。
SELECT LCASE(column_name) FROM table_name
MID 函数用于从文本字段中提取字符。
SELECT MID(column_name,start[,length]) FROM table_name
LEN 函数返回文本字段中值的长度。
SELECT LEN(column_name) FROM table_name
ROUND 函数用于把数值字段舍入为指定的小数位数。
SELECT ROUND(column_name,decimals) FROM table_name
decimals规定要返回的小数位数。
NOW 函数返回当前的日期和时间。
SELECT NOW() FROM table_name
FORMAT 函数用于对字段的显示进行格式化。
SELECT FORMAT(column_name,format) FROM table_name
format规定格式
SQL
标签:数据库