MySQL基本使用
推荐使用 mycli 操作 MySQL 数据库.
MySQL 使用
基本操作
命令行连接
1 | $ mysql -uroot -p #回车后输入密码。 |
退出登录
1 | $ quit # 或 exit 或 ctrl+D |
其他
1 | $ select version(); # 查看版本 |
数据库操作
查看所有的数据库
1 | $ show databases; |
使用数据库
1 | $ use 数据库名; |
查看当前使用的数据库
1 | $ select database(); |
创建数据库
1 | $ create database 数据库名 charset=utf8mb4; |
utf8mb4 才是正真的 utf8。
查看创建数据库
1 | $ show create database 数据库名; |
删除数据库
1 | $ drop database 数据库名; |
当数据名称有特殊字符时,使用``包起来。
数据表操作
查看当前数据库中的所有表
1 | $ show tables; |
创建表
1 | create table 表名(id int, name varchar(100)); |
查看表结构
1 | $ desc 表名; |
修改表
1 | -- 添加字段 alter table 表名 add 列名 类型; |
删除表
1 | $ drop table 表名; -- 删除表 |
查看创建表
1 | $ show create table 表名; |
增删改查
增加
1 | -- 全列插入 |
修改
1 | -- update 表名 set 列1=值1, 列2=值2 ... where 条件 |
查询
1 | -- 查询所有的列 |
删除(基本不会使用,一般用一个字段标记是否删除)
1 | -- delete from 表名 where 条件; |
数据库备份和恢复
备份
1 | $ mysqldump -u用户名 -p 数据库名 > dump.sql #按提示输入密码 |
恢复
1 | $ mysql -u用户名 -p 新数据库名 < dump.sql #按提示输入密码 |
数据库设计
三范式
经过研究和对使用中问题的总结,对于设计数据库提出了一些规范,这些规范被称为范式(Normal Form),
目前有迹可寻的共有 8 种范式,一般需要遵守 3 范式即可。
- 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。
- 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
- 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
E-R 模型
- E 表示 entry-实体,设计实体就像定义一个类一样,指定从哪些方面描述对象,一个实体转换为数据库中的一个表。
- R 表示 relationship-关系,关系描述两个实体之间的对应规则,关系的类型包括包括一对一、一对多、多对多。
一对一 :
但一个表的列太多时,并且某些列不经常出现在结果中,此时可以对列进行拆分,此时两个表的关系为一对一关系。实体 A 对实体 B 为 1 对 1,则在表 A 或表 B 中创建一个字段,存储另一个表的主键值。一对多 :
A 表中的一条数据对应 B 表中的一条数据, B 表中的一条数据对应 A 表中的多条数据。此时 A 与 B 为多对一的关系。实体 A 对实体 B 为 1 对多:在表 B 中创建一个字段,存储表 A 的主键值。多对多 :
A 表中的一条数据对应 B 表中的多条数据, B 表中的一条数据对应 A 表中的多条数据。此时 A 与 B 为多对多的关系。实体 A 对实体 B 为多对多:新建一张表 C,这个表只有两个字段,一个用于存储 A 的主键值,一个用于存储 B 的主键值。
更多查询用法
消除重复行
1 | $ select distinct 列1, 列2 ... from 表名; |
条件
使用 where 子句对表中的数据筛选,结果为 true 的行为会出现在结果集中。
1 | $ select * from 表名 where 条件; |
where 后面支持多种运算符,进行条件的处理。
比较运算符
- 等于 =
- 大于 >
- 大于等于 >=
- 小于 <
- 小于等于 <=
- 不等于 != 或 <>
例: 查询编号大于 3 的学生
1 | $ select * from students where id > 3; |
例:查询编号不大于 4 的学生
1 | $ select * from students where id <= 4; |
例:查询姓名不是“黄蓉”的学生
1 | $ select * from students where name != "黄蓉"; |
例:查询没被删除的学生
1 | $ select * from students where is_delete=0; |
逻辑运算
- and
- or
- not
例:查询编号大于 3 的女同学
1 | $ select * from students where id > 4 or gender = 0; |
例 6:查询编号小于 4 或没被删除的学生
1 | $ select * from students where id < 4 or is_delete = 0; |
模糊查询
like
%
表示任意多个任意字符_
表示一个任意字符
例:查询姓黄的学生
1 | $ select * from students where name like "黄%"; |
例:查询姓黄并且“名”是一个字的学生
1 | $ select * from students where name like "黄_"; |
例:查询姓黄或叫靖的学生
1 | $ select * from students where name like "黄%" or name like "%靖"; |
范围查询
in
表示在一个非连续的范围内
例:查询编号是 1 或 3 或 8 的学生
1 | $ select * from students where id in(1,3, 8); |
between ... and ...
表示在一个连续的范围内
例:查询编号为 3 至 8 的学生
1 | $ select * from students where id between 3 and 8; |
例:查询编号是 3 至 8 的男生
1 | $ select * from students where (id between 3 and 8) and gender = 1; |
空判断
- 注意:
null
和""
是不同的 - 判空
is null
例:查询没有填写身高的学生
1 | $ select * from students where height is null; |
- 判非空
is not null
例:查询填写了身高的学生
1 | $ select * from students where height is not null and gender=1; |
优先级
- 优先级由高到低的顺序为:小括号,not,比较运算符,逻辑运算符
- and 比 or 先运算,如果同时出现并希望先算 or,需要结合()使用
排序
语法:
1 | $ select * from 表名 order by 列1 asc|desc [,列2 asc|desc,...] |
说明
- 将行数据按照列 1 进行排序,如果某些行列 1 的值相同时,则按照列 2 排序,以此类推
- 默认按照列值从小到大排列(asc)
asc
从小到大排列,即升序desc
从大到小排序,即降序
例:查询未删除男生信息,按学号降序
1 | $ select * from students where gender = 1 and is_delete = 0 order by id desc; |
例:查询未删除学生信息,按名称升序(默认升序)
1 | select * from students where is_delete=0 order by id; |
例 3:显示所有的学生信息,先按照年龄从大–>小排序,当年龄相同时 按照身高从高–>矮排序
1 | select * from students order by age, height desc; |
聚合函数
- count(*)表示计算总行数,括号中写星与列名,结果是相同的
例:查询学生总数
1 | select count(*) from students; |
- max(列)表示求此列的最大值
例:查询女生的编号最大值
1 | select max(id) from students where gender = 2; |
- min(列)表示求此列的最小值
例:查询未删除的学生最小编号
1 | select min(id) from students where is_delete = 0; |
- sum(列)表示求此列的和
例:查询男生的总年龄
1 | select sum(age) from students where gender = 1; |
- avg(列)表示求此列的平均值
例:查询未删除女生的编号平均值
1 | select avg(age) from students where is_delete = 0 and gender = 2; |
分组
- group by 的含义:将查询结果按照 1 个或多个字段进行分组,字段值相同的为一组
- group by 可用于单个字段分组,也可用于多个字段分组
1 | -- 根据gender字段来分组 |
group by + group_concat()
- group_concat(字段名)可以作为一个输出字段来使用,
- 表示分组之后,根据分组结果,使用 group_concat()来放置每一组的某字段的值的集合
1 | select gender, group_concat(name) from students group by gender; |
group by + 集合函数
- 通过 group_concat()的启发,我们既然可以统计出每个分组的某字段的值的集合,那么我们也可以通过集合函数来对这个值的集合做一些操作。
1 | select gender, group_concat(age) from students group by gender; |
group by + having
- having 条件表达式:用来分组查询后指定一些条件来输出查询结果
- having 作用和 where 一样,但 having 只能用于 group by
1 | select gender, count(*) from students group by gender |
group by + with rollup
- with rollup 的作用是:在最后新增一行,来记录当前列里所有记录的总和
1 | select gender, count(*) from students group by gender |
分页
语法
1 | select * from 表名 limit start,count |
说明
- 从 start 开始,获取 count 条数据
例:查询前 3 行男生信息
1 | select * from students where gender = 1 limit 0,3; |
连接查询
当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回
mysql 支持三种类型的连接查询,分别为:
- 内连接查询:查询的结果为两个表匹配到的数据
- 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用 null 填充
- 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用 null 填充
语法
1 | select * from 表1 inner 或 left 或 right join 表2 on 表1.列 = 表2.列; |
例:使用内连接查询班级表与学生表
1 | select * from students inner join classes on students.cls_id = classes.id; |
例 2:使用左连接查询班级表与学生表, 此处使用了 as 为表起别名,目的是编写简单
1 | select * from students as s left join classes as c on s.cls_id = c.id; |
例 3:使用右连接查询班级表与学生表
1 | select * from students as s right join classes as c on s.cls_id = c.id; |
例 4:查询学生姓名及班级名称
1 | select s.name, c.name from students as s inner join classes as c on s.cls_id = c.id; |
自关联
设计省信息的表结构 provinces
- id
- ptitle
设计市信息的表结构 citys
- id
- ctitle
- proid
citys 表的 proid 表示城市所属的省,对应着 provinces 表的 id 值
问题:
能不能将两个表合成一张表呢?
思考:
观察两张表发现,citys 表比 provinces 表多一个列 proid,其它列的类型都是一样的
意义:
存储的都是地区信息,而且每种信息的数据量有限,没必要增加一个新表,或者将来还要存储区、乡镇信息,都增加新表的开销太大
答案:
定义表 areas,结构如下
- id
- atitle
- pid
说明:
- 因为省没有所属的省份,所以可以填写为 null
- 城市所属的省份 pid,填写省所对应的编号 id
- 这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的 pid 引用的是省信息的 id
- 在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息
- 创建 areas 表的语句如下:
1 | create table areas( |
- 从 sql 文件中导入数据,
areas.sql
文件地址
1 | source areas.sql; |
- 查询一共有多少个省
1 | select count(*) from areas where pid is null; |
例:查询省的名称为“山西省”的所有城市
1 | select city.* from areas as city |
例:查询市的名称为“广州市”的所有区县
1 | select dis.* from areas as dis |
子查询
子查询
在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句。
主查询
主要查询的对象,第一条 select 语句
主查询和子查询的关系
- 子查询是嵌入到主查询中
- 子查询是辅助主查询的,要么充当条件,要么充当数据源
- 子查询是可以独立存在的语句,是一条完整的 select 语句
子查询分类
- 标量子查询: 子查询返回的结果是一个数据(一行一列)
- 列子查询: 返回的结果是一列(一列多行)
- 行子查询: 返回的结果是一行(一行多列)
标量子查询 - 查询班级学生的平均身高
1 | select * from students where age > (select avg(age) from students); |
列级子查询 - 查询还有学生在班的所有班级名字
1 | select name from classes where id in (select cls_id from students); |
行级子查询 - 查找班级年龄最大,身高最高的学生
1 | select * from students where (height,age) = (select max(height),max(age) from students); |
子查询中特定关键字使用
- in 范围
- 格式: 主查询 where 条件 in (列子查询)
总结
查询的完整格式
1 | SELECT select_expr [,select_expr,...] [ |
完整的 select 语句
1 | select distinct * |
MySql 高级
视图
视图是什么
通俗的讲,视图就是一条 SELECT 语句执行后返回的结果集。所以我们在创建视图的时候,主要的工作就落在创建这条 SQL 查询语句上。
视图是对若干张基本表的引用,一张虚表,查询语句执行的结果,不存储具体的数据(基本表数据发生了改变,视图也会跟着改变);
方便操作,特别是查询操作,减少复杂的 SQL 语句,增强可读性;
定义视图
1 | create view 视图名称 as select语句; |
查看视图
查看表会将所有的视图也列出来
1 | show tables; |
使用视图
视图的用途就是查询
1 | select * from v_stu_score; |
删除视图
1 | drop view 视图名称; |
视图的作用
- 提高了重用性,就像一个函数
- 对数据库重构,却不影响程序的运行
- 提高了安全性能,可以对不同的用户
- 让数据更加清晰
事务
所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
事务四大特性(简称 ACID)
原子性(Atomicity)
一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作,这就是事务的原子性.
一致性(Consistency)
数据库总是从一个一致性的状态转换到另一个一致性的状态。(在前面的例子中,一致性确保了,即使在执行第三、四条语句之间时系统崩溃,支票账户中也不会损失 200 美元,因为事务最终没有提交,所以事务中所做的修改也不会保存到数据库中。)
隔离性(Isolation)
通常来说,一个事务所做的修改在最终提交以前,对其他事务是不可见的。(在前面的例子中,当执行完第三条语句、第四条语句还未开始时,此时有另外的一个账户汇总程序开始运行,则其看到支票帐户的余额并没有被减去 200 美元。)
持久性(Durability)
一旦事务提交,则其所做的修改会永久保存到数据库。(此时即使系统崩溃,修改的数据也不会丢失。)
事务命令
表的引擎类型必须是 innodb 类型才可以使用事务,这是 mysql 表的默认引擎
查看表的创建语句,可以看到 engine=innodb
1 | -- 选择数据库 |
开启事务,命令如下:
开启事务后执行修改命令,变更会维护到本地缓存中,而不维护到物理表中
1 | begin; |
提交事务,命令如下
将缓存中的数据变更维护到物理表中
1 | commit; |
回滚事务,命令如下:
放弃缓存中变更的数据
1 | rollback; |
注意
- 修改数据的命令会自动的触发事务,包括 insert、update、delete
- 而在 SQL 语句中有手动开启事务的原因是:可以进行多次数据的修改,如果成功一起成功,否则一起会滚到之前的数据
提交
为了演示效果,需要打开两个终端窗口,使用同一个数据库,操作同一张表
step1:连接
终端 1:查询商品分类信息
1 | select * from goods_cates; |
step2:增加数据
终端 2:开启事务,插入数据
1 | begin; |
终端 2:查询数据,此时有新增的数据
1 | select * from goods_cates; |
step3:查询
终端 1:查询数据,发现并没有新增的数据
1 | select * from goods_cates; |
step4:提交
终端 2:完成提交
1 | commit; |
step5:查询
终端 1:查询,发现有新增的数据
1 | select * from goods_cates; |
回滚
为了演示效果,需要打开两个终端窗口,使用同一个数据库,操作同一张表
step1:连接
终端 1
1 | select * from goods_cates; |
step2:增加数据
终端 2:开启事务,插入数据
1 | begin; |
终端 2:查询数据,此时有新增的数据
1 | select * from goods_cates; |
step3:查询
终端 1:查询数据,发现并没有新增的数据
1 | select * from goods_cates; |
step4:回滚
终端 2:完成回滚
1 | rollback; |
step5:查询
终端 1:查询数据,发现没有新增的数据
1 | select * from goods_cates; |
索引
索引是什么
索引是一种特殊的文件(InnoDB 数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。
更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度。
索引目的
索引的目的在于提高查询效率,可以类比字典,如果要查“mysql”这个单词,我们肯定需要定位到 m 字母,然后从下往下找到 y 字母,再找到剩下的 sql。如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的,如果我想找到 m 开头的单词呢?或者 ze 开头的单词呢?是不是觉得如果没有索引,这个事情根本无法完成?
索引原理
除了词典,生活中随处可见索引的例子,如火车站的车次表、图书的目录等。它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总是通过同一种查找方式来锁定数据。
数据库也是一样,但显然要复杂许多,因为不仅面临着等值查询,还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果 1000 条数据,1 到 100 分成第一段,101 到 200 分成第二段,201 到 300 分成第三段……这样查第 250 条数据,只要找第三段就可以了,一下子去除了 90%的无效数据。
索引的使用
查看索引
1 | show index from 表名; |
创建索引
- 如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致
- 字段类型如果不是字符串,可以不填写长度部分
1 | create index 索引名称 on 表名(字段名称(长度)) |
删除索引:
1 | drop index 索引名称 on 表名; |
例子
创建测试表 testindex
1 | create table test_index(title varchar(10)); |
使用 python 程序通过 pymsql 模块 向表中加入十万条数据
1 | from pymysql import * |
查询
开启运行时间监测:
1 | set profiling=1; |
查找第 1 万条数据 ha-99999
1 | select * from test_index where title='ha-99999'; |
查看执行的时间:
1 | show profiles; |
为表 title_index 的 title 列创建索引:
1 | create index title_index on test_index(title(10)); |
执行查询语句:
1 | select * from test_index where title='ha-99999'; |
再次查看执行的时间
1 | show profiles; |
注意:
要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的 where 字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。
建立索引会占用磁盘空间