JavaGuide/docs/database/sql/sql-questions-01.md

1826 lines
56 KiB
Markdown
Raw Permalink Normal View History

---
title: SQL常见面试题总结1
category: 数据库
tag:
- 数据库基础
- SQL
---
> 题目来源于:[牛客题霸 - SQL 必知必会](https://www.nowcoder.com/exam/oj?page=1&tab=SQL%E7%AF%87&topicId=298)
## 检索数据
`SELECT` 用于从数据库中查询数据。
### 从 Customers 表中检索所有的 ID
现有表 `Customers` 如下:
| cust_id |
| ------- |
| A |
| B |
| C |
编写 SQL 语句,从 `Customers` 表中检索所有的 `cust_id`
答案:
```sql
SELECT cust_id
FROM Customers
```
### 检索并列出已订购产品的清单
`OrderItems` 含有非空的列 `prod_id` 代表商品 id包含了所有已订购的商品有些已被订购多次
| prod_id |
| ------- |
| a1 |
| a2 |
| a3 |
| a4 |
| a5 |
| a6 |
| a7 |
编写 SQL 语句,检索并列出所有已订购商品(`prod_id`)的去重后的清单。
答案:
```sql
2023-05-22 10:13:07 +08:00
SELECT DISTINCT prod_id
FROM OrderItems
```
2023-05-22 10:13:07 +08:00
知识点:`DISTINCT` 用于返回列中的唯一不同值。
### 检索所有列
现在有 `Customers` 表(表中含有列 `cust_id` 代表客户 id`cust_name` 代表客户姓名)
| cust_id | cust_name |
| ------- | --------- |
| a1 | andy |
| a2 | ben |
| a3 | tony |
| a4 | tom |
| a5 | an |
| a6 | lee |
| a7 | hex |
需要编写 SQL 语句,检索所有列。
答案:
```sql
SELECT cust_id, cust_name
FROM Customers
```
## 排序检索数据
`ORDER BY` 用于对结果集按照一个列或者多个列进行排序。默认按照升序对记录进行排序,如果需要按照降序对记录进行排序,可以使用 `DESC` 关键字。
### 检索顾客名称并且排序
有表 `Customers``cust_id` 代表客户 id`cust_name` 代表客户姓名。
| cust_id | cust_name |
| ------- | --------- |
| a1 | andy |
| a2 | ben |
| a3 | tony |
| a4 | tom |
| a5 | an |
| a6 | lee |
| a7 | hex |
`Customers` 中检索所有的顾客名称(`cust_name`),并按从 Z 到 A 的顺序显示结果。
答案:
```sql
2023-04-28 17:31:44 +08:00
SELECT cust_name
FROM Customers
ORDER BY cust_name DESC
```
### 对顾客 ID 和日期排序
`Orders` 表:
| cust_id | order_num | order_date |
| ------- | --------- | ------------------- |
| andy | aaaa | 2021-01-01 00:00:00 |
| andy | bbbb | 2021-01-01 12:00:00 |
| bob | cccc | 2021-01-10 12:00:00 |
| dick | dddd | 2021-01-11 00:00:00 |
编写 SQL 语句,从 `Orders` 表中检索顾客 ID`cust_id`)和订单号(`order_num`),并先按顾客 ID 对结果进行排序,再按订单日期倒序排列。
答案:
```sql
# 根据列名排序
# 注意:是 order_date 降序,而不是 order_num
SELECT cust_id, order_num
FROM Orders
ORDER BY cust_id,order_date DESC
```
知识点:`order by` 对多列排序的时候,先排序的列放前面,后排序的列放后面。并且,不同的列可以有不同的排序规则。
### 按照数量和价格排序
假设有一个 `OrderItems` 表:
| quantity | item_price |
| -------- | ---------- |
| 1 | 100 |
| 10 | 1003 |
| 2 | 500 |
编写 SQL 语句,显示 `OrderItems` 表中的数量(`quantity`)和价格(`item_price`),并按数量由多到少、价格由高到低排序。
答案:
```sql
SELECT quantity, item_price
FROM OrderItems
ORDER BY quantity DESC,item_price DESC
```
### 检查 SQL 语句
`Vendors` 表:
| vend_name |
| --------- |
| 海底捞 |
| 小龙坎 |
| 大龙燚 |
下面的 SQL 语句有问题吗?尝试将它改正确,使之能够正确运行,并且返回结果根据`vend_name` 逆序排列。
```sql
SELECT vend_name,
FROM Vendors
ORDER vend_name DESC
```
改正后:
```sql
SELECT vend_name
FROM Vendors
ORDER BY vend_name DESC
```
知识点:
- 逗号作用是用来隔开列与列之间的。
- ORDER BY 是有 BY 的,需要撰写完整,且位置正确。
## 过滤数据
`WHERE` 可以过滤返回的数据。
下面的运算符可以在 `WHERE` 子句中使用:
2023-10-27 06:44:02 +08:00
| 运算符 | 描述 |
| :------ | :----------------------------------------------------------- |
| = | 等于 |
2023-07-08 12:06:49 +08:00
| <> | 不等于。 **注释:** 在 SQL 的一些版本中,该操作符可被写成 != |
2023-10-27 06:44:02 +08:00
| > | 大于 |
| < | 小于 |
| >= | 大于等于 |
| <= | 小于等于 |
| BETWEEN | 在某个范围内 |
| LIKE | 搜索某种模式 |
| IN | 指定针对某个列的多个可能值 |
### 返回固定价格的产品
2023-05-05 12:39:01 +08:00
有表 `Products`
| prod_id | prod_name | prod_price |
| ------- | -------------- | ---------- |
| a0018 | sockets | 9.49 |
| a0019 | iphone13 | 600 |
| b0018 | gucci t-shirts | 1000 |
【问题】从 `Products` 表中检索产品 ID`prod_id`)和产品名称(`prod_name`),只返回价格为 9.49 美元的产品。
答案:
```sql
SELECT prod_id, prod_name
FROM Products
WHERE prod_price = 9.49
```
### 返回更高价格的产品
2023-05-05 12:39:01 +08:00
有表 `Products`
| prod_id | prod_name | prod_price |
| ------- | -------------- | ---------- |
| a0018 | sockets | 9.49 |
| a0019 | iphone13 | 600 |
| b0019 | gucci t-shirts | 1000 |
【问题】编写 SQL 语句,从 `Products` 表中检索产品 ID`prod_id`)和产品名称(`prod_name`),只返回价格为 9 美元或更高的产品。
答案:
```sql
SELECT prod_id, prod_name
FROM Products
WHERE prod_price >= 9
```
### 返回产品并且按照价格排序
2023-05-05 12:39:01 +08:00
有表 `Products`
| prod_id | prod_name | prod_price |
| ------- | --------- | ---------- |
| a0011 | egg | 3 |
| a0019 | sockets | 4 |
| b0019 | coffee | 15 |
【问题】编写 SQL 语句,返回 `Products` 表中所有价格在 3 美元到 6 美元之间的产品的名称(`prod_name`)和价格(`prod_price`),然后按价格对结果进行排序。
答案:
```sql
SELECT prod_name, prod_price
FROM Products
WHERE prod_price BETWEEN 3 AND 6
ORDER BY prod_price
# 或者
SELECT prod_name, prod_price
FROM Products
WHERE prod_price >= 3 AND prod_price <= 6
ORDER BY prod_price
```
### 返回更多的产品
`OrderItems` 表含有:订单号 `order_num``quantity`产品数量
| order_num | quantity |
| --------- | -------- |
| a1 | 105 |
| a2 | 1100 |
| a2 | 200 |
| a4 | 1121 |
| a5 | 10 |
| a2 | 19 |
| a7 | 5 |
【问题】从 `OrderItems` 表中检索出所有不同且不重复的订单号(`order_num`),其中每个订单都要包含 100 个或更多的产品。
答案:
```sql
2023-05-22 10:13:07 +08:00
SELECT order_num
FROM OrderItems
2023-05-22 10:13:07 +08:00
GROUP BY order_num
HAVING SUM(quantity) >= 100
```
## 高级数据过滤
`AND``OR` 运算符用于基于一个以上的条件对记录进行过滤,两者可以结合使用。`AND` 必须 2 个条件都成立,`OR`只要 2 个条件中的一个成立即可。
### 检索供应商名称
`Vendors` 表有字段供应商名称(`vend_name`)、供应商国家(`vend_country`)、供应商州(`vend_state`
| vend_name | vend_country | vend_state |
| --------- | ------------ | ---------- |
| apple | USA | CA |
| vivo | CNA | shenzhen |
| huawei | CNA | xian |
【问题】编写 SQL 语句,从 `Vendors` 表中检索供应商名称(`vend_name`),仅返回加利福尼亚州的供应商(这需要按国家[USA]和州[CA]进行过滤,没准其他国家也存在一个 CA
答案:
```sql
SELECT vend_name
FROM Vendors
WHERE vend_country = 'USA' AND vend_state = 'CA'
```
### 检索并列出已订购产品的清单
`OrderItems` 表包含了所有已订购的产品(有些已被订购多次)。
| prod_id | order_num | quantity |
| ------- | --------- | -------- |
| BR01 | a1 | 105 |
| BR02 | a2 | 1100 |
| BR02 | a2 | 200 |
| BR03 | a4 | 1121 |
| BR017 | a5 | 10 |
| BR02 | a2 | 19 |
| BR017 | a7 | 5 |
【问题】编写 SQL 语句,查找所有订购了数量至少 100 个的 `BR01`、`BR02` 或 `BR03` 的订单。你需要返回 `OrderItems` 表的订单号(`order_num`)、产品 ID`prod_id`)和数量(`quantity`),并按产品 ID 和数量进行过滤。
答案:
```sql
SELECT order_num, prod_id, quantity
FROM OrderItems
WHERE prod_id IN ('BR01', 'BR02', 'BR03') AND quantity >= 100
```
### 返回所有价格在 3 美元到 6 美元之间的产品的名称和价格
有表 `Products`
| prod_id | prod_name | prod_price |
| ------- | --------- | ---------- |
| a0011 | egg | 3 |
| a0019 | sockets | 4 |
| b0019 | coffee | 15 |
【问题】编写 SQL 语句,返回所有价格在 3 美元到 6 美元之间的产品的名称(`prod_name`)和价格(`prod_price`),使用 AND 操作符,然后按价格对结果进行升序排序。
答案:
```sql
SELECT prod_name, prod_price
FROM Products
2023-07-08 12:06:49 +08:00
WHERE prod_price >= 3 and prod_price <= 6
ORDER BY prod_price
```
### 检查 SQL 语句
供应商表 `Vendors` 有字段供应商名称 `vend_name`、供应商国家 `vend_country`、供应商省份 `vend_state`
| vend_name | vend_country | vend_state |
| --------- | ------------ | ---------- |
| apple | USA | CA |
| vivo | CNA | shenzhen |
| huawei | CNA | xian |
【问题】修改正确下面 sql使之正确返回。
```sql
SELECT vend_name
FROM Vendors
ORDER BY vend_name
WHERE vend_country = 'USA' AND vend_state = 'CA';
```
修改后:
```sql
SELECT vend_name
FROM Vendors
WHERE vend_country = 'USA' AND vend_state = 'CA'
ORDER BY vend_name
```
`ORDER BY` 语句必须放在 `WHERE` 之后。
## 用通配符进行过滤
SQL 通配符必须与 `LIKE` 运算符一起使用
在 SQL 中,可使用以下通配符:
| 通配符 | 描述 |
| :------------------------------- | :------------------------- |
| `%` | 代表零个或多个字符 |
| `_` | 仅替代一个字符 |
| `[charlist]` | 字符列中的任何单一字符 |
| `[^charlist]` 或者 `[!charlist]` | 不在字符列中的任何单一字符 |
### 检索产品名称和描述(一)
`Products` 表如下:
| prod_name | prod_desc |
| --------- | -------------- |
| a0011 | usb |
| a0019 | iphone13 |
| b0019 | gucci t-shirts |
| c0019 | gucci toy |
| d0019 | lego toy |
【问题】编写 SQL 语句,从 `Products` 表中检索产品名称(`prod_name`)和描述(`prod_desc`),仅返回描述中包含 `toy` 一词的产品名称。
答案:
```sql
SELECT prod_name, prod_desc
FROM Products
WHERE prod_desc LIKE '%toy%'
```
### 检索产品名称和描述(二)
`Products` 表如下:
| prod_name | prod_desc |
| --------- | -------------- |
| a0011 | usb |
| a0019 | iphone13 |
| b0019 | gucci t-shirts |
| c0019 | gucci toy |
| d0019 | lego toy |
【问题】编写 SQL 语句,从 `Products` 表中检索产品名称(`prod_name`)和描述(`prod_desc`),仅返回描述中未出现 `toy` 一词的产品,最后按”产品名称“对结果进行排序。
答案:
```sql
SELECT prod_name, prod_desc
FROM Products
WHERE prod_desc NOT LIKE '%toy%'
ORDER BY prod_name
```
### 检索产品名称和描述(三)
`Products` 表如下:
| prod_name | prod_desc |
| --------- | ---------------- |
| a0011 | usb |
| a0019 | iphone13 |
| b0019 | gucci t-shirts |
| c0019 | gucci toy |
| d0019 | lego carrots toy |
【问题】编写 SQL 语句,从 `Products` 表中检索产品名称(`prod_name`)和描述(`prod_desc`),仅返回描述中同时出现 `toy``carrots` 的产品。有好几种方法可以执行此操作,但对于这个挑战题,请使用 `AND` 和两个 `LIKE` 比较。
答案:
```sql
SELECT prod_name, prod_desc
FROM Products
WHERE prod_desc LIKE '%toy%' AND prod_desc LIKE "%carrots%"
```
### 检索产品名称和描述(四)
`Products` 表如下:
| prod_name | prod_desc |
| --------- | ---------------- |
| a0011 | usb |
| a0019 | iphone13 |
| b0019 | gucci t-shirts |
| c0019 | gucci toy |
| d0019 | lego toy carrots |
【问题】编写 SQL 语句,从 Products 表中检索产品名称prod_name和描述prod_desc仅返回在描述中以**先后顺序**同时出现 toy 和 carrots 的产品。提示:只需要用带有三个 `%` 符号的 `LIKE` 即可。
答案:
```sql
SELECT prod_name, prod_desc
FROM Products
WHERE prod_desc LIKE '%toy%carrots%'
```
## 创建计算字段
### 别名
别名的常见用法是在检索出的结果中重命名表的列字段(为了符合特定的报表要求或客户需求)。有表 `Vendors` 代表供应商信息,`vend_id` 供应商 id、`vend_name` 供应商名称、`vend_address` 供应商地址、`vend_city` 供应商城市。
| vend_id | vend_name | vend_address | vend_city |
| ------- | ------------- | ------------ | --------- |
| a001 | tencent cloud | address1 | shenzhen |
| a002 | huawei cloud | address2 | dongguan |
| a003 | aliyun cloud | address3 | hangzhou |
| a003 | netease cloud | address4 | guangzhou |
【问题】编写 SQL 语句,从 `Vendors` 表中检索 `vend_id`、`vend_name`、`vend_address` 和 `vend_city`,将 `vend_name` 重命名为 `vname`,将 `vend_city` 重命名为 `vcity`,将 `vend_address` 重命名为 `vaddress`,按供应商名称对结果进行升序排序。
答案:
```sql
SELECT vend_id, vend_name AS vname, vend_address AS vaddress, vend_city AS vcity
FROM Vendors
ORDER BY vname
# as 可以省略
SELECT vend_id, vend_name vname, vend_address vaddress, vend_city vcity
FROM Vendors
ORDER BY vname
```
### 打折
我们的示例商店正在进行打折促销,所有产品均降价 10%。`Products` 表包含 `prod_id` 产品 id、`prod_price` 产品价格。
【问题】编写 SQL 语句,从 `Products` 表中返回 `prod_id`、`prod_price` 和 `sale_price`。`sale_price` 是一个包含促销价格的计算字段。提示:可以乘以 0.9,得到原价的 90%(即 10%的折扣)。
答案:
```sql
SELECT prod_id, prod_price, prod_price * 0.9 AS sale_price
FROM Products
```
注意:`sale_price` 是对计算结果的命名,而不是原有的列名。
## 使用函数处理数据
### 顾客登录名
我们的商店已经上线了,正在创建顾客账户。所有用户都需要登录名,默认登录名是其名称和所在城市的组合。
给出 `Customers` 表 如下:
| cust_id | cust_name | cust_contact | cust_city |
| ------- | --------- | ------------ | --------- |
| a1 | Andy Li | Andy Li | Oak Park |
| a2 | Ben Liu | Ben Liu | Oak Park |
| a3 | Tony Dai | Tony Dai | Oak Park |
| a4 | Tom Chen | Tom Chen | Oak Park |
| a5 | An Li | An Li | Oak Park |
| a6 | Lee Chen | Lee Chen | Oak Park |
| a7 | Hex Liu | Hex Liu | Oak Park |
【问题】编写 SQL 语句,返回顾客 ID`cust_id`)、顾客名称(`cust_name`)和登录名(`user_login`),其中登录名全部为大写字母,并由顾客联系人的前两个字符(`cust_contact`)和其所在城市的前三个字符(`cust_city`)组成。提示:需要使用函数、拼接和别名。
答案:
```sql
SELECT cust_id, cust_name, UPPER(CONCAT(SUBSTRING(cust_contact, 1, 2), SUBSTRING(cust_city, 1, 3))) AS user_login
FROM Customers
```
知识点:
- 截取函数`SUBSTRING()`:截取字符串,`substring(str ,n ,m)`n 表示起始截取位置m 表示要截取的字符个数)表示返回字符串 str 从第 n 个字符开始截取 m 个字符;
2023-05-05 12:39:01 +08:00
- 拼接函数`CONCAT()`将两个或多个字符串连接成一个字符串select concat(A,B):连接字符串 A 和 B。
- 大写函数 `UPPER()`:将指定字符串转换为大写。
### 返回 2020 年 1 月的所有订单的订单号和订单日期
`Orders` 订单表如下:
| order_num | order_date |
| --------- | ------------------- |
| a0001 | 2020-01-01 00:00:00 |
| a0002 | 2020-01-02 00:00:00 |
| a0003 | 2020-01-01 12:00:00 |
| a0004 | 2020-02-01 00:00:00 |
| a0005 | 2020-03-01 00:00:00 |
【问题】编写 SQL 语句,返回 2020 年 1 月的所有订单的订单号(`order_num`)和订单日期(`order_date`),并按订单日期升序排序
答案:
```sql
SELECT order_num, order_date
FROM Orders
WHERE month(order_date) = '01' AND YEAR(order_date) = '2020'
ORDER BY order_date
```
也可以用通配符来做:
```sql
SELECT order_num, order_date
FROM Orders
WHERE order_date LIKE '2020-01%'
ORDER BY order_date
```
知识点:
- 日期格式:`YYYY-MM-DD`
- 时间格式:`HH:MM:SS`
日期和时间处理相关的常用函数:
| 函 数 | 说 明 |
| --------------- | ------------------------------ |
| `ADDDATE()` | 增加一个日期(天、周等) |
| `ADDTIME()` | 增加一个时间(时、分等) |
| `CURDATE()` | 返回当前日期 |
| `CURTIME()` | 返回当前时间 |
| `DATE()` | 返回日期时间的日期部分 |
| `DATEDIFF` | 计算两个日期之差 |
| `DATE_FORMAT()` | 返回一个格式化的日期或时间串 |
2023-04-28 17:31:44 +08:00
| `DAY()` | 返回一个日期的天数部分 |
| `DAYOFWEEK()` | 对于一个日期,返回对应的星期几 |
| `HOUR()` | 返回一个时间的小时部分 |
| `MINUTE()` | 返回一个时间的分钟部分 |
| `MONTH()` | 返回一个日期的月份部分 |
| `NOW()` | 返回当前日期和时间 |
| `SECOND()` | 返回一个时间的秒部分 |
| `TIME()` | 返回一个日期时间的时间部分 |
| `YEAR()` | 返回一个日期的年份部分 |
## 汇总数据
汇总数据相关的函数:
| 函 数 | 说 明 |
| --------- | ---------------- |
| `AVG()` | 返回某列的平均值 |
| `COUNT()` | 返回某列的行数 |
| `MAX()` | 返回某列的最大值 |
| `MIN()` | 返回某列的最小值 |
| `SUM()` | 返回某列值之和 |
### 确定已售出产品的总数
`OrderItems` 表代表售出的产品,`quantity` 代表售出商品数量。
| quantity |
| -------- |
| 10 |
| 100 |
| 1000 |
| 10001 |
| 2 |
| 15 |
【问题】编写 SQL 语句,确定已售出产品的总数。
答案:
```sql
SELECT Sum(quantity) AS items_ordered
FROM OrderItems
```
### 确定已售出产品项 BR01 的总数
`OrderItems` 表代表售出的产品,`quantity` 代表售出商品数量,产品项为 `prod_id`
| quantity | prod_id |
| -------- | ------- |
| 10 | AR01 |
| 100 | AR10 |
| 1000 | BR01 |
| 10001 | BR010 |
【问题】修改创建的语句,确定已售出产品项(`prod_id`)为"BR01"的总数。
答案:
```sql
SELECT Sum(quantity) AS items_ordered
FROM OrderItems
WHERE prod_id = 'BR01'
```
### 确定 Products 表中价格不超过 10 美元的最贵产品的价格
`Products` 表如下,`prod_price` 代表商品的价格。
| prod_price |
| ---------- |
| 9.49 |
| 600 |
| 1000 |
【问题】编写 SQL 语句,确定 `Products` 表中价格不超过 10 美元的最贵产品的价格(`prod_price`)。将计算所得的字段命名为 `max_price`
答案:
```sql
SELECT Max(prod_price) AS max_price
FROM Products
WHERE prod_price <= 10
```
## 分组数据
`GROUP BY`
- `GROUP BY` 子句将记录分组到汇总行中。
- `GROUP BY` 为每个组返回一个记录。
- `GROUP BY` 通常还涉及聚合`COUNT``MAX``SUM``AVG` 等。
- `GROUP BY` 可以按一列或多列进行分组。
- `GROUP BY` 按分组字段进行排序后,`ORDER BY` 可以以汇总字段来进行排序。
`HAVING`
- `HAVING` 用于对汇总的 `GROUP BY` 结果进行过滤。
- `HAVING` 必须要与 `GROUP BY` 连用。
- `WHERE``HAVING` 可以在相同的查询中。
`HAVING` vs `WHERE`
- `WHERE`:过滤指定的行,后面不能加聚合函数(分组函数)。
- `HAVING`:过滤分组,必须要与 `GROUP BY` 连用,不能单独使用。
### 返回每个订单号各有多少行数
`OrderItems` 表包含每个订单的每个产品
| order_num |
| --------- |
| a002 |
| a002 |
| a002 |
| a004 |
| a007 |
【问题】编写 SQL 语句,返回每个订单号(`order_num`)各有多少行数(`order_lines`),并按 `order_lines` 对结果进行升序排序。
答案:
```sql
SELECT order_num, Count(order_num) AS order_lines
FROM OrderItems
GROUP BY order_num
ORDER BY order_lines
```
知识点:
1. `count(*)`,`count(列名)`都可以,区别在于,`count(列名)`是统计非 NULL 的行数;
2. `order by` 最后执行,所以可以使用列别名;
3. 分组聚合一定不要忘记加上 `group by` ,不然只会有一行结果。
### 每个供应商成本最低的产品
`Products` 表,含有字段 `prod_price` 代表产品价格,`vend_id` 代表供应商 id
| vend_id | prod_price |
| ------- | ---------- |
| a0011 | 100 |
| a0019 | 0.1 |
| b0019 | 1000 |
| b0019 | 6980 |
| b0019 | 20 |
【问题】编写 SQL 语句,返回名为 `cheapest_item` 的字段,该字段包含每个供应商成本最低的产品(使用 `Products` 表中的 `prod_price`),然后从最低成本到最高成本对结果进行升序排序。
答案:
```sql
SELECT vend_id, Min(prod_price) AS cheapest_item
FROM Products
GROUP BY vend_id
ORDER BY cheapest_item
```
### 返回订单数量总和不小于 100 的所有订单的订单号
`OrderItems` 代表订单商品表,包括:订单号 `order_num` 和订单数量 `quantity`
| order_num | quantity |
| --------- | -------- |
| a1 | 105 |
| a2 | 1100 |
| a2 | 200 |
| a4 | 1121 |
| a5 | 10 |
| a2 | 19 |
| a7 | 5 |
【问题】请编写 SQL 语句,返回订单数量总和不小于 100 的所有订单号,最后结果按照订单号升序排序。
答案:
```sql
# 直接聚合
SELECT order_num
FROM OrderItems
GROUP BY order_num
HAVING Sum(quantity) >= 100
ORDER BY order_num
# 子查询
SELECT a.order_num
FROM (SELECT order_num, Sum(quantity) AS sum_num
FROM OrderItems
GROUP BY order_num
HAVING sum_num >= 100) a
ORDER BY a.order_num
```
知识点:
- `where`:过滤过滤指定的行,后面不能加聚合函数(分组函数)。
- `having`:过滤分组,与 `group by` 连用,不能单独使用。
### 计算总和
`OrderItems` 表代表订单信息,包括字段:订单号 `order_num``item_price` 商品售出价格、`quantity` 商品数量。
| order_num | item_price | quantity |
| --------- | ---------- | -------- |
| a1 | 10 | 105 |
| a2 | 1 | 1100 |
| a2 | 1 | 200 |
| a4 | 2 | 1121 |
| a5 | 5 | 10 |
| a2 | 1 | 19 |
| a7 | 7 | 5 |
【问题】编写 SQL 语句,根据订单号聚合,返回订单总价不小于 1000 的所有订单号,最后的结果按订单号进行升序排序。
提示:总价 = item_price 乘以 quantity
答案:
```sql
SELECT order_num, Sum(item_price * quantity) AS total_price
FROM OrderItems
GROUP BY order_num
HAVING total_price >= 1000
ORDER BY order_num
```
### 检查 SQL 语句
`OrderItems` 表含有 `order_num` 订单号
| order_num |
| --------- |
| a002 |
| a002 |
| a002 |
| a004 |
| a007 |
【问题】将下面代码修改正确后执行
```sql
SELECT order_num, COUNT(*) AS items
FROM OrderItems
GROUP BY items
HAVING COUNT(*) >= 3
ORDER BY items, order_num;
```
修改后:
```sql
SELECT order_num, COUNT(*) AS items
FROM OrderItems
GROUP BY order_num
HAVING items >= 3
ORDER BY items, order_num;
```
## 使用子查询
子查询是嵌套在较大查询中的 SQL 查询,也称内部查询或内部选择,包含子查询的语句也称为外部查询或外部选择。简单来说,子查询就是指将一个 `SELECT` 查询(子查询)的结果作为另一个 SQL 语句(主查询)的数据来源或者判断条件。
子查询可以嵌入 `SELECT`、`INSERT`、`UPDATE` 和 `DELETE` 语句中,也可以和 `=`、`<`、`>`、`IN`、`BETWEEN`、`EXISTS` 等运算符一起使用。
子查询常用在 `WHERE` 子句和 `FROM` 子句后边:
- 当用于 `WHERE` 子句时,根据不同的运算符,子查询可以返回单行单列、多行单列、单行多列数据。子查询就是要返回能够作为 WHERE 子句查询条件的值。
- 当用于 `FROM` 子句时,一般返回多行多列数据,相当于返回一张临时表,这样才符合 `FROM` 后面是表的规则。这种做法能够实现多表联合查询。
> 注意MySQL 数据库从 4.1 版本才开始支持子查询,早期版本是不支持的。
用于 `WHERE` 子句的子查询的基本语法如下:
```sql
SELECT column_name [, column_name ]
FROM table1 [, table2 ]
WHERE column_name operator
(SELECT column_name [, column_name ]
FROM table1 [, table2 ]
[WHERE])
```
- 子查询需要放在括号`( )`内。
- `operator` 表示用于 `WHERE` 子句的运算符,可以是比较运算符(如 `=`, `<`, `>`, `<>` 等)或逻辑运算符(如 `IN`, `NOT IN`, `EXISTS`, `NOT EXISTS` 等),具体根据需求来确定。
用于 `FROM` 子句的子查询的基本语法如下:
```sql
SELECT column_name [, column_name ]
FROM (SELECT column_name [, column_name ]
FROM table1 [, table2 ]
[WHERE]) AS temp_table_name [, ...]
[JOIN type JOIN table_name ON condition]
WHERE condition;
```
- 用于 `FROM` 的子查询返回的结果相当于一张临时表,所以需要使用 AS 关键字为该临时表起一个名字。
- 子查询需要放在括号 `( )` 内。
- 可以指定多个临时表名,并使用 `JOIN` 语句连接这些表。
### 返回购买价格为 10 美元或以上产品的顾客列表
`OrderItems` 表示订单商品表,含有字段订单号:`order_num`、订单价格:`item_price``Orders` 表代表订单信息表,含有顾客 `idcust_id` 和订单号:`order_num`
`OrderItems` 表:
| order_num | item_price |
| --------- | ---------- |
| a1 | 10 |
| a2 | 1 |
| a2 | 1 |
| a4 | 2 |
| a5 | 5 |
| a2 | 1 |
| a7 | 7 |
`Orders` 表:
| order_num | cust_id |
| --------- | ------- |
| a1 | cust10 |
| a2 | cust1 |
| a2 | cust1 |
| a4 | cust2 |
| a5 | cust5 |
| a2 | cust1 |
| a7 | cust7 |
【问题】使用子查询,返回购买价格为 10 美元或以上产品的顾客列表,结果无需排序。
答案:
```sql
SELECT cust_id
FROM Orders
2023-08-02 16:52:20 +08:00
WHERE order_num IN (SELECT DISTINCT order_num
FROM OrderItems
2023-08-02 16:52:20 +08:00
where item_price >= 10)
```
### 确定哪些订单购买了 prod_id 为 BR01 的产品(一)
`OrderItems` 代表订单商品信息表,`prod_id` 为产品 id`Orders` 表代表订单表有 `cust_id` 代表顾客 id 和订单日期 `order_date`
`OrderItems` 表:
| prod_id | order_num |
| ------- | --------- |
| BR01 | a0001 |
| BR01 | a0002 |
| BR02 | a0003 |
| BR02 | a0013 |
`Orders` 表:
| order_num | cust_id | order_date |
| --------- | ------- | ------------------- |
| a0001 | cust10 | 2022-01-01 00:00:00 |
| a0002 | cust1 | 2022-01-01 00:01:00 |
| a0003 | cust1 | 2022-01-02 00:00:00 |
| a0013 | cust2 | 2022-01-01 00:20:00 |
【问题】
编写 SQL 语句,使用子查询来确定哪些订单(在 `OrderItems` 中)购买了 `prod_id` 为 "BR01" 的产品,然后从 `Orders` 表中返回每个产品对应的顾客 ID`cust_id`)和订单日期(`order_date`),按订购日期对结果进行升序排序。
答案:
```sql
# 写法 1子查询
SELECT cust_id,order_date
FROM Orders
WHERE order_num IN
(SELECT order_num
FROM OrderItems
WHERE prod_id = 'BR01' )
ORDER BY order_date;
# 写法 2: 连接表
SELECT b.cust_id, b.order_date
FROM OrderItems a,Orders b
WHERE a.order_num = b.order_num AND a.prod_id = 'BR01'
ORDER BY order_date
```
### 返回购买 prod_id 为 BR01 的产品的所有顾客的电子邮件(一)
你想知道订购 BR01 产品的日期,有表 `OrderItems` 代表订单商品信息表,`prod_id` 为产品 id`Orders` 表代表订单表有 `cust_id` 代表顾客 id 和订单日期 `order_date``Customers` 表含有 `cust_email` 顾客邮件和 `cust_id` 顾客 id
`OrderItems` 表:
| prod_id | order_num |
| ------- | --------- |
| BR01 | a0001 |
| BR01 | a0002 |
| BR02 | a0003 |
| BR02 | a0013 |
`Orders` 表:
| order_num | cust_id | order_date |
| --------- | ------- | ------------------- |
| a0001 | cust10 | 2022-01-01 00:00:00 |
| a0002 | cust1 | 2022-01-01 00:01:00 |
| a0003 | cust1 | 2022-01-02 00:00:00 |
| a0013 | cust2 | 2022-01-01 00:20:00 |
`Customers` 表代表顾客信息,`cust_id` 为顾客 id`cust_email` 为顾客 email
2023-12-30 17:14:13 +08:00
| cust_id | cust_email |
| ------- | ----------------- |
| cust10 | <cust10@cust.com> |
| cust1 | <cust1@cust.com> |
| cust2 | <cust2@cust.com> |
【问题】返回购买 `prod_id``BR01` 的产品的所有顾客的电子邮件(`Customers` 表中的 `cust_email`),结果无需排序。
提示:这涉及 `SELECT` 语句,最内层的从 `OrderItems` 表返回 `order_num`,中间的从 `Customers` 表返回 `cust_id`
答案:
```sql
# 写法 1子查询
SELECT cust_email
FROM Customers
WHERE cust_id IN (SELECT cust_id
FROM Orders
WHERE order_num IN (SELECT order_num
FROM OrderItems
WHERE prod_id = 'BR01'))
# 写法 2: 连接表inner join
SELECT c.cust_email
FROM OrderItems a,Orders b,Customers c
WHERE a.order_num = b.order_num AND b.cust_id = c.cust_id AND a.prod_id = 'BR01'
# 写法 3连接表left join
SELECT c.cust_email
FROM Orders a LEFT JOIN
OrderItems b ON a.order_num = b.order_num LEFT JOIN
Customers c ON a.cust_id = c.cust_id
WHERE b.prod_id = 'BR01'
```
### 返回每个顾客不同订单的总金额
我们需要一个顾客 ID 列表,其中包含他们已订购的总金额。
`OrderItems` 表代表订单信息,`OrderItems` 表有订单号:`order_num` 和商品售出价格:`item_price`、商品数量:`quantity`。
| order_num | item_price | quantity |
| --------- | ---------- | -------- |
| a0001 | 10 | 105 |
| a0002 | 1 | 1100 |
| a0002 | 1 | 200 |
| a0013 | 2 | 1121 |
| a0003 | 5 | 10 |
| a0003 | 1 | 19 |
| a0003 | 7 | 5 |
`Orders` 表订单号:`order_num`、顾客 id`cust_id`
| order_num | cust_id |
| --------- | ------- |
| a0001 | cust10 |
| a0002 | cust1 |
| a0003 | cust1 |
| a0013 | cust2 |
【问题】
编写 SQL 语句,返回顾客 ID`Orders` 表中的 `cust_id`),并使用子查询返回 `total_ordered` 以便返回每个顾客的订单总数,将结果按金额从大到小排序。
答案:
```sql
# 写法 1子查询
SELECT o.cust_id AS cust_id, tb.total_ordered AS total_ordered
FROM (SELECT order_num, Sum(item_price * quantity) AS total_ordered
FROM OrderItems
GROUP BY order_num) AS tb,
Orders o
WHERE tb.order_num = o.order_num
ORDER BY total_ordered DESC
# 写法 2连接表
SELECT b.cust_id, Sum(a.quantity * a.item_price) AS total_ordered
FROM OrderItems a,Orders b
WHERE a.order_num = b.order_num
GROUP BY cust_id
ORDER BY total_ordered DESC
```
### 从 Products 表中检索所有的产品名称以及对应的销售总数
`Products` 表中检索所有的产品名称:`prod_name`、产品 id`prod_id`
| prod_id | prod_name |
| ------- | --------- |
| a0001 | egg |
| a0002 | sockets |
| a0013 | coffee |
| a0003 | cola |
`OrderItems` 代表订单商品表,订单产品:`prod_id`、售出数量:`quantity`
| prod_id | quantity |
| ------- | -------- |
| a0001 | 105 |
| a0002 | 1100 |
| a0002 | 200 |
| a0013 | 1121 |
| a0003 | 10 |
| a0003 | 19 |
| a0003 | 5 |
【问题】
编写 SQL 语句,从 `Products` 表中检索所有的产品名称(`prod_name`),以及名为 `quant_sold` 的计算列,其中包含所售产品的总数(在 `OrderItems` 表上使用子查询和 `SUM(quantity)` 检索)。
答案:
```sql
# 写法 1子查询
SELECT p.prod_name, tb.quant_sold
FROM (SELECT prod_id, Sum(quantity) AS quant_sold
FROM OrderItems
GROUP BY prod_id) AS tb,
Products p
WHERE tb.prod_id = p.prod_id
# 写法 2连接表
SELECT p.prod_name, Sum(o.quantity) AS quant_sold
FROM Products p,
OrderItems o
WHERE p.prod_id = o.prod_id
GROUP BY p.prod_name这里不能用 p.prod_id会报错
```
## 连接表
JOIN 是“连接”的意思顾名思义SQL JOIN 子句用于将两个或者多个表联合起来进行查询。
连接表时需要在每个表中选择一个字段,并对这些字段的值进行比较,值相同的两条记录将合并为一条。**连接表的本质就是将不同表的记录合并起来,形成一张新表。当然,这张新表只是临时的,它仅存在于本次查询期间**。
使用 `JOIN` 连接两个表的基本语法如下:
```sql
SELECT table1.column1, table2.column2...
FROM table1
JOIN table2
ON table1.common_column1 = table2.common_column2;
```
`table1.common_column1 = table2.common_column2` 是连接条件,只有满足此条件的记录才会合并为一行。您可以使用多个运算符来连接表,例如 =、>、<<>、<=、>=、!=、`between`、`like` 或者 `not`,但是最常见的是使用 =。
当两个表中有同名的字段时,为了帮助数据库引擎区分是哪个表的字段,在书写同名字段名时需要加上表名。当然,如果书写的字段名在两个表中是唯一的,也可以不使用以上格式,只写字段名即可。
另外,如果两张表的关联字段名相同,也可以使用 `USING`子句来代替 `ON`,举个例子:
```sql
# join....on
SELECT c.cust_name, o.order_num
2023-04-28 17:31:44 +08:00
FROM Customers c
INNER JOIN Orders o
ON c.cust_id = o.cust_id
ORDER BY c.cust_name
# 如果两张表的关联字段名相同也可以使用USING子句JOIN....USING()
SELECT c.cust_name, o.order_num
FROM Customers c
INNER JOIN Orders o
USING(cust_id)
ORDER BY c.cust_name
```
**`ON` 和 `WHERE` 的区别**
- 连接表时SQL 会根据连接条件生成一张新的临时表。`ON` 就是连接条件,它决定临时表的生成。
- `WHERE` 是在临时表生成以后,再对临时表中的数据进行过滤,生成最终的结果集,这个时候已经没有 JOIN-ON 了。
所以总结来说就是:**SQL 先根据 ON 生成一张临时表,然后再根据 WHERE 对临时表进行筛选**。
SQL 允许在 `JOIN` 左边加上一些修饰性的关键词,从而形成不同类型的连接,如下表所示:
2023-04-28 17:31:44 +08:00
| 连接类型 | 说明 |
| ---------------------------------------- | --------------------------------------------------------------------------------------------- |
| INNER JOIN 内连接 | (默认连接方式)只有当两个表都存在满足条件的记录时才会返回行。 |
| LEFT JOIN / LEFT OUTER JOIN 左(外)连接 | 返回左表中的所有行,即使右表中没有满足条件的行也是如此。 |
| RIGHT JOIN / RIGHT OUTER JOIN 右(外)连接 | 返回右表中的所有行,即使左表中没有满足条件的行也是如此。 |
| FULL JOIN / FULL OUTER JOIN 全(外)连接 | 只要其中有一个表存在满足条件的记录,就返回行。 |
| SELF JOIN | 将一个表连接到自身,就像该表是两个表一样。为了区分两个表,在 SQL 语句中需要至少重命名一个表。 |
2023-04-28 17:31:44 +08:00
| CROSS JOIN | 交叉连接,从两个或者多个连接表中返回记录集的笛卡尔积。 |
下图展示了 LEFT JOIN、RIGHT JOIN、INNER JOIN、OUTER JOIN 相关的 7 种用法。
2023-03-10 11:52:00 +08:00
![](https://oss.javaguide.cn/github/javaguide/csdn/d1794312b448516831369f869814ab39.png)
如果不加任何修饰词,只写 `JOIN`,那么默认为 `INNER JOIN`
对于 `INNER JOIN` 来说,还有一种隐式的写法,称为 “**隐式内连接**”,也就是没有 `INNER JOIN` 关键字,使用 `WHERE` 语句实现内连接的功能
```sql
# 隐式内连接
SELECT c.cust_name, o.order_num
FROM Customers c,Orders o
WHERE c.cust_id = o.cust_id
ORDER BY c.cust_name
# 显式内连接
SELECT c.cust_name, o.order_num
2023-04-28 17:31:44 +08:00
FROM Customers c
INNER JOIN Orders o
USING(cust_id)
ORDER BY c.cust_name;
```
### 返回顾客名称和相关订单号
`Customers` 表有字段顾客名称 `cust_name`、顾客 id `cust_id`
| cust_id | cust_name |
| -------- | --------- |
| cust10 | andy |
| cust1 | ben |
| cust2 | tony |
| cust22 | tom |
| cust221 | an |
| cust2217 | hex |
`Orders` 订单信息表,含有字段 `order_num` 订单号、`cust_id` 顾客 id
| order_num | cust_id |
| --------- | -------- |
| a1 | cust10 |
| a2 | cust1 |
| a3 | cust2 |
| a4 | cust22 |
| a5 | cust221 |
| a7 | cust2217 |
【问题】编写 SQL 语句,返回 `Customers` 表中的顾客名称(`cust_name`)和 `Orders` 表中的相关订单号(`order_num`),并按顾客名称再按订单号对结果进行升序排序。你可以尝试用两个不同的写法,一个使用简单的等连接语法,另外一个使用 INNER JOIN。
答案:
```sql
# 隐式内连接
SELECT c.cust_name, o.order_num
FROM Customers c,Orders o
WHERE c.cust_id = o.cust_id
ORDER BY c.cust_name,o.order_num
# 显式内连接
SELECT c.cust_name, o.order_num
2023-04-28 17:31:44 +08:00
FROM Customers c
INNER JOIN Orders o
USING(cust_id)
ORDER BY c.cust_name,o.order_num;
```
### 返回顾客名称和相关订单号以及每个订单的总价
`Customers` 表有字段,顾客名称:`cust_name`、顾客 id`cust_id`
| cust_id | cust_name |
| -------- | --------- |
| cust10 | andy |
| cust1 | ben |
| cust2 | tony |
| cust22 | tom |
| cust221 | an |
| cust2217 | hex |
`Orders` 订单信息表,含有字段,订单号:`order_num`、顾客 id`cust_id`
| order_num | cust_id |
| --------- | -------- |
| a1 | cust10 |
| a2 | cust1 |
| a3 | cust2 |
| a4 | cust22 |
| a5 | cust221 |
| a7 | cust2217 |
`OrderItems` 表有字段,商品订单号:`order_num`、商品数量:`quantity`、商品价格:`item_price`
| order_num | quantity | item_price |
| --------- | -------- | ---------- |
| a1 | 1000 | 10 |
| a2 | 200 | 10 |
| a3 | 10 | 15 |
| a4 | 25 | 50 |
| a5 | 15 | 25 |
| a7 | 7 | 7 |
【问题】除了返回顾客名称和订单号,返回 `Customers` 表中的顾客名称(`cust_name`)和 `Orders` 表中的相关订单号(`order_num`),添加第三列 `OrderTotal`,其中包含每个订单的总价,并按顾客名称再按订单号对结果进行升序排序。
```sql
# 简单的等连接语法
SELECT c.cust_name, o.order_num, SUM(quantity * item_price) AS OrderTotal
FROM Customers c,Orders o,OrderItems oi
WHERE c.cust_id = o.cust_id AND o.order_num = oi.order_num
GROUP BY c.cust_name, o.order_num
ORDER BY c.cust_name, o.order_num
```
注意,可能有小伙伴会这样写:
```sql
SELECT c.cust_name, o.order_num, SUM(quantity * item_price) AS OrderTotal
FROM Customers c,Orders o,OrderItems oi
WHERE c.cust_id = o.cust_id AND o.order_num = oi.order_num
GROUP BY c.cust_name
ORDER BY c.cust_name,o.order_num
```
这是错误的!只对 `cust_name` 进行聚类确实符合题意,但是不符合 `GROUP BY` 的语法。
2023-07-09 10:20:20 +08:00
select 语句中,如果没有 `GROUP BY` 语句,那么 `cust_name`、`order_num` 会返回若干个值,而 `sum(quantity * item_price)` 只返回一个值,通过 `group by` `cust_name` 可以让 `cust_name``sum(quantity * item_price)` 一一对应起来,或者说**聚类**,所以同样的,也要对 `order_num` 进行聚类。
> **一句话select 中的字段要么都聚类,要么都不聚类**
### 确定哪些订单购买了 prod_id 为 BR01 的产品(二)
`OrderItems` 代表订单商品信息表,`prod_id` 为产品 id`Orders` 表代表订单表有 `cust_id` 代表顾客 id 和订单日期 `order_date`
`OrderItems` 表:
| prod_id | order_num |
| ------- | --------- |
| BR01 | a0001 |
| BR01 | a0002 |
| BR02 | a0003 |
| BR02 | a0013 |
`Orders` 表:
| order_num | cust_id | order_date |
| --------- | ------- | ------------------- |
| a0001 | cust10 | 2022-01-01 00:00:00 |
| a0002 | cust1 | 2022-01-01 00:01:00 |
| a0003 | cust1 | 2022-01-02 00:00:00 |
| a0013 | cust2 | 2022-01-01 00:20:00 |
【问题】
编写 SQL 语句,使用子查询来确定哪些订单(在 `OrderItems` 中)购买了 `prod_id` 为 "BR01" 的产品,然后从 `Orders` 表中返回每个产品对应的顾客 ID`cust_id`)和订单日期(`order_date`),按订购日期对结果进行升序排序。
提示:这一次使用连接和简单的等连接语法。
```sql
# 写法 1子查询
SELECT cust_id, order_date
FROM Orders
WHERE order_num IN (SELECT order_num
FROM OrderItems
WHERE prod_id = 'BR01')
ORDER BY order_date
# 写法 2连接表 inner join
SELECT cust_id, order_date
FROM Orders o INNER JOIN
(SELECT order_num
FROM OrderItems
WHERE prod_id = 'BR01') tb ON o.order_num = tb.order_num
ORDER BY order_date
# 写法 3写法 2 的简化版
SELECT cust_id, order_date
FROM Orders
INNER JOIN OrderItems USING(order_num)
WHERE OrderItems.prod_id = 'BR01'
ORDER BY order_date
```
### 返回购买 prod_id 为 BR01 的产品的所有顾客的电子邮件(二)
有表 `OrderItems` 代表订单商品信息表,`prod_id` 为产品 id`Orders` 表代表订单表有 `cust_id` 代表顾客 id 和订单日期 `order_date``Customers` 表含有 `cust_email` 顾客邮件和 cust_id 顾客 id
`OrderItems` 表:
| prod_id | order_num |
| ------- | --------- |
| BR01 | a0001 |
| BR01 | a0002 |
| BR02 | a0003 |
| BR02 | a0013 |
`Orders` 表:
| order_num | cust_id | order_date |
| --------- | ------- | ------------------- |
| a0001 | cust10 | 2022-01-01 00:00:00 |
| a0002 | cust1 | 2022-01-01 00:01:00 |
| a0003 | cust1 | 2022-01-02 00:00:00 |
| a0013 | cust2 | 2022-01-01 00:20:00 |
`Customers` 表代表顾客信息,`cust_id` 为顾客 id`cust_email` 为顾客 email
2023-12-30 17:14:13 +08:00
| cust_id | cust_email |
| ------- | ----------------- |
| cust10 | <cust10@cust.com> |
| cust1 | <cust1@cust.com> |
| cust2 | <cust2@cust.com> |
【问题】返回购买 `prod_id` 为 BR01 的产品的所有顾客的电子邮件(`Customers` 表中的 `cust_email`),结果无需排序。
提示:涉及到 `SELECT` 语句,最内层的从 `OrderItems` 表返回 `order_num`,中间的从 `Customers` 表返回 `cust_id`,但是必须使用 INNER JOIN 语法。
```sql
SELECT cust_email
FROM Customers
INNER JOIN Orders using(cust_id)
INNER JOIN OrderItems using(order_num)
WHERE OrderItems.prod_id = 'BR01'
```
### 确定最佳顾客的另一种方式(二)
`OrderItems` 表代表订单信息,确定最佳顾客的另一种方式是看他们花了多少钱,`OrderItems` 表有订单号 `order_num``item_price` 商品售出价格、`quantity` 商品数量
| order_num | item_price | quantity |
| --------- | ---------- | -------- |
| a1 | 10 | 105 |
| a2 | 1 | 1100 |
| a2 | 1 | 200 |
| a4 | 2 | 1121 |
| a5 | 5 | 10 |
| a2 | 1 | 19 |
| a7 | 7 | 5 |
`Orders` 表含有字段 `order_num` 订单号、`cust_id` 顾客 id
| order_num | cust_id |
| --------- | -------- |
| a1 | cust10 |
| a2 | cust1 |
| a3 | cust2 |
| a4 | cust22 |
| a5 | cust221 |
| a7 | cust2217 |
顾客表 `Customers` 有字段 `cust_id` 客户 id、`cust_name` 客户姓名
| cust_id | cust_name |
| -------- | --------- |
| cust10 | andy |
| cust1 | ben |
| cust2 | tony |
| cust22 | tom |
| cust221 | an |
| cust2217 | hex |
【问题】编写 SQL 语句,返回订单总价不小于 1000 的客户名称和总额(`OrderItems` 表中的 `order_num`)。
提示:需要计算总和(`item_price` 乘以 `quantity`)。按总额对结果进行排序,请使用 `INNER JOIN`语法。
```sql
SELECT cust_name, SUM(item_price * quantity) AS total_price
FROM Customers
INNER JOIN Orders USING(cust_id)
INNER JOIN OrderItems USING(order_num)
GROUP BY cust_name
HAVING total_price >= 1000
ORDER BY total_price
```
## 创建高级连接
### 检索每个顾客的名称和所有的订单号(一)
`Customers` 表代表顾客信息含有顾客 id `cust_id` 和 顾客名称 `cust_name`
| cust_id | cust_name |
| -------- | --------- |
| cust10 | andy |
| cust1 | ben |
| cust2 | tony |
| cust22 | tom |
| cust221 | an |
| cust2217 | hex |
`Orders` 表代表订单信息含有订单号 `order_num` 和顾客 id `cust_id`
| order_num | cust_id |
| --------- | -------- |
| a1 | cust10 |
| a2 | cust1 |
| a3 | cust2 |
| a4 | cust22 |
| a5 | cust221 |
| a7 | cust2217 |
【问题】使用 INNER JOIN 编写 SQL 语句,检索每个顾客的名称(`Customers` 表中的 `cust_name`)和所有的订单号(`Orders` 表中的 `order_num`),最后根据顾客姓名 `cust_name` 升序返回。
```sql
SELECT cust_name, order_num
FROM Customers
INNER JOIN Orders
USING(cust_id)
ORDER BY cust_name
```
### 检索每个顾客的名称和所有的订单号(二)
`Orders` 表代表订单信息含有订单号 `order_num` 和顾客 id `cust_id`
| order_num | cust_id |
| --------- | -------- |
| a1 | cust10 |
| a2 | cust1 |
| a3 | cust2 |
| a4 | cust22 |
| a5 | cust221 |
| a7 | cust2217 |
`Customers` 表代表顾客信息含有顾客 id `cust_id` 和 顾客名称 `cust_name`
| cust_id | cust_name |
| -------- | --------- |
| cust10 | andy |
| cust1 | ben |
| cust2 | tony |
| cust22 | tom |
| cust221 | an |
| cust2217 | hex |
| cust40 | ace |
【问题】检索每个顾客的名称(`Customers` 表中的 `cust_name`和所有的订单号Orders 表中的 `order_num`),列出所有的顾客,即使他们没有下过订单。最后根据顾客姓名 `cust_name` 升序返回。
```sql
SELECT cust_name, order_num
FROM Customers
LEFT JOIN Orders
USING(cust_id)
ORDER BY cust_name
```
### 返回产品名称和与之相关的订单号
`Products` 表为产品信息表含有字段 `prod_id` 产品 id、`prod_name` 产品名称
| prod_id | prod_name |
| ------- | --------- |
| a0001 | egg |
| a0002 | sockets |
| a0013 | coffee |
| a0003 | cola |
| a0023 | soda |
`OrderItems` 表为订单信息表含有字段 `order_num` 订单号和产品 id `prod_id`
| prod_id | order_num |
| ------- | --------- |
| a0001 | a105 |
| a0002 | a1100 |
| a0002 | a200 |
| a0013 | a1121 |
| a0003 | a10 |
| a0003 | a19 |
| a0003 | a5 |
【问题】使用外连接left join、 right join、full join联结 `Products` 表和 `OrderItems` 表,返回产品名称(`prod_name`)和与之相关的订单号(`order_num`)的列表,并按照产品名称升序排序。
```sql
SELECT prod_name, order_num
FROM Products
LEFT JOIN OrderItems
USING(prod_id)
ORDER BY prod_name
```
### 返回产品名称和每一项产品的总订单数
`Products` 表为产品信息表含有字段 `prod_id` 产品 id、`prod_name` 产品名称
| prod_id | prod_name |
| ------- | --------- |
| a0001 | egg |
| a0002 | sockets |
| a0013 | coffee |
| a0003 | cola |
| a0023 | soda |
`OrderItems` 表为订单信息表含有字段 `order_num` 订单号和产品 id `prod_id`
| prod_id | order_num |
| ------- | --------- |
| a0001 | a105 |
| a0002 | a1100 |
| a0002 | a200 |
| a0013 | a1121 |
| a0003 | a10 |
| a0003 | a19 |
| a0003 | a5 |
【问题】
使用 OUTER JOIN 联结 `Products` 表和 `OrderItems` 表,返回产品名称(`prod_name`)和每一项产品的总订单数(不是订单号),并按产品名称升序排序。
```sql
SELECT prod_name, COUNT(order_num) AS orders
FROM Products
LEFT JOIN OrderItems
USING(prod_id)
GROUP BY prod_name
ORDER BY prod_name
```
### 列出供应商及其可供产品的数量
`Vendors` 表含有 `vend_id` (供应商 id
| vend_id |
| ------- |
| a0002 |
| a0013 |
| a0003 |
| a0010 |
`Products` 表含有 `vend_id`(供应商 id和 prod_id供应产品 id
| vend_id | prod_id |
| ------- | -------------------- |
| a0001 | egg |
| a0002 | prod_id_iphone |
| a00113 | prod_id_tea |
| a0003 | prod_id_vivo phone |
| a0010 | prod_id_huawei phone |
【问题】列出供应商(`Vendors` 表中的 `vend_id`)及其可供产品的数量,包括没有产品的供应商。你需要使用 OUTER JOIN 和 COUNT()聚合函数来计算 `Products` 表中每种产品的数量,最后根据 vend_id 升序排序。
注意:`vend_id` 列会显示在多个表中,因此在每次引用它时都需要完全限定它。
```sql
SELECT vend_id, COUNT(prod_id) AS prod_id
FROM Vendors
LEFT JOIN Products
USING(vend_id)
GROUP BY vend_id
ORDER BY vend_id
```
## 组合查询
`UNION` 运算符将两个或更多查询的结果组合起来,并生成一个结果集,其中包含来自 `UNION` 中参与查询的提取行。
`UNION` 基本规则:
- 所有查询的列数和列顺序必须相同。
- 每个查询中涉及表的列的数据类型必须相同或兼容。
- 通常返回的列名取自第一个查询。
默认地,`UNION` 操作符选取不同的值。如果允许重复的值,请使用 `UNION ALL`
```sql
SELECT column_name(s) FROM table1
UNION ALL
SELECT column_name(s) FROM table2;
```
`UNION` 结果集中的列名总是等于 `UNION` 中第一个 `SELECT` 语句中的列名。
`JOIN` vs `UNION`
- `JOIN` 中连接表的列可能不同,但在 `UNION` 中,所有查询的列数和列顺序必须相同。
- `UNION` 将查询之后的行放在一起(垂直放置),但 `JOIN` 将查询之后的列放在一起(水平放置),即它构成一个笛卡尔积。
### 将两个 SELECT 语句结合起来(一)
`OrderItems` 包含订单产品信息,字段 `prod_id` 代表产品 id、`quantity` 代表产品数量
| prod_id | quantity |
| ------- | -------- |
| a0001 | 105 |
| a0002 | 100 |
| a0002 | 200 |
| a0013 | 1121 |
| a0003 | 10 |
| a0003 | 19 |
| a0003 | 5 |
| BNBG | 10002 |
【问题】将两个 `SELECT` 语句结合起来,以便从 `OrderItems` 表中检索产品 id`prod_id`)和 `quantity`。其中,一个 `SELECT` 语句过滤数量为 100 的行,另一个 `SELECT` 语句过滤 id 以 BNBG 开头的产品,最后按产品 id 对结果进行升序排序。
```sql
SELECT prod_id, quantity
FROM OrderItems
WHERE quantity = 100
UNION
SELECT prod_id, quantity
FROM OrderItems
WHERE prod_id LIKE 'BNBG%'
```
### 将两个 SELECT 语句结合起来(二)
`OrderItems` 包含订单产品信息,字段 `prod_id` 代表产品 id、`quantity` 代表产品数量。
| prod_id | quantity |
| ------- | -------- |
| a0001 | 105 |
| a0002 | 100 |
| a0002 | 200 |
| a0013 | 1121 |
| a0003 | 10 |
| a0003 | 19 |
| a0003 | 5 |
| BNBG | 10002 |
【问题】将两个 `SELECT` 语句结合起来,以便从 `OrderItems` 表中检索产品 id`prod_id`)和 `quantity`。其中,一个 `SELECT` 语句过滤数量为 100 的行,另一个 `SELECT` 语句过滤 id 以 BNBG 开头的产品,最后按产品 id 对结果进行升序排序。 注意:**这次仅使用单个 SELECT 语句。**
答案:
要求只用一条 select 语句,那就用 `or` 不用 `union` 了。
```sql
SELECT prod_id, quantity
FROM OrderItems
WHERE quantity = 100 OR prod_id LIKE 'BNBG%'
```
### 组合 Products 表中的产品名称和 Customers 表中的顾客名称
`Products` 表含有字段 `prod_name` 代表产品名称
| prod_name |
| --------- |
| flower |
| rice |
| ring |
| umbrella |
Customers 表代表顾客信息cust_name 代表顾客名称
| cust_name |
| --------- |
| andy |
| ben |
| tony |
| tom |
| an |
| lee |
| hex |
【问题】编写 SQL 语句,组合 `Products` 表中的产品名称(`prod_name`)和 `Customers` 表中的顾客名称(`cust_name`)并返回,然后按产品名称对结果进行升序排序。
```sql
# UNION 结果集中的列名总是等于 UNION 中第一个 SELECT 语句中的列名。
SELECT prod_name
FROM Products
UNION
SELECT cust_name
FROM Customers
ORDER BY prod_name
```
### 检查 SQL 语句
`Customers` 含有字段 `cust_name` 顾客名、`cust_contact` 顾客联系方式、`cust_state` 顾客州、`cust_email` 顾客 `email`
2023-12-30 17:14:13 +08:00
| cust_name | cust_contact | cust_state | cust_email |
| --------- | ------------ | ---------- | ----------------- |
| cust10 | 8695192 | MI | <cust10@cust.com> |
| cust1 | 8695193 | MI | <cust1@cust.com> |
| cust2 | 8695194 | IL | <cust2@cust.com> |
【问题】修正下面错误的 SQL
```sql
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'MI'
ORDER BY cust_name;
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'IL'ORDER BY cust_name;
```
修正后:
```sql
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'MI'
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'IL'
ORDER BY cust_name;
```
使用 `union` 组合查询时,只能使用一条 `order by` 字句,他必须位于最后一条 `select` 语句之后
或者直接用 `or` 来做:
```sql
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'MI' or cust_state = 'IL'
ORDER BY cust_name;
```
2023-10-27 06:44:02 +08:00
<!-- @include: @article-footer.snippet.md -->