JavaGuide/docs/database/mysql/some-thoughts-on-database-s...

171 lines
7.6 KiB
Markdown
Raw Permalink Normal View History

---
title: MySQL日期类型选择建议
category: 数据库
tag:
- MySQL
---
我们平时开发中不可避免的就是要存储时间,比如我们要记录操作表中这条记录的时间、记录转账的交易时间、记录出发时间、用户下单时间等等。你会发现时间这个东西与我们开发的联系还是非常紧密的,用的好与不好会给我们的业务甚至功能带来很大的影响。所以,我们有必要重新出发,好好认识一下这个东西。
## 不要用字符串存储日期
和绝大部分对数据库不太了解的新手一样,我在大学的时候就这样干过,甚至认为这样是一个不错的表示日期的方法。毕竟简单直白,容易上手。
但是,这是不正确的做法,主要会有下面两个问题:
1. 字符串占用的空间更大!
2021-06-18 17:18:13 +08:00
2. 字符串存储的日期效率比较低(逐个字符进行比对),无法用日期相关的 API 进行计算和比较。
## Datetime 和 Timestamp 之间的抉择
Datetime 和 Timestamp 是 MySQL 提供的两种比较相似的保存时间的数据类型,可以精确到秒。他们两者究竟该如何选择呢?
下面我们来简单对比一下二者。
### 时区信息
**DateTime 类型是没有时区信息的(时区无关)** DateTime 类型保存的时间都是当前会话所设置的时区对应的时间。这样就会有什么问题呢?当你的时区更换之后,比如你的服务器更换地址或者更换客户端连接时区设置的话,就会导致你从数据库中读出的时间错误。
**Timestamp 和时区有关**。Timestamp 类型字段的值会随着服务器时区的变化而变化,自动换算成相应的时间,说简单点就是在不同时区,查询到同一个条记录此字段的值会不一样。
下面实际演示一下!
建表 SQL 语句:
```sql
CREATE TABLE `time_zone_test` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`date_time` datetime DEFAULT NULL,
`time_stamp` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
```
插入数据:
```sql
INSERT INTO time_zone_test(date_time,time_stamp) VALUES(NOW(),NOW());
```
查看数据:
```sql
select date_time,time_stamp from time_zone_test;
```
结果:
2023-10-10 14:43:53 +08:00
```plain
+---------------------+---------------------+
| date_time | time_stamp |
+---------------------+---------------------+
| 2020-01-11 09:53:32 | 2020-01-11 09:53:32 |
+---------------------+---------------------+
```
现在我们运行
修改当前会话的时区:
```sql
set time_zone='+8:00';
```
再次查看数据:
2023-10-10 14:43:53 +08:00
```plain
+---------------------+---------------------+
| date_time | time_stamp |
+---------------------+---------------------+
| 2020-01-11 09:53:32 | 2020-01-11 17:53:32 |
+---------------------+---------------------+
```
**扩展:一些关于 MySQL 时区设置的一个常用 sql 命令**
```sql
# 查看当前会话时区
SELECT @@session.time_zone;
# 设置当前会话时区
SET time_zone = 'Europe/Helsinki';
SET time_zone = "+00:00";
# 数据库全局时区设置
SELECT @@global.time_zone;
# 设置全局时区
SET GLOBAL time_zone = '+8:00';
SET GLOBAL time_zone = 'Europe/Helsinki';
```
### 占用空间
下图是 MySQL 日期类型所占的存储空间(官方文档传送门:<https://dev.mysql.com/doc/refman/8.0/en/storage-requirements.html>
![](https://oss.javaguide.cn/github/javaguide/FhRGUVHFK0ujRPNA75f6CuOXQHTE.jpeg)
在 MySQL 5.6.4 之前DateTime 和 Timestamp 的存储空间是固定的,分别为 8 字节和 4 字节。但是从 MySQL 5.6.4 开始它们的存储空间会根据毫秒精度的不同而变化DateTime 的范围是 5~8 字节Timestamp 的范围是 4~7 字节。
### 表示范围
Timestamp 表示的时间范围更小,只能到 2038 年:
- DateTime1000-01-01 00:00:00.000000 ~ 9999-12-31 23:59:59.499999
- Timestamp1970-01-01 00:00:01.000000 ~ 2038-01-19 03:14:07.499999
### 性能
由于 TIMESTAMP 需要根据时区进行转换,所以从毫秒数转换到 TIMESTAMP 时,不仅要调用一个简单的函数,还要调用操作系统底层的系统函数。这个系统函数为了保证操作系统时区的一致性,需要进行加锁操作,这就降低了效率。
DATETIME 不涉及时区转换,所以不会有这个问题。
为了避免 TIMESTAMP 的时区转换问题,建议使用指定的时区,而不是依赖于操作系统时区。
## 数值时间戳是更好的选择吗?
很多时候,我们也会使用 int 或者 bigint 类型的数值也就是数值时间戳来表示时间。
这种存储方式的具有 Timestamp 类型的所具有一些优点,并且使用它的进行日期排序以及对比等操作的效率会更高,跨系统也很方便,毕竟只是存放的数值。缺点也很明显,就是数据的可读性太差了,你无法直观的看到具体时间。
时间戳的定义如下:
> 时间戳的定义是从一个基准时间开始算起这个基准时间是「1970-1-1 00:00:00 +0:00」从这个时间开始用整数表示以秒计时随着时间的流逝这个时间整数不断增加。这样一来我只需要一个数值就可以完美地表示时间了而且这个数值是一个绝对数值即无论的身处地球的任何角落这个表示时间的时间戳都是一样的生成的数值都是一样的并且没有时区的概念所以在系统的中时间的传输中都不需要进行额外的转换了只有在显示给用户的时候才转换为字符串格式的本地时间。
数据库中实际操作:
```sql
mysql> select UNIX_TIMESTAMP('2020-01-11 09:53:32');
+---------------------------------------+
| UNIX_TIMESTAMP('2020-01-11 09:53:32') |
+---------------------------------------+
| 1578707612 |
+---------------------------------------+
1 row in set (0.00 sec)
mysql> select FROM_UNIXTIME(1578707612);
+---------------------------+
| FROM_UNIXTIME(1578707612) |
+---------------------------+
| 2020-01-11 09:53:32 |
+---------------------------+
1 row in set (0.01 sec)
```
## 总结
MySQL 中时间到底怎么存储才好Datetime?Timestamp?还是数值时间戳?
并没有一个银弹,很多程序员会觉得数值型时间戳是真的好,效率又高还各种兼容,但是很多人又觉得它表现的不够直观。
《高性能 MySQL 》这本神书的作者就是推荐 Timestamp原因是数值表示时间不够直观。下面是原文
2023-03-10 18:40:00 +08:00
<img src="https://oss.javaguide.cn/github/javaguide/%E9%AB%98%E6%80%A7%E8%83%BDmysql-%E4%B8%8D%E6%8E%A8%E8%8D%90%E7%94%A8%E6%95%B0%E5%80%BC%E6%97%B6%E9%97%B4%E6%88%B3.jpg" style="zoom:50%;" />
每种方式都有各自的优势,根据实际场景选择最合适的才是王道。下面再对这三种方式做一个简单的对比,以供大家实际开发中选择正确的存放时间的数据类型:
| 类型 | 存储空间 | 日期格式 | 日期范围 | 是否带时区信息 |
| ------------ | -------- | ------------------------------ | ------------------------------------------------------------ | -------------- |
2023-10-27 06:44:02 +08:00
| DATETIME | 5~8 字节 | YYYY-MM-DD hh:mm:ss[.fraction] | 1000-01-01 00:00:00[.000000] 9999-12-31 23:59:59[.999999] | 否 |
| TIMESTAMP | 4~7 字节 | YYYY-MM-DD hh:mm:ss[.fraction] | 1970-01-01 00:00:01[.000000] 2038-01-19 03:14:07[.999999] | 是 |
| 数值型时间戳 | 4 字节 | 全数字如 1578707612 | 1970-01-01 00:00:01 之后的时间 | 否 |
2023-10-27 06:44:02 +08:00
<!-- @include: @article-footer.snippet.md -->