mysql插入数据变慢的原因-kb88凯时官网登录

时间：2020-11-01

阅读：

最近的项目需要导入大量的数据，插入的过程中还需要边查询边插入。插入的数据量在100w左右。一开始觉得100w的数据量不大，于是就插啊插，吃了个饭，回来一看，在插入了50多w条数据后，每秒就只能插10条了。。觉得很奇怪，为啥越插越慢呢？于是就开始分析插入的时间损耗，想到了如下的kb88凯时官网登录的解决方案：（mysql使用的innodb引擎）

1.分析是否是由主码，外码，索引造成的插入效率降低

主码：由于主码是每张表必须有的，不能删除。而mysql会对主码自动建立一个索引，这个索引默认是btree索引，因此每次插入数据要额外的对btree进行一次插入。这个额外的插入时间复杂度约为log(n)。这个索引无法删除，因此无法优化。但是每次插入的时候，由于主码约束需要检查主码是否出现，这又需要log(n)，能否减少这个开销呢？答案是肯定的。我们可以设置主码为自增id auto_increment ,这样数据库里会自动记录当前的自增值，保证不会插入重复的主码，也就避免了主码的重复性检查。

外码：由于我的项目的插入表中存在外码，因此每次插入时需要在另一张表检测外码存在性。这个约束是与业务逻辑相关的，不能随便删除。并且这个时间开销应当是与另一张表大小成正比的常数，不应当越插入越慢才对。所以排除。

索引：为了减少btree插入的时间损耗，我们可以在建表时先不建索引，先将所有的数据插入。之后我们再向表里添加索引。该方法确实也降低了时间的开销。

经过以上的折腾，再进行测试，发现速度快了一点，但是到了50w条后又开始慢了。看来问题的关键不在这里。于是继续查资料，又发现了个关键问题：

2.将单条插入改为批量插入（参考：点击打开链接）

由于java中的executeupdate(sql)方法只是执行一条sql操作，就需要调用sql里的各种资源，如果使用for循环不停的执行这个方法来插入，无疑是开销很大的。因此，在mysql提供了一种kb88凯时官网登录的解决方案：批量插入。也就是每次的一条sql不直接提交，而是先存在批任务集中，当任务集的大小到了指定阈值后，再将这些sql一起发送至mysql端。在100w的数据规模中，我将阈值设置为10000，即一次提交10000条sql。最后的结果挺好，插入的速度比之前快了20倍左右。批量插入代码如下：

public static void insertrelease() {  
        long begin = new date().gettime();  
        string sql = "insert into tb_big_data (count, create_time, random) values (?, sysdate(), ?)";  
        try {  
            conn.setautocommit(false);  
            preparedstatement pst = conn.preparestatement(sql);  
            for (int i = 1; i <= 100; i  ) {  
                for (int k = 1; k <= 10000; k  ) {  
                    pst.setlong(1, k * i);  
                    pst.setlong(2, k * i);  
                    pst.addbatch();  
                }  
                pst.executebatch();  
                conn.commit();  
            }  
            pst.close();  
            conn.close();  
        } catch (sqlexception e) {  
            e.printstacktrace();  
        }  
        long end = new date().gettime();  
        system.out.println("cast : "   (end - begin) / 1000   " ms");  
    }

3.一条update语句的values后面跟上多条的(?,?,?,?)

这个方法一开始我觉得和上面的差不多，但是在看了别人做的实验后，发现利用这个方法改进上面的批量插入，速度能快5倍。后来发现，mysql的导出sql文件中，那些插入语句也是这样写的。。即update table_name (a1,a2) values (xx,xx),(xx,xx),(xx,xx)... 。也就是我们需要在后台自己进行一个字符串的拼接，注意由于字符串只是不停的往末尾插入，用stringbuffer能够更快的插入。下面是代码：

public static void insert() {  
        // 开时时间  
        long begin = new date().gettime();  
        // sql前缀  
        string prefix = "insert into tb_big_data (count, create_time, random) values ";  
        try {  
            // 保存sql后缀  
            stringbuffer suffix = new stringbuffer();  
            // 设置事务为非自动提交  
            conn.setautocommit(false);  
            // statement st = conn.createstatement();  
            // 比起st，pst会更好些  
            preparedstatement pst = conn.preparestatement("");  
            // 外层循环，总提交事务次数  
            for (int i = 1; i <= 100; i  ) {  
                // 第次提交步长  
                for (int j = 1; j <= 10000; j  ) {  
                    // 构建sql后缀  
                    suffix.append("("   j * i   ", sysdate(), "   i * j  
                            * math.random()   "),");  
                }  
                // 构建完整sql  
                string sql = prefix   suffix.substring(0, suffix.length() - 1);  
                // 添加执行sql  
                pst.addbatch(sql);  
                // 执行操作  
                pst.executebatch();  
                // 提交事务  
                conn.commit();  
                // 清空上一次添加的数据  
                suffix = new stringbuffer();  
            }  
            // 头等连接  
            pst.close();  
            conn.close();  
        } catch (sqlexception e) {  
            e.printstacktrace();  
        }  
        // 结束时间  
        long end = new date().gettime();  
        // 耗时  
        system.out.println("cast : "   (end - begin) / 1000   " ms");  
    }

做了以上的优化后，我发现了一个很蛋疼的问题。虽然一开始的插入速度的确快了几十倍，但是插入了50w条数据后，插入速度总是会一下突然变的非常慢。这种插入变慢是断崖式的突变，于是我冥思苦想，无意中打开了系统的资源管理器，一看发现：java占用的内存在不断飙升。突然脑海中想到：是不是内存溢出了？

4.及时释放查询结果

在我的数据库查询语句中，使用到了pres=con.preparestatement(sql)来保存一个sql执行状态，使用了resultset=pres.executequery来保存查询结果集。而在边查边插的过程中，我的代码一直没有把查询的结果给释放，导致其不断的占用内存空间。当我的插入执行到50w条左右时，我的内存空间占满了，于是数据库的插入开始不以内存而以磁盘为介质了，因此插入的速度就开始变得十分的低下。因此，我在每次使用完pres和resultset后，加入了释放其空间的语句：resultset.close(); pres.close(); 。重新进行测试，果然，内存不飙升了，插入数据到50w后速度也不降低了。原来问题的本质在这里！

mysql

安装mysql报错[note] rsa private key file not found: /db/mysql5.6/data//private_key.pem. some authentication plugins will not work.[note] rsa public key file not

2023-05-28 10:38:29

　mysql 浮点型数据类型　　浮点型声明:float(m,d) double(m,d)　　decimal(m,d) m:总位数 d:小数位数　mysql>create table stu(　　num1 float(5,2),　　num2 double(6,1)

2023-05-28 10:37:41

一、背景我是在anaconda notebook中进行连接实验的，环境python3.6，当然也可以在python shell里面进行操作。最常用也最稳定的用于连接mysql数据库的python库是pymysql。二、基

2023-05-26 15:19:21

redis三种集群方式：主从复制，哨兵模式，cluster集群。主从复制基本原理当新建立一个从服务器时，从服务器将向主服务器发送sync命令，接收到sync命令后的主服务器会进行一次bgsave命

2023-05-26 15:19:06

mysql存储函数（自定义函数），函数一般用于计算和返回一个值，可以将经常需要使用的计算或功能写成一个函数。存储函数和存储过程一样，都是在数据库中定义一些 sql 语句的集合。存储

2023-05-26 15:18:53

mysql常用函数一、数字函数附加：ceil(x) 如ceil(1.23) 值为2 可以写成ceiling(x)二、字符串函数划线就是常用的(取字节数)附加：char_length字符（查询名字后三位数的）如：char_le

2023-05-26 15:18:38

hour(time)select hour(‘11:22:33') select hour(‘2016-01-16 11:22:33')-> 11-> 11返回该date或者time的hour值，值范围（0-23）

2023-05-26 15:18:27

为什么redis要设置密码？内网环境可以不设置密码，但是个人服务器，以及线上公网服务器就有必要设置密码了。昨天我检查了一下minio在redis中的事件通知，当我查看redis的key时，发现

2023-05-26 15:18:09

一、基本概念（查询语句）①基本语句1、“select * from 表名;”，—可查询表中全部数据；
2、“select 字段名 from 表名;”，—可查询表中指定字段的

2023-05-26 15:17:48

本文redis试验代码基于如下环境：操作系统：mac os 64位版本：redis 5.0.7 64 bit运行模式：standalone moderedis位操作reids位操作也叫位数组操作、bitmap，它提供了setbit、getbit

2023-05-26 15:17:33

1.概述在应用系统开发过程中，由于初期数据量小，开发人员写sql语句时更重视功能上的实现，但是当应用系统正式上线后，随着生产数据量的急剧增长，很多sql语句开始逐渐显露出性能问题

2023-05-26 15:17:18

1、配置主数据库主master : 192.168.1.132从slave : 192.168.1.1331)授权给从数据库grant replication slave on *.* to 'repl'@'192.168.1.132' identifie

2023-05-26 15:17:02

一、功能概览键空间通知使得客户端可以通过订阅频道或模式，来接收那些以某种方式改动了 redis key变化的事件。所有修改key键的命令。所有接收到 lpush key value [value &

2023-05-26 15:16:46

1 问题描述docker启动mysql容器后，创建一个localhost访问的用户：create user test@localhost identified by 'test';但是在宿主机中无法通过该用户登录：mycli -u test2

2023-05-26 15:16:31

1、表锁表锁是指锁定时锁定整个表，下一个事务访问该表时，必须等到上一个事务解除锁定后再访问表特点为粒度大，锁定简单，容易冲突。2、行锁是指锁定时锁定的是表的某行或多行记录

2023-05-26 15:16:19

1.查看原先路径◼ 打开 mysql 8.0 command line client◼ 输入 show variables like '�tadir%'; （分号不能丢）2.停止mysql(1)方法1：◼ 以管理员身份运行命令提示符wi

2023-05-26 15:16:01

结论（具体测试数据请往下看）1、start—end总体保持着顺序就没问题2、按照顺序，即便start < -n或者end > n-1也能查询出数据3、特殊用法：通过stringredistemplate.opsforlis

2023-05-26 15:15:44

mysql连接数是指数据库最多能够同时接受的客户连接数。mysql连接数是一个必须要考虑到的组件，它可以在帮助数据库能够安全运行的同时，最大化数据库当前的性能；mysql连接数是一

2023-05-26 15:15:29

count 作用count(expression)：返回查询的记录总数，expression 参数是一个字段或者 * 号。测试mysql版本：5.7.29创建一张用户表，并插入一百万条数据，其中gender字段有五十万行是为

2023-05-26 15:15:13

一、手动搭建1. 准备节点centos7 安装 redis节点数量至少为 6 个才能保证组成完整高可用的集群(1) 目录结构cluster├── 9001│ ├── data│ │ ├── appendonl

2023-05-26 15:14:57

在使用此类之前，可以普及两点知识：php中使用静态的调用，不同于其他编程语言，它的静态调用为：类名::$静态属性类名::静态方法()而java、c#等编程语言都是通过：类名.静态属性类名.静

2023-05-26 15:14:42

一、创建一个maven项目二、导入坐标在pom.xml加入如下坐标，并且点击右上角刷新。 org.springframework

2023-05-26 15:14:26

说明1、mysql中的逻辑备份是将数据库中的数据备份为一个文本文件，备份的文件可以被查看和编辑。2、可以使用mysqldump工具来完成逻辑备份。如果没有指定数据库中的任何表，默认

2023-05-26 15:14:13

什么是redis内存碎片？操作系统的剩余空间总量足够，但申请一块n字节连续地址的空间时，剩余内存空间中没有大小为n字节的连续空间，那么这些剩余内存空间中，小于n字节的连续内存空间

2023-05-26 15:14:00

本文基于社区版redis 4.0.81、命令解析redis服务器接收到的命令请求首先存储在客户端对象的querybuf输入缓冲区，然后解析命令请求的各个参数，并存储在客户端对象的argv和argc

2023-05-26 15:13:42

引言mysql数据库读写分离，是提高服务质量的常用手段之一，而对于技术方案，有很多成熟开源框架或方案，例如：sharding-jdbc、spring中的abstractroutingdatasource、mysql-router等，

2023-05-26 15:13:25

一、mysql时间戳介绍mysql中的时间戳（timestamp）是一种数据类型，用于表示某个事件发生的精确时间。它经常被用来记录数据的创造时间和更新时间，以及其他与时间有关的操作。mysql

2023-05-26 15:13:13

1.下载redisdesktopmanager直接去d88尊龙官网手机app官网或者csdn上搜就行2.安装redisdesktopmanager傻瓜式安装，一直点next就行安装完成后就是这样3.建立远程连接开始连接之前需要以下准备工作

2023-05-26 15:12:55

前言特点：在双主配置中，两台mysql互为主从节点。节点a和节点b互为主节点。安装mysql步骤略过一、mysql配置文件（1）节点a配置# 设置server-id，两节点必须不一样server-id = 100 #

2023-05-26 15:12:39

一、连接mysql以java开发常用的intellij idea为例，ide开发工具中也可以使用mysql。1. 打开idea，右上角有数据库侧边栏，打开侧边栏点击加号->数据源，可以看到支持很多数据库，选择m

2023-05-26 15:12:15

mysql主从复制原理：为什么要做主从复制在业务复杂的系统中，有这么一个情景，有一句sql语句需要锁表，导致暂时不能使用读的服务，那么就很影响运行中的业务，使用主从复制，让主库负责

2020-11-01 16:09:28

mysql查看表权限设置的方法：1、在navicat的mysql数据库新建查询：select * from mysql.user （或者直接查看mysql中的user表）2、打开cmd进入mysql>,执行show grant for 你的用户（如

2020-11-01 11:44:11

mysql 5.7 增加了 json 数据类型的支持，在之前如果要存储 json 类型的数据的话我们只能自己做 json.stringify() 和 json.parse() 的操作，而且没办法针对 json 内的数据进行查

2020-11-01 11:34:01

首先理清要了解shell脚本的数组与字符串的一些特性：str=("hello" "world" "!") #结果: str: 3 #普通的字符串数组echo "str: " ${#str[@]}str1=("hello world !") #结果: str

2020-10-30 21:33:32

由于之前的业务，造成数据库上产生了脏数据，写个脚本删除重复的数据。由于是开发测试环境，所以选择任意删除相同uid中的一条。由于每次执行只删除重复数据的一条，需要重复执行，如

2020-10-30 21:20:43

linux下使用shell脚本，结合crontab，定时备份mysql下多个数据库，每次备份的数据存放于以日期命名的文件夹中，同时删除超过设定的备份保留时间的数据。以下例子设定备份保留时间为

2020-10-30 21:20:42

用shell脚本来给mysql加索引刚好用到， mark一下：#! /bin/bashtb_base=tb_student_arr=("0" "1" "2" "3" "4" "5" "6" "7" "8" "9" "a" "b" "c" "

2020-10-30 21:20:31

前言本教程基于 ubuntu 18.04（其他的 linux 理论上也是可以的，知识安装的软件包不一样）。用到的主要软件为：postfix,dovecot,mysql.废话不多说，下面是教程：前置条件
mysql 数据

2020-10-30 21:19:38

1.项目背景因监控需要，我们需要在既有的每个mysql实例上创建一个账号。公司有数百台 mysql 实例，如果手动登入来创建账号很麻烦，也不现实。所以，我们写了一个简单的shell脚本，用

2020-10-30 21:19:16

数据在任何一家公司里面都是最核心的资产，定期备份则是为了保证数据库出现问题的时候能够及时回滚到最近的备份点，将损失缩小到最小这篇文章将会两部分来说明：1、mysql的定期备

2020-10-30 21:18:43

2018-08-19

2020-03-22

2020-12-17

2020-03-22

2020-10-15

2020-03-22

2021-01-28

2021-01-21

2020-10-28

mysql插入数据变慢的原因-kb88凯时官网登录

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道