一、背景
我是在anaconda notebook中进行连接实验的,环境python3.6,当然也可以在python shell里面进行操作。
最常用也最稳定的用于连接mysql数据库的python库是pymysql。
二、基本操作
1、安装pymysql库
最简单的方式:
在命令行输入 pip install pymysql
或者:
下载whl文件[1]进行安装,安装过程自行百度。
2、安装mysql数据库
mysql数据库有两种:
mysql和mariadb
我用的是mariadb,它是mysql的一个分支。
两者在绝大部分性能上是兼容的,使用起来感觉不到啥区别。
给出下载地址:mysql[2],mariadb[3],安装过程很简单,一路next step,不过要记好密码。
有个小插曲,mysql和mariadb相当于姐姐妹妹的关系,两者由同一个人(widenius)创建的。
mysql被oracle收购后,widenius先生觉得不爽,于是搞了个mariadb,可以完全替代mysql。
大牛就是任性。
3、sql基本语法
下面要用sql的表创建、查询、数据插入等功能,这里简要介绍一下sql语言的基本语句。
-
查看数据库:
show databases;
-
创建数据库:
create datebase 数据库名称;
-
使用数据库:
use 数据库名称;
-
查看数据表:
show tables;
-
创建数据表:
create table 表名称(列名1 (数据类型1),列名2 (数据类型2));
-
插入数据:
insert into 表名称(列名1,列名2) values(数据1,数据2);
-
查看数据:
select * from 表名称;
-
更新数据:
update 表名称 set 列名1=新数据1,列名2=新数据2 where 某列=某数据;
4、连接数据库
安装好必要得文件和库后,接下来正式开始连接数据库吧,虽然神秘却不难哦!
#首先导入pymysql库 import pymysql #连接数据库,创建连接对象connection #连接对象作用是:连接数据库、发送数据库信息、处理回滚操作(查询中断时,数据库回到最初状态)、创建新的光标对象 connection = pymysql.connect(host = 'localhost' #host属性 user = 'root' #用户名 password = '******' #此处填登录数据库的密码 db = 'mysql' #数据库名 )
执行这段代码就连接好了!
5、增删改查操作
首先来查看一下有哪些数据库:
#创建光标对象,一个连接可以有很多光标,一个光标跟踪一种数据状态。 #光标对象作用是:、创建、删除、写入、查询等等 cur = connection.cursor() #查看有哪些数据库,通过cur.fetchall()获取查询所有结果 print(cur.fetchall())
打印出所有数据库:
(('information_schema',), ('law',), ('mysql',), ('performance_schema',), ('test',))
在test数据库里创建表:
#使用数据库test cur.execute('use test') #在test数据库里创建表student,有name列和age列 cur.execute('create table student(name varchar(20),age tinyint(3))')
向数据表student中插入一条数据:
sql = 'insert into student (name,age) values (%s,%s)' cur.execute(sql,('xiaoming',23))
查看数据表student内容:
cur.execute('select * from student') print(cur.fetchone())
打印输出为:('xiaoming', 23)
bingo!是我们刚刚插入的一条数据
最后,要记得关闭光标和连接:
#关闭连接对象,否则会导致连接泄漏,消耗数据库资源 connection.close() #关闭光标 cur.close()
ok了,整个流程大致如此。
当然这里都是很基础的操作,更多的使用方法需要在pymysql官方文档[4]里去寻找。
三、导入大数据文件
以csv文件为例,csv文件导入数据库一般有两种方法:
1、通过sql的insert方法一条一条导入,适合数据量小的csv文件,这里不做赘述。
2、通过load data方法导入,速度快,适合大数据文件,也是本文的重点。
样本csv文件如下:
总体工作分为3步:
1、用python连接mysql数据库;
2、基于csv文件表格字段创建表;
3、使用load data方法导入csv文件内容。
sql的load data语法简介:
load data local infile 'csv_file_path' into table table_name fields terminated by ',' lines terminated by '\\r\\n' ignore 1 lines
csv_file_path
指文件绝对路径table_name
指表名称fields terminated by ','
指以逗号分隔lines terminated by '\\r\\n'
指换行ignore 1 lines
指跳过第一行,因为第一行是表的字段名
下面给出全部代码:
#导入pymysql方法 import pymysql #连接数据库 config = {:'', :3306, :'username', :'password', :'utf8mb4', :1 } conn = pymysql.connect(**config) cur = conn.cursor() #load_csv函数,参数分别为csv文件路径,表名称,数据库名称 def load_csv(csv_file_path,table_name,database='evdata'): #打开csv文件 file = open(csv_file_path, 'r',encoding='utf-8') #读取csv文件第一行字段名,创建表 reader = file.readline() b = reader.split(',') colum = '' for a in b: colum = colum a ' varchar(255),' colum = colum[:-1] #编写sql,create_sql负责创建表,data_sql负责导入数据 create_sql = 'create table if not exists ' table_name ' ' '(' colum ')' ' default charset=utf8' data_sql = "load data local infile '%s' into table %s fields terminated by ',' lines terminated by '\\r\\n' ignore 1 lines" % (csv_filename,table_name) #使用数据库 cur.execute('use %s' % database) #设置编码格式 cur.execute('set names utf8;') cur.execute('set character_set_connection=utf8;') #执行create_sql,创建表 cur.execute(create_sql) #执行data_sql,导入数据 cur.execute(data_sql) conn.commit() #关闭连接 conn.close() cur.close()
以上就是如何使用python玩转mysql数据库的详细内容。