pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多。
#导包 import pandas as pdfrom pandas import DataFrame,Seriesimport numpy as np
一 文件操作
1.1 读取文件
- 文件数据
- 读取代码
df = pd.read_csv('./data-07/type-.txt',sep='-',header=None)# sep:分隔符# header:None首行不作为列索引
- 效果展示
1.2 写入文件
#写入excel文件 :df.to_excel('name.xlsx')pd.excel('./eee.xls')
二 数据库mysql 操作(pymysql)
2.1 读取数据库
(1)更新pymysql
在cmd中利用conda命令输入:conda update 库名,例如conda update pymysql,并回车,如下图所示
推荐文章:
库更新及jupyter-notebook默认目录更改方法:
(2) 导包
import pandas as pdimport pymysqlimport sysfrom sqlalchemy import create_engine
(3) 创建conn管道
#连接数据库,获取连接对象conn = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')
(4) 展示数据库中的数据
sql='select *from student;' #书写mysql语句#读取库表中的数据值df=pd.read_sql(sql,conn)df
conn创建参数详解
import pandas as pdfrom sqlalchemy import create_engine ##将数据写入mysql的数据库,但需要先通过sqlalchemy.create_engine建立连接,且字符编码设置为utf8,否则有些latin字符不能处理conn = create_engine('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')pd.io.sql.to_sql(thedataframe,'tablename', conn, schema='databasename', if_exists='append')
参数解释:第一个参数thedataframe是需要导入的pd dataframe,第二个参数tablename是将导入的数据库中的表名第三个参数conn是启动数据库的接口,pd 1.9以后的版本,除了sqllite,均需要通过sqlalchemy来设置第四个参数databasename是将导入的数据库名字第五个参数if_exists='append'的意思是,如果表tablename存在,则将数据添加到这个表的后面sqlalchemy.create_engine是数据库引擎('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')的解释mysql是要用的数据库mysqldb是需要用的接口程序root是数据库账户password是数据库密码localhost是数据库所在服务器的地址,这里是本机3306是mysql占用的端口elonuse是数据库的名字charset=utf8是设置数据库的编码方式,这样可以防止latin字符不识别而报错
2.2 DadaFrame数据写入数据库
yconnect = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')#将一个df中的数据值写入存储到df=DataFrame(data=np.random.randint(0,100,size=(2,3)))dfdf.to_sql('text',con=yconnect,if_exists='replace')