博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第四节 pandas 数据加载
阅读量:5129 次
发布时间:2019-06-13

本文共 1856 字,大约阅读时间需要 6 分钟。

  pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多。

#导包 import pandas as pdfrom pandas import DataFrame,Seriesimport numpy as np

一 文件操作

1.1  读取文件

  • 文件数据

  • 读取代码
df = pd.read_csv('./data-07/type-.txt',sep='-',header=None)# sep:分隔符# header:None首行不作为列索引
  • 效果展示

 

1.2 写入文件

#写入excel文件 :df.to_excel('name.xlsx')pd.excel('./eee.xls')

 

二 数据库mysql 操作(pymysql)

2.1 读取数据库

(1)更新pymysql 

在cmd中利用conda命令输入:conda update 库名,例如conda update pymysql,并回车,如下图所示

推荐文章:

库更新及jupyter-notebook默认目录更改方法:

(2) 导包

import pandas as pdimport pymysqlimport sysfrom sqlalchemy import create_engine

 

(3) 创建conn管道

#连接数据库,获取连接对象conn = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')

 

(4) 展示数据库中的数据

sql='select *from student;' #书写mysql语句#读取库表中的数据值df=pd.read_sql(sql,conn)df

 

 

conn创建参数详解

import pandas as pdfrom sqlalchemy import create_engine ##将数据写入mysql的数据库,但需要先通过sqlalchemy.create_engine建立连接,且字符编码设置为utf8,否则有些latin字符不能处理conn = create_engine('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')pd.io.sql.to_sql(thedataframe,'tablename', conn, schema='databasename', if_exists='append')
 
参数解释:第一个参数thedataframe是需要导入的pd dataframe,第二个参数tablename是将导入的数据库中的表名第三个参数conn是启动数据库的接口,pd 1.9以后的版本,除了sqllite,均需要通过sqlalchemy来设置第四个参数databasename是将导入的数据库名字第五个参数if_exists='append'的意思是,如果表tablename存在,则将数据添加到这个表的后面sqlalchemy.create_engine是数据库引擎('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')的解释mysql是要用的数据库mysqldb是需要用的接口程序root是数据库账户password是数据库密码localhost是数据库所在服务器的地址,这里是本机3306是mysql占用的端口elonuse是数据库的名字charset=utf8是设置数据库的编码方式,这样可以防止latin字符不识别而报错
2.2 DadaFrame数据写入数据库
yconnect = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')#将一个df中的数据值写入存储到df=DataFrame(data=np.random.randint(0,100,size=(2,3)))dfdf.to_sql('text',con=yconnect,if_exists='replace')

 

 

 

转载于:https://www.cnblogs.com/angle6-liu/p/10411433.html

你可能感兴趣的文章
maven 学习---Maven依赖管理
查看>>
神州数码交换机端口隔离
查看>>
[搬运工系列]-JMeter(十二)处理Cookie与Session
查看>>
输出100-200之间的所有素数并求和程序
查看>>
栅栏里的葱
查看>>
log info
查看>>
word中如何将空格变成换行
查看>>
Python - 字符编码篇
查看>>
什么是分布式系统 一个分布式系统需要什么结构
查看>>
代理目的是监听,监听的目标是代理方法的参数
查看>>
CSS之定位,relative/absolute/fixed的用法
查看>>
php中一个"异类"语法: $a && $b = $c; 【转载】
查看>>
Rsync的配置与使用
查看>>
django模板中关于过滤器的使用
查看>>
Let the Balloon Rise HDU水题
查看>>
4401: 优美数
查看>>
Codeforces Gym101522 C.Cheering-字符串 (La Salle-Pui Ching Programming Challenge 培正喇沙編程挑戰賽 2017)...
查看>>
计蒜客 30996.Lpl and Energy-saving Lamps-线段树(区间满足条件最靠左的值) (ACM-ICPC 2018 南京赛区网络预赛 G)...
查看>>
翻译 有助于程序命名
查看>>
斐波那契
查看>>