读取以某种符号为分割的数据

原创
2017/03/17 23:55
阅读数 137

用到pandas包里的read_table方法

例子:


#coding:utf-8 
import pandas as pd

path1='F:\工作\python之路\数据分析\movielens\users.dat'
path2=r'F:\工作\python之路\数据分析\movielens\ratings.dat'
path3='F:\工作\python之路\数据分析\movielens\movies.dat'

unames=['user_id','gender','age','occupation','zip']
## 普通导入数据报错,需要加上engine='python'
users=pd.read_table(path1,sep='::',header=None,names=unames,engine='python')
print(users[:5])


mnames=['movie_id','title','genres']
movies=pd.read_table(path3,sep='::',header=None,names=mnames,engine='python')

print(movies[:4])

rnames=['user_id','movie_id','rating','timestamp']
ratings=pd.read_table(path2,sep='::',header=None,names=rnames,engine='python')

print(ratings[:4])


/***************************

read_table()后面的参数,目前我只了解到这些

read_table(路径,sep='某种符号',header=None,names=某列表,engine='python')

特别注意:我的机器要添加了engine='python'才能正常读取数据,不然会报错,详细理由还不清楚,希望后续学习能了解到这个问题。

 

 

 

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部