pandas操作
pandas操作
Scofieldxs 发表于5个月前
pandas操作
  • 发表于 5个月前
  • 阅读 3
  • 收藏 0
  • 点赞 0
  • 评论 0

腾讯云 新注册用户 域名抢购1元起>>>   

  1. 排序: sort_values df.sort_values(['query_count'],ascending=False)[:20] # 根据query_count列排序,降序

  2. 删除一行,一列:drop df.drop([1504369],inplace=True) # 删除第1504369行元素,inplace=True:不生成新的dataframe

     df.drop(df.columns[-1],axis=1,inplace=True)
     # 删除最后一列
    
  3. 定位到具体行列: loc df.loc[:20,df.columns[2:20]] # 前20行,2-20列

  4. 查看两列关系 train[['Title', 'Survived']].groupby(['Title'], as_index=False).mean()

  5. 离散值一一对应做转换:map dataset['Sex'] = dataset['Sex'].map( {'female': 0, 'male': 1} ).astype(int)

  6. 连续之离散化 dataset.loc[(dataset['Fare'] > 7.91) & (dataset['Fare'] <= 14.454), 'Fare'] = 1

  7. 连续值离散化: cut ser = Series(np.random.randint(1,10,6)) bins = [0,3,6,9] cats = pd.cut(ser,bins,labels=['small','middle','large'])

共有 人打赏支持
粉丝 4
博文 23
码字总数 25971
×
Scofieldxs
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: