文档章节

pandas处理股票数据总结

3
 3313
发布于 2016/10/30 21:29
字数 291
阅读 519
收藏 0

今天用pandas练习了一下处理股票数据,途中遇到了种种问题,总结记录一下。

  1. 读写csv
    data = pd.read_csv(r"D:\zeng\600084.csv", date_parser=True, encoding='gbk') #读取csv文件
    
    data.to_csv(r"D:\zeng\600084.csv")#写csv

    csv中含有中文,故指定encoding='gbk'。data_parse=True使得读取csv时会自动分析日期数据

  2. 处理字符串
    data['股票代码'] = data['股票代码'].map(lambda x : x.strip("'"))

    使用Series的map方法处理每个元素

  3. 筛选和丢弃数据

    data[data['最高价']> 0.01]  #筛选所有的“最高价”列大于0.01的数据
    data.drop(data.index[data['最高价']<0.01])    #抛弃所有的“最高价”小于0.01的数据

    drop方法要求提供索引作为参数。

  4. 排序

    data.sort_values(by='日期', inplace=True)

     

  5. 统计信息

    data["涨跌额"].describe()
    data["涨跌额"].quantile(0.9)   #按升序排列,90%排位处的值

     

  6. 统计作图,直方图,kde,Q-Q图

    data["涨跌幅"].hist(bins=300)   #直方图
    data["涨跌幅"].plot(kind='kde')    #kde图,又称密度图
    import scipy.stats as stats
    f = plt.figure(figsize=(12,8))
    ax = f.add_subplot(111)
    stats.probplot(data["涨跌幅"], dist='norm', plot=ax)
    plt.show()

    Q-Q图指出了数据与正态分布的相关性

© 著作权归作者所有

3
粉丝 0
博文 3
码字总数 820
作品 0
广州
私信 提问
量化(三) pandas股票数据处理

量化交易-pandas股票数据处理 股票数据规整化处理方法 规整化 1. 股票数据内容概括查看:head() tail() shape, describe() info() 2. 缺失值处理:isnull() notnull() dropna() fillna() 有个...

思考的小妮子
08/22
0
0
量化投资中常用python代码分析(一)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qtlyx/article/details/80515077 pandas的IO 量化投资逃不过数据处理,数据处理逃不过数据的读取和存储。一般...

钱塘小甲子
2018/05/30
0
0
docker(19):压缩docker python 镜像大小,减少依赖

1,关于python镜像 使用python开发的时候遇到问题。 发现构建之后 镜像还是比较大的。想办法减少点文件啥的。 能让镜像小点,这样发布部署啥的都方便。 2,构建dockerfile python3 在构建pan...

freewebsys
2018/04/16
0
0
驰骋股市!手把手教你如何用Python和数据科学赚钱?

     大数据文摘出品   编译:胡笳、Aileen   金融领域或许是数据科学应用场景中最充满想象力的部分,毕竟它跟财富结合地无比紧密。   不管是否是经济达人,数据科学都是一种帮你了...

大数据文摘
2018/10/08
0
0
数据处理性能对比(Python原生 vs Pandas vs Numpy)

对于任何数据科学家来说,速度和时间都是一个关键因素。在商业活动中,通常不会使用仅仅有数千个样本的玩具数据集。大部分时候你的数据集包括数百万或数亿个样本。客户订单,网络日志,帐单活...

Datartisan
2017/11/02
0
0

没有更多内容

加载失败,请刷新页面

加载更多

java快递电子面单打印接口对接demo

之前的后天管理系统的电子面单打印使用的是灵通打单。 使用相对比较麻烦,需要到处Excel之后再导入,麻烦。 快递鸟有电子面单api,后台系统直接对接很是方便,不过也遇到了好些问题。 不难是...

程序的小猿
21分钟前
3
0
fasjtjson文档

https://github.com/alibaba/fastjson/wiki/JSONField

jirak
21分钟前
3
0
Mybatis中插入多条记录

Oracle数据库 实现方法 <insert id="saveWithdrawLog"> INSERT ALL INTO OSM_TRADE_DETAIL(SID,MBR_ID,USR_ID,TRADE_MONEY,TRADE_TYPE,TRADE_TIME,TRADE_WAY,PAY_ID) VALUES(#{si......

豫华商
22分钟前
3
0
Flink on YARN(下):常见问题与排查思路

作者:杨弢(搏远) Flink 支持 Standalone 独立部署和 YARN、Kubernetes、Mesos 等集群部署模式,其中 YARN 集群部署模式在国内的应用越来越广泛。Flink 社区将推出 Flink on YARN 应用解读...

开源中国小二
23分钟前
3
0
技术沙龙|京东云端到端多媒体关键技术揭秘

编者按:从带来更高编码效率、更好的用户体验的京享高清,到直播架构与网络演进优化,从而为用户带来更流畅的观看体验,以及运维系统的异常自动修复和高弹性的多媒体存储架构,一层一层展示出...

京东云技术新知
24分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部