文档章节

回归分析demo

KYO4321
 KYO4321
发布于 2017/06/29 11:18
字数 174
阅读 10
收藏 0
#!/usr/bin/env python
from pandas import DataFrame, Series
import pandas as pd
import numpy as np
import statsmodels.formula.api as sm
from sklearn.linear_model import LinearRegression
import scipy, scipy.stats
import matplotlib.pyplot as plt

data_str = """Region|Alcohol|Tobacco
North|6.47|4.03
Yorkshire|6.13|3.76
Northeast|6.19|3.77
East Midlands|4.89|3.34
West Midlands|5.63|3.47
East Anglia|4.52|2.92
Southeast|5.89|3.20
Southwest|4.79|2.71
Wales|5.27|3.53
Scotland|6.08|4.51
Northern Ireland|4.02|4.56"""

d = data_str.split('\n')
d = [i.split('|') for i in d]

for i in range(len(d)):
    for j in range(len(d[0])):
        try:
            d[i][j] = float(d[i][j])
        except:
            pass
        
df = DataFrame(d[1:], columns=d[0])
plt.scatter(df['Tobacco'], df['Alcohol'],
         marker='o',
         edgecolor='b',
         facecolor='none',
         alpha=0.5)
plt.xlabel('Tobacco')
plt.ylabel('Alcohol')
plt.savefig('alcohol_v_tobacco.png', fmt='png', dpi=100)


df['Eins'] = np.ones((len(df), ))
Y = df.Alcohol[:-1]
X = df[['Tobacco','Eins']][:-1]
result = sm.OLS(Y, X).fit()
result.summary()

result.params   ##'Eins'即为截距项
"""
Out[22]: 
Tobacco    1.005896
Eins       2.041223
dtype: float64
"""

© 著作权归作者所有

共有 人打赏支持
上一篇: iris数据集demo
下一篇: R连接Oracle
KYO4321
粉丝 4
博文 103
码字总数 57168
作品 0
深圳
程序员
私信 提问
chatbot人工智能机器人开发,提供教学视频

成为一名人工智能相关的开发人员,一般要学习:线性代数;统计学相关知识如:相关性分析,回归分析,聚类分析,分布,指标,显著性分析and so on ... ...作为一名普通的程序员没有太多时间或...

qwerttaa
2017/07/26
3.3K
12
对象检测入门资料

本文旨在提供对象检测入门资料,包含但不限于入门TensorFlow、入门基本框架、入门keras资料,持续更新。 开发环境 平台:首选Mac/Linux、Windows目前TensorFlow API不全 语言:Python2.7.13 ...

Jcme丶Ls
2017/06/07
0
0
一些常见的机器学习算法的实现代码

前言 一些常见的机器学习算法的实现代码,包括:DeepLearning、PCA、kNN、logistics regression、ManifoldLearning、SVM、GMM、Decision Tree、KMeans和NaiveBayes等。 Github地址:https:/...

初雪之音
2016/06/08
990
0
echarts-for-react v1.2.0 发布,更新至 echarts 3.5

echarts-for-react:baidu Echarts(v3.0) components for React wrapper. 一个简单的 echarts(v3.0) 的 react 封装。 在 echarts 新发布的 3.5 版本中,新增了日历坐标系,增强了坐标轴指示器...

小薇
2017/03/29
1K
4
dubbo源码解析-spi(五)

前言 之前对dubbo的进行了四篇的分享.大家对这个概念有了一些初步的了解.谈到编程水平如何进阶,大家可能都会异口同声的说出三个字,.但是我却始终认为,编程光,是永远学不会的.关键还是要多动手...

肥朝
2018/04/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

快速体验 Sentinel 集群限流功能,只需简单几步

️ Pic by Alibaba Tech on Facebook 集群限流 可以限制某个资源调用在集群内的总 QPS,并且可以解决单机流量不均导致总的流控效果不佳的问题,是保障服务稳定性的利器。 Sentinel 从 1.4.0 ...

zhaowei121
12分钟前
0
0
Data Lake Analytics: 读/写PolarDB的数据

Data Lake Analytics 作为云上数据处理的枢纽,最近加入了对于PolarDB的支持, PolarDB 是阿里云自研的下一代关系型分布式云原生数据库,100%兼容MySQL,存储容量最高可达 100T,性能最高提升...

迷你芊宝宝
12分钟前
0
0
DNS解析过程详解

先说一下DNS的几个基本概念: 一. 根域 就是所谓的“.”,其实我们的网址www.baidu.com在配置当中应该是www.baidu.com.(最后有一点),一般我们在浏览器里输入时会省略后面的点,而这也已经...

阿锋zxf
13分钟前
0
0
Windows 安装 mysql8.0 配置远程访问

Windows 安装 mysql8.0 配置远程访问 2018年06月15日 11:11:10 吕海洋 阅读数:2142 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wuchenlhy/article/deta...

linjin200
16分钟前
0
0
JVM 指令重排序的意义以及happens-before原则

编译期重排序的典型就是通过调整指令顺序,在不改变程序语义的前提下,尽可能减少寄存器的读取、存储次数,充分复用寄存器的存储值。 假设第一条指令计算一个值赋给变量A并存放在寄存器中,第...

kdy1994
21分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部