机器学习入门 【二】

2019/04/14 20:59
阅读数 10

常用库简介

Numpy 基础科学计算库

Scipy 强大的科学计算工具集

Pandas 数据分析的利器

Matplotlib 画出优美的图形

Scikit-learn 机器学习库

 

Numpy

【sklearn使用numpy数组形式的数据进行处理,所以需要把数据转换为numpy数组形式,其中的多维数组也是numpy的核心功能之一】

import numpy
i = numpy.array([[520,13,14],[25,9,178]])
print("i: \n{}".format(i))

给变量i复制为一个数组
i是一个典型的numpy数组

结果:

 

 

 

sklearn需要使用 scipy来对算法进行执行
sparse函数,用来 生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数组为0的np数组 【常用】
sparse用法
import numpy as np
from scipy import sparse
matrix = np.eye(6)
#用eye函数生成一个6*6对角矩阵
#矩阵中对角线上的元素数值为1,其余都是0
sparse_matrix = sparse.csr_matrix(matrix)
#这一行把np数组转化为CSR格式的scripy稀疏矩阵(sparse matrix)
#sparse函数只会存储非0元素
print("对角矩阵:\n {}".format(matrix))
print("\nsparse存储的矩阵:\n {}".format(sparse_matrix))
 
结果:

显示的结果:将对角矩阵中的数值为1点的位置(x,y)输出

 

pandas
生成类似excel格式的数据表,还可以对数据表进行修改操作,还可以从多种类的数据库中提取数据
还支持在不同的列中使用不同类型的数据
import pandas
data = {
"name":["jike","kime","mike"],
"age":["1","2","3"],
"height":["12","13","14"]
}
data_frame = pandas.DataFrame(data)
display(data_frame)
会得到一个数据表:

 


还可以查询:
display(data_frame[data_frame.name != "mike"])
 

数据可视化

 

%matplotlib inline
#激活maplotlib
import matplotlib.pyplot as plt
#先生成一个-20到20,元素数是10的等差数列
x = np.linspace(-20,20,10)
y = x**3 + 2*x**2+6*x + 5
#画出曲线
plt.plot(x,y,marker = "o")
 
 

 


代码开头的 %matplotlib inline,允许jupyter notebook进行内置实时绘图
如果 不写,需要在最后一行plt.show() 才会将图形显示出来

 

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部