文档章节

小白学Tensorflow之简单神经网络

AllenOR灵感
 AllenOR灵感
发布于 2017/09/10 01:26
字数 504
阅读 2
收藏 0

在这篇博客中,我们将利用Tensorflow搭建一个简单的三层神经网络,分别是一个输入层,一个隐藏层和一个输出层。并且,我们采用sigmoid函数作为激活函数。
第一,我们先构建神经网络模型,其中w_layer_1是输入层到隐藏层之间的连接矩阵,然后用sigmoid函数来作为激活函数,w_layer_2是隐藏层到输出层之间的连接矩阵。

# 定义输入层到隐藏层之间的连接矩阵
w_layer_1 = init_weights([784, 625])

# 定义隐藏层到输出层之间的连接矩阵
w_layer_2 = init_weights([625, 10])

def model(X, w_layer_1, w_layer_2): 
# 我们采用 sigmoid 函数来作为激活函数
  h = tf.nn.sigmoid(tf.matmul(X, w_layer_1)) 
  return tf.matmul(h, w_layer_2)

第二,我们还是采用softmax和交叉熵来训练我们的模型。

# 训练模型,我们计算交叉熵的平均值和采用梯度下降法来训练
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(py_x, Y))
learning_rate = 0.01
train_op = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

完整代码,如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import numpy as np
import tensorflow as tf 
import input_data

def init_weights(shape):
    return tf.Variable(tf.random_normal(shape, stddev = 0.01))

def model(X, w_layer_1, w_layer_2):

    # 我们采用 sigmoid 函数来作为激活函数
    h = tf.nn.sigmoid(tf.matmul(X, w_layer_1))
    return tf.matmul(h, w_layer_2)

# 导入数据
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels

X = tf.placeholder("float", [None, 784])
Y = tf.placeholder("float", [None, 10])

# 定义输入层到隐藏层之间的连接矩阵
w_layer_1 = init_weights([784, 625])

# 定义隐藏层到输出层之间的连接矩阵
w_layer_2 = init_weights([625, 10])

# 搭建模型
py_x = model(X, w_layer_1, w_layer_2)

# 训练模型,我们计算交叉熵的平均值和采用梯度下降法来训练
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(py_x, Y))
learning_rate = 0.01
train_op = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
predict_op = tf.argmax(py_x, 1)

with tf.Session() as sess:

    init = tf.initialize_all_variables()
    sess.run(init)

    for i in xrange(100):
        for start, end in zip(range(0, len(trX), 128), range(128, len(trX), 128)):
            sess.run(train_op, feed_dict = {X: trX[start:end], Y: trY[start:end]})
        print i, np.mean(np.argmax(teY, axis = 1) == sess.run(predict_op, feed_dict = {X: teX, Y: teY}))

本文转载自:http://www.jianshu.com/p/8c3b63f7d999

共有 人打赏支持
AllenOR灵感
粉丝 10
博文 2634
码字总数 82983
作品 0
程序员
史上最全TensorFlow学习资源汇总

来源 悦动智能(公众号ID:aibbtcom) 本篇文章将为大家总结TensorFlow纯干货学习资源,非常适合新手学习,建议大家收藏。 ▌一 、TensorFlow教程资源 1)适合初学者的TensorFlow教程和代码示...

悦动智能
04/12
0
0
GitHub超过2600星的TensorFlow教程,简洁清晰还不太难丨资源

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/83155418 伊瓢 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最近,弗吉尼亚...

量子位
前天
0
0
【干货】史上最全的Tensorflow学习资源汇总,速藏!

一 、Tensorflow教程资源: 1)适合初学者的Tensorflow教程和代码示例:(https://github.com/aymericdamien/TensorFlow-Examples)该教程不光提供了一些经典的数据集,更是从实现最简单的“Hel...

技术小能手
04/16
0
0
入门 | TensorFlow的动态图工具Eager怎么用?这是一篇极简教程

  选自Github   作者:Madalina Buzau   机器之心编译   参与:王淑婷、泽南      去年 11 月,Google Brain 团队发布了 Eager Execution,一个由运行定义的新接口,为 TensorFl...

机器之心
06/14
0
0
关于TensorFlow,你应该了解的9件事

谷歌开发技术推广工程师 Laurence Moroney 在 Google Cloud Next 大会上进行了一段 42 分钟的演讲,主题是「What's New with TensorFlow?」。本文作者 Cassie Kozyrkov 对该演讲进行了总结,...

酒逢知己千杯少
10/12
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring中static变量不能@value注入的原因

今天本想使用@Value的方式使类中的变量获得yml文件中的配置值,然而一直失败,获得的一直为null。 类似于这样写的。 public class RedisShardedPool { private static ShardedJedisPool pool...

钟然千落
今天
2
0
CentOS7防火墙firewalld操作

firewalld Linux上新用的防火墙软件,跟iptables差不多的工具。 firewall-cmd 是 firewalld 的字符界面管理工具,firewalld是CentOS7的一大特性,最大的好处有两个:支持动态更新,不用重启服...

dingdayu
今天
1
0
关于组件化的最初步

一个工程可能会有多个版本,有国际版、国内版、还有针对各种不同的渠道化的打包版本、这个属于我们日常经常见到的打包差异化版本需求。 而对于工程的开发,比如以前的公司,分成了有三大块业...

DannyCoder
今天
2
0
Spring的Resttemplate发送带header的post请求

private HttpHeaders getJsonHeader() { HttpHeaders headers = new HttpHeaders(); MediaType type = MediaType.parseMediaType("application/json; charset=UTF-8"); ......

qiang123
昨天
3
0
Spring Cloud Gateway 之 Only one connection receive subscriber allowed

都说Spring Cloud Gateway好,我也来试试,可是配置了总是报下面这个错误: java.lang.IllegalStateException: Only one connection receive subscriber allowed. 困扰了我几天的问题,原来...

ThinkGem
昨天
38
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部