TensorFlow从入门到实践

TensorFlow 从入门到实践

导入TensorFlow模块,查看下当前模块的版本

1
2
3
import tensorflow as tf

print(tf.__version__)
1
1.4.0

tensorflow是一种图计算框架,所有的计算操作被声明为图(graph)中的节点(Node)

即使只是声明一个变量或者常量,也并不执行实际的操作,而是向图中增加节点

我们来看一上前面安装TensorFlow的时候的测试代码

1
2
3
4
5
6
7
8
9
# 创建名为hello_constant的TensorFlow对象
hello_constant = tf.constant('Hello World!')

with tf.Session() as sess:

# 在session中运行tf.constant 操作
output = sess.run(hello_constant)

print(output)
1
b'Hello World!'

Tensor

在 TensorFlow 中,数据不是以整数,浮点数或者字符串形式存在的。

这些值被封装在一个叫做 tensor 的对象中。

在 hello_constant = tf.constant(‘Hello World!’) 代码中,
hello_constant是一个 0 维度的字符串 tensor。

tensors 还有很多不同大小:

1
2
3
4
5
6
7
8
9
10
11
12
13
# A 是一个0维的 int32 tensor
A = tf.constant(1234)
# B 是一个1维的 int32 tensor
B = tf.constant([123,456,789])
# C 是一个2维的 int32 tensor
C = tf.constant([ [123,456,789], [222,333,444] ])

with tf.Session() as sess:
out_A = sess.run(A)
out_B = sess.run(B)
out_C = sess.run(C)

print('\n', out_A, '\n', '----------', '\n', out_B, '\n', '----------', '\n', out_C)
1
2
3
4
5
6
1234 
----------
[123 456 789]
----------
[[123 456 789]
[222 333 444]]

Session

TensorFlow 的 api 构建在 computational graph(计算图) 的概念上,它是一种对数学运算过程进行可视化的一种方法。让我们把你刚才运行的 TensorFlow 的代码变成一个图:

44.png

如上图所示,一个 “TensorFlow Session” 是用来运行图的环境。这个 session 负责分配 GPU(s) 和/或 CPU(s) 包括远程计算机的运算。让我们看看怎么使用它:

1
2
with tf.Session() as sess:
output = sess.run(hello_constant)

这段代码已经从上一行创建了一个 tensor hello_constant。下一行是在session里对 tensor 求值。

这段代码用 tf.Session 创建了一个sess的 session 实例。 sess.run() 函数对 tensor 求值,并返回结果。

constant运算

我们先计算一个线性函数,y=wx+b

1
2
3
4
5
6
7
8
9
10
11
12
w = tf.Variable([[1., 2.]])
x = tf.Variable([[3.], [4.]])
b = tf.constant(.9)

y = tf.add(tf.matmul(w, x), b)

# 变量必须要初始化后才能使用
init = tf.global_variables_initializer()

with tf.Session() as sess:
sess.run(init)
print(y.eval())
1
[[11.9]]

计算图中所有的数据均以tensor来存储和表达。
tensor是一个高阶张量,二阶张量为矩阵,一阶张量为向量,0阶张量为一个数(标量)。

1
2
a = tf.constant(0, name='B')
b = tf.constant(1)
1
2
print(a)
print(b)
1
2
Tensor("B:0", shape=(), dtype=int32)
Tensor("Const_5:0", shape=(), dtype=int32)

其他计算操作也同样如此。 tensorflow中的大部分操作都需要通过tf.xxxxx的方式进行调用。

1
2
c = tf.add(a,b)
print(c)
1
Tensor("Add_1:0", shape=(), dtype=int32)

从加法开始, tf.add() 完成的工作与你期望的一样。它把两个数字,两个 tensor,返回他们的和。减法和乘法同样也是直接调用对应的接口函数

1
2
x = tf.subtract(10, 4) # 6
y = tf.multiply(2, 5) # 10

还有很多关于数学的api,你可以自己去查阅文档

1
2
mat_a = tf.constant([[1, 1, 1], [3, 3, 3]])
mat_b = tf.constant([[2, 2, 2],[5, 5, 5]], name='mat_b')
1
2
3
mul_a_b = mat_a * mat_b
tf_mul_a_b = tf.multiply(mat_a, mat_b)
tf_matmul_a_b = tf.matmul(mat_a, tf.transpose(mat_b), name='matmul_with_name')
1
2
3
print(mul_a_b)
print(tf_mul_a_b)
print(tf_matmul_a_b)
1
2
3
Tensor("mul:0", shape=(2, 3), dtype=int32)
Tensor("Mul_1:0", shape=(2, 3), dtype=int32)
Tensor("matmul_with_name:0", shape=(2, 2), dtype=int32)
1
2
with tf.Session() as sess:
mul_value, tf_mul_value, tf_matmul_value = sess.run([mul_a_b, tf_mul_a_b, tf_matmul_a_b])
1
2
3
print(mul_value)
print(tf_mul_value)
print(tf_matmul_value)
1
2
3
4
5
6
[[ 2  2  2]
[15 15 15]]
[[ 2 2 2]
[15 15 15]]
[[ 6 15]
[18 45]]

我们再举几个具体的实例来看看

1
2
3
4
5
6
7
a = tf.constant(2)
b = tf.constant(3)
x = tf.add(a, b)
with tf.Session() as sess:
writer = tf.summary.FileWriter('./graphs/const_add', sess.graph)
print(sess.run(x))
writer.close()
1
5
1
2
3
4
5
6
7
a = tf.constant([2, 2], name='a')
b = tf.constant([[0, 1], [2, 3]], name='b')
x = tf.multiply(a, b, name='dot_product')
with tf.Session() as sess:
writer = tf.summary.FileWriter('./graphs/const_mul', sess.graph)
print(sess.run(x))
writer.close()
1
2
[[0 2]
[4 6]]
1
2
3
4
5
6
7
8
9
a = tf.constant([[2, 2],[1, 4]], name='a')
b = tf.constant([[0, 1], [2, 3]], name='b')
x = tf.multiply(a, b, name='dot_product')
y = tf.matmul(a, b, name='mat_mul')
with tf.Session() as sess:
writer = tf.summary.FileWriter('./graphs/const_mul_2', sess.graph)
print(sess.run(x))
print(sess.run(y))
writer.close()
1
2
3
4
[[ 0  2]
[ 2 12]]
[[ 4 8]
[ 8 13]]

各式各样的常量

1
2
x = tf.zeros([2, 3], tf.int32)
y = tf.zeros_like(x, optimize=True)
1
print(y)
1
Tensor("zeros_like:0", shape=(2, 3), dtype=int32)
1
2
with tf.Session() as sess:
print(sess.run(y))
1
2
[[0 0 0]
[0 0 0]]
1
2
3
4
5
6
7
t_0 = 19 
x = tf.zeros_like(t_0) # ==> 0
y = tf.ones_like(t_0) # ==> 1

with tf.Session() as sess:
print(sess.run([x]))
print(sess.run([y]))
1
2
[0]
[1]

变量

1
2
3
4
5
6
with tf.variable_scope('meh') as scope:
a = tf.get_variable('a', [10])
b = tf.get_variable('b', [100])

writer = tf.summary.FileWriter('./graphs/test', tf.get_default_graph())
writer.close()

例如:求导也是一个运算

1
2
3
4
5
6
7
x = tf.Variable(2.0)
y = 2.0 * (x ** 3)
z = 3.0 + y ** 2
grad_z = tf.gradients(z, y)
with tf.Session() as sess:
sess.run(x.initializer)
print(sess.run(grad_z))
1
[32.0]

一次性初始化所有变量

1
2
3
4
5
6
7
8
9
my_var = tf.Variable(2, name="my_var") 

my_var_times_two = my_var.assign(2 * my_var)

with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print(sess.run(my_var_times_two))
print(sess.run(my_var_times_two))
print(sess.run(my_var_times_two))
1
2
3
4
8
16

在前面我们都是采用,先赋值再计算的方法,但是在我们的工作过程中,我会遇到先定义变量,后赋值的情况。
如果你想用一个非常量 non-constant 该怎么办?这就是 tf.placeholder() 和 feed_dict 派上用场的时候了。我们来看看如何向 TensorFlow 传输数据的基本知识。

tf.placeholder()

当你你不能把数据赋值到 x 在把它传给 TensorFlow。因为后面你需要你的 TensorFlow 模型对不同的数据集采取不同的参数。这时你需要 tf.placeholder()!

数据经过 tf.session.run() 函数得到的值,由 tf.placeholder() 返回成一个 tensor,这样你可以在 session 开始跑之前,设置输入。

Session’s feed_dict 功能

1
2
3
4
5
x = tf.placeholder(tf.string)

with tf.Session() as sess:
out = sess.run(x, feed_dict={x: 'Hello World'})
print(out)
1
Hello World

用 tf.session.run() 里 feed_dict 参数设置占位 tensor。上面的例子显示 tensor x 被设置成字符串 “Hello, world”。当然你也可以用 feed_dict 设置多个 tensor。

placeholder是一个占位符,它通常代表着从外界输入的值。 其中None代表着尚不确定的维度。

1
2
3
4
5
input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.multiply(input1, input2)
with tf.Session() as sess:
print(sess.run([output], feed_dict={input1:[7.], input2:[2.]}))
1
[array([14.], dtype=float32)]

把numpy转换成Tensor

1
2
3
4
5
6
7
import numpy as np
a = np.zeros((3,3))
print(a)
print('----------------')
ta = tf.convert_to_tensor(a)
with tf.Session() as sess:
print(sess.run(ta))
1
2
3
4
5
6
7
[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]
----------------
[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]

类型转换

为了让特定运算能运行,有时会对类型进行转换。例如,你尝试下列代码,会报错:

1
tf.subtract(tf.constant(2.0),tf.constant(1))
1
TypeError: Input 'y' of 'Sub' Op has type int32 that does not match type float32 of argument 'x'.

只是因为常量 1 是整数,但是常量 2.0 是浮点数 subtract 需要他们能相符。

在这种情况下,你可以让数据都是同一类型,或者强制转换一个值到另一个类型。这里,我们可以把 2.0 转换成整数再相减,这样就能得出正确的结果:

1
2
3
number = tf.subtract(tf.cast(tf.constant(2.0), tf.int32), tf.constant(1))   
with tf.Session() as sess:
print(sess.run(number))
1
1

tensorboard 了解图结构/可视化利器

1
2
3
4
5
6
7
8
9
10
import tensorflow as tf
a = tf.constant(2, name='A')
b = tf.constant(3, name='B')
x = tf.add(a,b, name='addAB')
with tf.Session() as sess:
print(sess.run(x))
#写到日志文件里
writer = tf.summary.FileWriter('./graphs/add_test', sess.graph)
#关闭writer
writer.close()
1
5

启动 TensorBoard

在命令端运行:tensorboard –logdir=”./graphs” –port 7007

然后打开Google浏览器访问:http://localhost:7007/

实践

TensorFlow实现线性回归

1
2
3
4
import numpy as np
import os
import tensorflow as tf
import matplotlib.pyplot as plt

设置生成的图像尺寸和去除警告

1
2
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
plt.rcParams["figure.figsize"] = (14, 8) # 生成的图像尺寸

随机生成一个线性的数据,当然你可以换成读取对应的数据集

1
2
3
4
5
n_observations = 100
xs = np.linspace(-3, 3, n_observations)
ys = 0.8*xs + 0.1 + np.random.uniform(-0.5, 0.5, n_observations)
plt.scatter(xs, ys)
plt.show()

images

准备好placeholder

1
2
X = tf.placeholder(tf.float32, name='X')
Y = tf.placeholder(tf.float32, name='Y')

初始化参数/权重

1
2
W = tf.Variable(tf.random_normal([1]), name='weight')
b = tf.Variable(tf.random_normal([1]), name='bias')

计算预测结果

1
Y_pred = tf.add(tf.multiply(X, W), b)

计算损失值函数

1
loss = tf.square(Y - Y_pred, name='loss')

初始化optimizer

1
2
learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

指定迭代次数,并在session里执行graph

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
n_samples = xs.shape[0]
init = tf.global_variables_initializer()
with tf.Session() as sess:
# 记得初始化所有变量
sess.run(init)

writer = tf.summary.FileWriter('./graphs/linear_regression', sess.graph)

# 训练模型
for i in range(50):
total_loss = 0
for x, y in zip(xs, ys):
# 通过feed_dic把数据灌进去
_, loss_value = sess.run([optimizer, loss], feed_dict={X: x, Y: y})
total_loss += loss_value
if i % 5 == 0:
print('Epoch {0}: {1}'.format(i, total_loss / n_samples))

# 关闭writer
writer.close()

# 取出w和b的值
W, b = sess.run([W, b])
1
2
3
4
5
6
7
8
9
10
Epoch 0: [0.7908481]
Epoch 5: [0.07929672]
Epoch 10: [0.07929661]
Epoch 15: [0.07929661]
Epoch 20: [0.07929661]
Epoch 25: [0.07929661]
Epoch 30: [0.07929661]
Epoch 35: [0.07929661]
Epoch 40: [0.07929661]
Epoch 45: [0.07929661]

打印最后更新的w、b的值

1
2
3
print(W, b)
print("W:"+str(W[0]))
print("b:"+str(b[0]))
1
2
3
[0.82705235] [0.16835527]
W:0.82705235
b:0.16835527

画出线性回归线

1
2
3
4
plt.plot(xs, ys, 'bo', label='Real data')
plt.plot(xs, xs * W + b, 'r', label='Predicted data')
plt.legend()
plt.show()

44.png

转载请注明:Seven的博客

本文标题:TensorFlow从入门到实践

文章作者:Seven

发布时间:2018年08月13日 - 00:00:00

最后更新:2018年12月11日 - 22:07:56

原始链接:http://yoursite.com/2018/08/13/2018-08-13-TensorFlow-course/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

------ 本文结束------
坚持原创技术分享,您的支持将鼓励我继续创作!
0%