文档介绍:Tensorflow与深度学****课程第七天1、CIFAR图像分类2、分布式会话函数3、分布式TensorFlow4、 训练模型分布式会话APIMonitoredTrainingSession(master=‘’,is_chief=True,checkpoint_dir=None,  hooks=None,save_checkpoint_secs=600,save_summaries_steps=USE_DEFAULT,save_summaries_secs=USE_DEFAULT,config=None)分布式会话函数master:指定运行会话协议IP和端口(用于分布式) “grpc://:2000”is_chief是否为主worker(用于分布式) 如果True,它将负责初始化和恢复基础的TensorFlow会话。如果False,它将等待一位负责人初始化或恢复TensorFlow会话。checkpoint_dir:检查点文件目录,同时也是events目录config:会话运行的配置项,(log_device_placement=True)hooks:可选SessionRunHook对象列表should_stop():是否异常停止run():()1、begin():在会话之前,做初始化工作2、before_run(run_context)在每次调用run()之前调用,以添加run()中的参数。ARGS:run_context:一个SessionRunContext对象,包含会话运行信息return:一个SessionRunArgs对象,例如:(loss)3、after_run(run_context,run_values)在每次调用run()后调用,一般用于运行之后的结果处理该run_values参数包含所请求的操作/张量的结果 before_run()。该run_context参数是相同的一个发送到before_run呼叫。 ARGS:run_context:一个SessionRunContext对象run_values一个SessionRunValues对象,:再添加钩子类的时候,(last_step=5000)指定执行的训练轮数也就是max_step,超过了就会抛出异常(loss)判断指定Tensor是否为NaN,为NaN则结束注:在使用钩子的时候需要定义一个全局步数:global_step=()分布式Tensorflow分布式Tensorflow是由高性能的gRPC框架作为底层技术来支持的。这是一个通信框架gRPC(googleremoteprocedurecall),是一个高性能、跨平台的RPC框架。RPC协议,即远程过程调用协议,是指通过网络从远程计算机程序上请求服务。