TensorFlow分布式在谷歌CloudML运行

时间：12-24来源：作者：点击数：78

CloudML 是由 Google 运行的 TensorFlow 托管版本，你可以不用自己运行 TensorFlow，只需轻松地使用 CloudML，并忘记与基础架构和可扩展性相关的所有问题。

假设你已经创建了云平台项目，并为项目启动计费，并启用 Google 计算引擎和云机器学习 API，这些步骤与上一个案例描述的步骤相似。这个案例受到 MNIST 训练代码的启发：https://cloud.google.com/ml-engine/docs/distributed-tensorflow-mnist-cloud-datalab。

具体做法

继续在 Google CloudML 上运行分布式 TensorFlow：

从https://github.com/GoogleCloudPlatform/cloudml-dist-mnist-example下载示例代码。
然后下载数据并保存在 GCP 存储桶中：
提交训练工作非常简单：可以轻松地使用 CloudML 引擎调用训练步骤。在这个例子中，训练代码在 us-central1 区域运行 1000 次，输入数据来自存储桶，输出桶将被提交到一个不同的存储桶。
如果你愿意，可以通过访问 CloudML 控制台（https://pantheon.google.com/mlengine/）控制训练过程。
一旦培训结束，可以直接从 CloudML 中提取模型。
一旦模型在线提供，就可以获取服务并进行预测，request.json 是通过使用从 MNIST 读取数据的脚本 make_request.py 创建的，该脚本执行独热编码，然后使用格式良好的 json 模式编写特征。