devops之gcp core infrastructure fundamental，大数据和机器学习|电子爱好者

admin管理员组
文章数量:1613748

最后更新2022/02/13

google big data services提供了如下五种无服务器服务：

Cloud Dataproc, managed hardoop, map reduce，spark，Hive，Pig （俺都不知道是啥，也不敢问…以后自己偷着学吧，都是apache的处理模型）。业务创建飞快，90秒内可生成群集（完整搞一整套infrastructure俺还是知道的，从硬件服务器配置开始，怎么也要几天吧）；由于是serverless架构，即使job在运行，可以控制群集启停（都停了job运行还有意义？其实是说能保留运行状态，群集再启动能断点续传）。群集构建在computer engine虚机基础之上，具体虚机配置和数量还是可以控制，并非完全serverless，而且可以使用stackdriver去监视运行状态；还有其它一些好处，例如只按照硬件占有资源收费，可以为batch任务设置抢先参数，而获得更高折扣。这个抢先参数并非优先，而是当别人有空闲时自己才使用资源，其实应该翻译为插空。并非所有任务都可以设置插空参数，因为这种模式可能要求随时启动或者停止当前任务。即使是有状态的服务，如果每次启停都需要过多的前后处理，那么其结果也是得不偿失。
Cloud Dataflow, 提供stream和batch处理，主要用于流水作业，适合ETL或orchestration。基于transform模型，这才能说是真正的serverless，已经完全无法看到计算引擎了，由系统自动管理群集规模。写好的执行代码可以自由选择在批处理或流处理模式下执行。示例过程：从bigquery拿数据（source），进行若干处理（map，reduce）transform，最后sink到datastorage。
Big Query，数据库数据和流数据分析，提供高达每秒10万行处理，支持几百TB数据量（PB级别），SQL兼容（SQL 2011），不需要维护群集。全球支持，按存储数据量及查询收费（就是计量加计查，两个各收各的，总费用为二者之和，这样如果你授权别人使用这个数据，可以你只付数据存储费，他付查询费。长期保存数据有折扣，而且自动计算，例如超过90天，保存费从每G每月2分钱降为1美分）；还支持cost control（具体以后再研究，难道是达量限流？）BigQuery除了query，也支持创建、替换、更新、删除等写操作，但有一些限制及known issue（这个。。。还不赶快去干活修补！）。
Cloud Pub/Sub，企业级信息处理（消息总线？），高扩展，例如支持10万/秒（又是10万？难道保存的数据库是bigquery？设置支持100万/秒，单用户最高10万）。消息可以推送，也可以拉取，支持离线用户（代为保存，不知可以保存多久），支持确保发送（但好像不支持仅发送一次，看来要用户自己进行已处理记录）。
Cloud Datalab，交互式数据分析，可视化。基于Jupyter（大名是IPython）

下面是google machine learning平台支持。很多其它业务都使用了google machine learning api，例如youtube等。

TensorFlow，这是一种神经网络模型
Cloud ML，由GCP完全管理的machine learning服务，基于bigquery和google storage
Machine Learning API，预先训练好的machine learning模型，包括语音、视觉、翻译、自然语言。这些API都可以通过REST实现。支持80多种语言，实时翻译；

记录几个本节题外的信息，刚才quiz错了若干次：
datastore是sql数据库（有store，但却是数据库）
spanner是巨大的关系数据库
bigtable是nonSQL数据库（有table，但不是RDB）

版权声明：本文标题：devops之gcp core infrastructure fundamental，大数据和机器学习内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1728643430a1167399.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Excel数据可视化—表格美化

1天前

EXCEL系列文章目录 Excel系列文章是本人亲身经历职场之后萌发的想法，为什么Excel覆盖如此之广，几乎每个公司、学校、家庭都在使用，但是它深藏的宝藏功能却很少被人使用

matlab表格中的数画图,excel数据表格画图-如何利用matlab根据excel表格里面的数据画图...

1天前

如何利用matlab根据excel表格里面的数据画图方法步骤 1，在excel中输入制图表所需要的数据。 2，选择数据(选择不连续的数据可以按住“ctrl”在选择就可以了。还有选择时要连表头一

使用Python处理Excel数据并生成词云

1天前

使用Python处理Excel数据并生成词云一、目的二、步骤三、代码以及结果一、目的从Excel文件中找出喜欢的岗位类别，将其对应的岗位描述进行分析处理，并做出词云图。 work_all.

python写入excel表格数据绘制图表,Python对数据写入Execl文件并生成图表

1天前

Python对数据写入Execl文件并生成图表需求: 为了做测试或者对爬虫程序爬取数据进行分析汇总，我们时常会将数据生成报表，但是如果我们想将报表生成在Excel中，这时候就可以借助xlsxwriter第三方包来生成图表分析：为生成e

用python读取excel数据、并作图_Python读取Excel表格,并同时画折线图和柱状图的方法...

1天前

今日给大家分享一个Python读取Excel表格，同时采用表格中的数值画图柱状图和折线图，这里只需要几行代码便可以实。首先我们需要安装一个Excel操作的库xlrd，这个很简单，在安装Python后直接在DOS命令下输入pip insta

python利用docxtpl将excel数据写入word表格

1天前

解决问题一：将excel数据读取，并将其保存在word中的表格解决问题二：使用xlrd读入excel数据，如果是整数的话，打开

Python读取excel表格数据并绘制成柱状图 | 数据排序、柱状图颜色、标签乱码等问题通通能够解决！

1天前

hello大家好，我是你们的可爱丸，我们又见面啦！ python的功能十分强大，它不仅可以用来做爬虫，还可以用来做数据分析哦！那么今天我就带着大家用python 分析表格数据，并绘制成柱状图，让大家感受一下用python来绘制

Excel表格数据的导出方法

1天前

第一步我们是在页面给一个询问语句的方法，用来询问用户是否要导出当前页面的数据，然后再给一个确定的方法，用的是window.open，直接在浏览器页面打开

机器学习（五）——概率解释（Probabilistic interpretation）

1天前

原文：http:cs229.stanford.edunotescs229-notes1.pdf 当面临回归问题时，为什么线性回归，特别是为什么最小二乘损失函数可能是

李宏毅机器学习笔记——13. Explainable ML（可解释的机器学习）

1天前

摘要： 本章学习了Explainable ML，即我们不仅要会用机器学习，还要让机器学习具有可解释性。解释原因主要是为了使用者的需求，而不是为了完全理解

机器学习黑盒？SHAP（SHapley Additive exPlanations）使用 XGBoost 的可解释机器学习

1天前

在公众号「python风控模型」里回复关键字：学习资料模型可解释性这是一个关于错误解释机器学习模型的危险以及正确解释它的价值的故事。如果您发现诸如梯度提升机或随机森林之类的集成树模型的鲁棒准确性很有吸引力&a

Tensorflow2.1.0 自定义数据集：精灵宝可梦数据集

22小时前

1. 精灵宝可梦数据介绍精灵数据放置在pokeman的根目录下，包含了5个子文件夹，每个文件夹存放了当前类别的精灵图片。网盘地址： 链接：htt

Android 一键清除其他app的数据

22小时前

如何在自己的app里面，一键清除其他应用的数据？？？ 看了很多网上的教程，80%都说需要将自己的app打包为系统应用&#

hadoop datanode结点不启动导致dfs控制台显示数据0（Configured Capacity为0）

12小时前

hadoop迁移了一次，服务器ip等都改了，我重新调整了一遍， 启动后，进入dfs控制台：http:xxx.xx.xx.xx:

大数据篇--Yarn资源队列配置和使用

12小时前

文章目录一、前言二、调度器的选择1.FIFO Scheduler：2.Capacity Scheduler：3.Fair Scheduler：4.Yarn调度器对比图&am

解决el-pagination组件，current-page 绑定的数据变了，但是页面当前页码并没有变的问题

11小时前

解决el-pagination组件，current-page 绑定的数据变了，但是页面当前页码并没有变的问题 element中el-pagination中，有时候会遇到

windows 下 Tensorboard 无法显示数据（No dashboards are active for the current data set）

10小时前

问题 No dashboards are active for the current data set 原因及解决通常是由于执行命令时，指向的路径存在问题，因此这里建议采用以下方式（亲测）：假设你文件所在目录在 F:GitHubR

机器学习(ML)、深度学习（DL）和图像处理（opencv）专用英语词典

5小时前

机器学习(ML)、深度学习（DL）和图像处理（opencv）专用英语词典百度翻译 http:fanyi.baidu A AAN &

下载ERA5数据

5小时前

前言本文主要总结了一下下载ERA5数据的经验和方法，主要分为Windows系统和Mac系统两部分；还附带了一些搜索到的比较好的相关经验，比如批量下载的方法目录 1.

使用PN532进行IC卡的Linux和Windows平台的数据读取以及写入过程

2小时前

强调：勿用于非法用途本文介绍使用PN532进行IC卡的Linux和Windows平台的数据读取以及写入过程。注意：在树莓派平台只做到了卡片解密，并没能写入UID卡，我不清楚具体原因，最后我在Win10平台进行了卡片的写入

电子爱好者 - 最新技术资讯及电子产品介绍！

devops之gcp core infrastructure fundamental，大数据和机器学习

更多相关文章

Excel数据可视化—表格美化

matlab表格中的数画图,excel数据表格画图-如何利用matlab根据excel表格里面的数据画图...

使用Python处理Excel数据并生成词云

python写入excel表格数据绘制图表,Python对数据写入Execl文件并生成图表

用python读取excel数据、并作图_Python读取Excel表格,并同时画折线图和柱状图的方法...

python利用docxtpl将excel数据写入word表格

Python读取excel表格数据并绘制成柱状图 | 数据排序、柱状图颜色、标签乱码等问题通通能够解决！

Excel表格数据的导出方法

机器学习（五）——概率解释（Probabilistic interpretation）

李宏毅机器学习笔记——13. Explainable ML（可解释的机器学习）

机器学习黑盒？SHAP（SHapley Additive exPlanations）使用 XGBoost 的可解释机器学习

Tensorflow2.1.0 自定义数据集：精灵宝可梦数据集

Android 一键清除其他app的数据

hadoop datanode结点不启动导致dfs控制台显示数据0（Configured Capacity为0）

大数据篇--Yarn资源队列配置和使用

解决el-pagination组件，current-page 绑定的数据变了，但是页面当前页码并没有变的问题

windows 下 Tensorboard 无法显示数据（No dashboards are active for the current data set）

机器学习(ML)、深度学习（DL）和图像处理（opencv）专用英语词典

下载ERA5数据

使用PN532进行IC卡的Linux和Windows平台的数据读取以及写入过程

发表评论

推荐文章

android删除自带应用程序,安卓手机自带软件怎么卸载？无需root卸载安卓手机自带软件方法...

解决anaconda报错：“unicodedecodeerror: ‘gbk‘ codec can‘t decode byte 0x80 in position 64”

Win7 10安装Office2010提示让安装MSXML组件的五种解决方法

Kudu ：Service unavailable: Soft memory limit exceeded at xxx% of capacity

【C++】STL——vector的有关空间的函数介绍和使用、size和capacity函数、resize和reserve函数

热门文章

【知识兔】Excel教程小案例之字帖制作

Win10 曝激活失效问题，专业版突变家庭版；GitHub 项目库破亿

android最低版本+黑域,免root版黑域

C++中的string容器容量操作

C#基础篇：解决InvalidOperationException: Operation is not valid due to the current state of the object

keep be curious

国产开源项目的七宗罪

SQLite 漏洞影响所有 Chromium 浏览器；FB 开源 NLP 建模框架 PyText

Windows下安装使用ffmpeg

windows和linux下的一些常用区别

最新文章

2024年删除U盘的EFI分区_u盘多了一个efi能删除吗，分享我在网络安全开发中走的一些弯路

图片无法删除要计算机管理员,Win10解决U盘中删除提示“你需要提供管理员权限才能删除此文件”(图文)...

电脑回收站里不小心清理删除的文件怎么恢复?

简单说说我是怎么找回U盘删除的文件

linux下U盘无法删除文件的解决办法

u盘照片删除怎么恢复？含泪分享珍藏方案

XLSX文件删除了怎么找回？8个恢复方法，太实用了！

不小心删除文件夹怎么恢复,怎么恢复误删文件?

Ubuntu下U盘文件只读无法删除的解决办法

linux命令行下读取u盘内容_Linux拷贝U盘文件（命令行）

微信聊天记录内的文件删除了怎么恢复？

分析U盘文件系统（以FAT32为例）

U盘删除的文件怎么找回？数据恢复，5个方法

u盘最大单个文件支持多少g_解决U盘拷贝时提示文件过大问题（不能拷贝超过4个g的文件）...

u盘文件被隐藏了怎么显示出来？数据丢失也能找回

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载