admin管理员组

文章数量:1570208

5)画一条直线连接 A 点和 C 点。

6)画一条直线连接 B 点和 C 点。

7)根据下面的公式计算三角形的面积并写在纸上:

8)把那张画了三角形并标注了面积的纸张交回给老李。

这样小李收到老李递过来的纸张后,先询问老李三角形的三个顶点的坐标,然后再去画三角形并计算面积,如图 2 所示。


图 2 画三角形并计算面积(2)

现在不只是老李,任何人只要复印那张写了步骤的纸张,都可以叫小李画出任何他们想要的三角形,只不过小李在画三角形前要询问顶点的坐标。继续把这些步骤比喻成软件,那么相对于前面的软件,这次增加了三条输入语句,用户在运行这个软件时,要用键盘输入三角形的三个顶点的坐标,然后就会在屏幕上看到一个三角形以及这个三角形的面积。

至此,我们总结出这个软件已经具备如下特征。

  • 完成任务:画三角形并计算面积。
  • 输入数据:顶点坐标。
  • 输出结果:三角形及三角形的面积。
  • 指令集:详细定义画一个三角形的步骤和计算三角形面积的方法。

指令集保存在一个文件中,这个文件就叫可执行程序,允许存放在硬盘、U 盘、光盘或者网盘中,可以任意复制和传播。比如,Windows 操作系统中的“计算器”这个程序(指令集)保存在硬盘上的 C:\Windows\system32\calc.exe 文件中,用鼠标双击它或者单击“开始”(“所有程序”(“附件”(“计算器”,即表示命令 CPU 现在就按照里面的步骤进行操作(专业术语叫执行指令)。

最后,我们通俗地定义一下软件:由程序员写的需要让 CPU 来完成某项任务的步骤。只不过这些步骤是用计算机语言来描述的。常见的计算机语言有 C 语言、C++、Java、PHP、Go 等,编程人员必须严格按照计算机语言的语法规则来写程序,如下面用 C 语言语句实现的加法运算。


上面左侧灰色框内就是程序员用 C 语言写的两个数相加的程序语句,右侧是额外加上的说明信息。

软件必须包含输入/输出语句和计算语句,没有包含输入/输出语句的软件没有任何用途,因为它就像一个黑盒子,既不能输入任何东西,也不能从它那里得到任何东西。

在这里,我们要澄清两个概念:实时输入/输出和批量输入/输出。

  • 实时输入/输出是指 CPU 执行输入/输出步骤时,立即完成输入/输出动作。
  • 批量输入/输出是一次性输入全部的信息,一次性输出全部的计算结果。

大部分计算机软件,如办公软件,都要求实时输入/输出。绝大部分网站都是批量输入/输出的,比如注册一个在线免费邮箱,我们要一次性输入全部的注册信息,然后再单击“提交”按钮,送出全部的输入信息。

实时输入/输出软件可进一步划分为强交互性软件和弱交互性软件两种,强交互性软件是指在运行时需要实时地进行大量输入/输出操作,且输入之后马上能看到输出结果;而弱交互性软件是指软件运行时实时地进行少量的输入操作,然后就源源不断地输出了。

属于强交互性软件的有:微软的办公软件(Word、Excel、PowerPoint)、记事本、QQ、Photoshop、AutoCAD、金山的办公软件 WPS、金山词霸、Visual Studio、Eclipse、Vim、飞信等,共同特点是用键盘输入的东西马上能在屏幕上显示出来。

下面这些软件属于弱交互性软件:酷狗音乐播放器、暴风影音、千千静听、PPTV、Adobe Reader、家庭相册、迅雷下载等,共同特点是在程序运行初期只需输入少量信息,然后就源源不断地输出了。

在规划云计算方案时,要特别关注软件的输入/输出是实时的还是批量的。如果是实时的,那么还要进一步区分是强交互性的还是弱交互性的。对于实时的强交互性软件,有两种解决方法:

1)计算机网络的延时控制在合理的范围内(一般要小于 100 毫秒),手段是就近部署云计算分支中心。如果延时过大,那么当使用诸如 Word 等排版软件时,需要等一会儿才能在屏幕上看到刚才用键盘输入的字符,用户体验很差。

2)改造软件以便能通过网页浏览器访问,用户只与本地的网页浏览器进行实时输入/输出交互,而网页浏览器与“云”中软件进行批量输入/输出传输,示意图如图 3 所示。


图 3 使用浏览器改造强交互性软件

计算机网络延时的概念在教程后面会详细介绍。

最后,我们用图 4 来表示一个软件运行模型。


图 4 软件运行模型

一个软件以文件的形式保存在硬盘上,当我们用鼠标双击它时,这个软件就被读到内存,此后 CPU 就按照里面的步骤一步步执行。

执行到一些输入步骤时,就要从输入设备上获取信息(常见的输入设备有键盘、鼠标、扫描仪、话筒、摄像头、网络等)。

执行一些计算步骤时,要用到计算设备。

执行输出步骤时,把计算的结果通过输出设备输出(常见的输出设备有计算机显示器、打印机、绘图仪、音箱、耳机、网络、机械手等)。

对于一些较大的软件,不一定就是按照“输入—计算—输出”的顺序进行的,在软件执行的过程中,随时可能需要输入,也随时可能会输出,计算步骤也可能安排在任意时刻。

注意:硬盘上的文件既可以作为输入设备,也可以作为输出设备。例如,编辑一个已经存在的 PPT 文档,首先作为输入设备,PPT 文档中的内容被读到内存,编辑完成后保存时又作为输出设备,内存中被修改的内容又被写到这个 PPT 文档中。

计算设备一般指 CPU、内存、存储(硬盘属于最典型的存储)和网络,为什么网络也算计算设备呢?在云端运行一个分布式应用程序时,网络是必需的。换个角度来看,计算设备就是程序运行时需要使用的资源——计算资源。

硬盘上的 PPT 文档本身不是程序,只是用于输入/输出的数据文件,双击它能打开进行编辑,实际上运行了微软的办公套件中的 powerpoint.exe 程序,因为在安装办公软件时自动建立了数据文件和程序的关联,建立好关联之后,只要双击数据文件,就能运行关联的程序。

本节的知识点
  1. 软件是由程序员写的让 CPU 来完成某项任务的步骤。
  2. 这些步骤包括输入/输出步骤和计算步骤两大类。
  3. 输入/输出步骤要使用输入/输出设备,计算步骤要使用计算设备,计算设备也称为计算资源。
  4. 键盘和鼠标是最常见的输入设备,显示器和音箱是最常见的输出设备,CPU、内存、存储和网络统称为计算资源。
  5. 软件平时保存在硬盘里,但必须读到内存中去执行,一个软件可以被多次执行。

计算设备和输入/输出设备的分离是云计算的特征之一。也就是说,对于云计算而言,计算设备位于远方的云端,而输入/输出设备就在眼前。究竟如何分离计算设备和输入/输出设备,请看后续章节。

计算机由哪些软件和硬件组成?

组装一台计算机的步骤大概就是写好计算机配单、采购零部件、组装、安装操作系统和各种应用、交付给用户使用,更详细的描述如下。

  1. 写好配单,重点考虑用户的需要和各种零配件之间的兼容性。
  2. 买齐配件,包括 CPU、主板、内存、电源、硬盘、机箱、显示器、键盘、鼠标、音箱、光驱。
  3. 把配件组装到一起,此时我们得到一台纯硬件的裸机。
  4. 安装操作系统,如 Windows 8。
  5. 安装驱动软件,此时我们得到一台只安装了操作系统的计算机,称为平台机。
  6. 安装需要的应用软件,如聊天软件、办公软件、音视频播放软件、上网软件和游戏软件等,此时我们得到安装了操作系统和应用软件的准计算机系统。
  7. 最后把以前备份的数据资料(如文档、照片、视频等)复制到计算机硬盘中,这样完整的计算机系统就诞生了。

由此可知,完整的计算机系统包括硬件、软件和数据资料。软件又可分为平台软件和应用软件,操作系统和数据库软件是典型的平台软件。应用软件种类繁多,涉及人们生活的方方面面,如聊天软件、办公软件、上网软件、音视频播放软件、图片处理软件等。计算机系统体现出如图 1 所示的逻辑层次结构。


图 1 计算机系统逻辑层次结构

传统的个人计算机由于操作系统没有固化,感染病毒、不正常关机、误删除重要文件、配置不正确等都可能导致操作系统损坏,由此导致死机、蓝屏等各种问题。这些问题一直困扰着计算机用户,而重装操作系统、应用软件并恢复数据资料要消耗大量的时间和精力,严重时甚至丢失数据资料或者外泄私人资料。所以说,传统的计算机系统是专家系统,意思是说只有计算机专家才能很好地使用计算机,普通民众使用计算机会面临很多困难。

现在有两个趋势:第一个趋势是操作系统固化,用户自己不能安装和更改操作系统,只能在线对操作系统进行升级。应用软件也不能随便安装,只能从官方应用软件库中在线安装,如平板电脑、智能手机、老年机等。第二个趋势是云计算,后面的章节会展开讨论。

人们为什么要购买和使用计算机?也就是说人们购买和使用计算机的目的是什么?

目的只有一个,那就是处理数据资料,如上网查看别人的网站信息、编辑自己的 PPT、写个人简历、编辑图片、听音乐、看电影、和他人传递聊天信息(聊天)、发微博等,其实这些只是一些数据资料的浏览、编辑、传递和存储罢了。

如果没有裸机,或者有了裸机但没有安装操作系统,或者安装了操作系统但没有安装应用软件,那么我们就无法达到处理数据资料的目的。

由此可以说,准计算机系统(硬件、操作系统、应用软件)是手段,数据资料是目的。不难想象,如果没有数据资料要处理,就根本没必要购买和使用计算机。

手段与目的分离是云计算的另一个特征,即云计算服务提供商拥有计算资源这个“手段”,而云计算用户拥有数据资料这个“目的”。

计算机网络(因特网)是什么?

今天是周末,位于深圳南山区荔湾小区 28 栋 801 房间的云计算专家正在通过计算机和北京海淀区学院路文山花园 30 栋 2802 房间的做服装生意的朋友解释什么叫“云计算”,双方你一句我一句地在计算机上互传信息。做服装生意的朋友越说越糊涂,最后云计算专家输入了如下一句话:

“如果我能给你解释清楚,那么我的智商就下降到和你一样的水平了。”

然后单击“发送”按钮,对方马上反馈了一个晕倒的表情,聊天就这样无疾而终。

现在的问题是,单击“发送”按钮后,“如果我能给你解释清楚,那么我的智商就下降到和你一样的水平了。”这句话如何能准确无误地立即显示在北京海淀区学院路文山花园 30 栋 2802 房间里的那台计算机屏幕上呢?而地球上千千万万的其他计算机就不会显示这句话呢?

这两个问题可归结为:如何把一台计算机发出的信息准确无误地发送到另外一台计算机上?这个问题就是计算机网络所要解决的问题,示意图如图 1 所示。


图 1 两台计算机进行通信

写过纸质信件的人很清楚,为了能使信件送到对方手中,必须要在信封上写上收信人的详细地址和姓名,且“地址+姓名”是唯一的。至于这封信具体如何传递,那就是邮局的事了,不用我们操心。

如果两台计算机之间要通信,那么同样每台计算机要定义一个唯一的地址——32 个由 0 和 1 组成的二进制数字。

为了便于人们记忆,常把 32 位 0 和 1 组成的数字分成四段,每段 8 位,8 位二进制数再换算成十进制数,最后写成 xxx.xxx.xxx.xxx 格式。

如 192.168.0.10 对应的二进制分段为 11000000.10101000.00000000.00001010,因此最终的 32 位二进制地址是 11000000101010000000000000001010,有点类似于身份证号码,且必须全球唯一,这不同于邮局寄信的“XX市XX区XX街XX号”格式的地址,计算机的地址称为 IP 地址,格式是“xxx.xxx.xxx.xxx”。

有读者可能马上会想到这样一个问题:32 位二进制数字最多能给多少台计算机分配唯一的 IP 地址呢?答案是 2 的 32 次方,约等于 43 亿台计算机。目前 32 位的地址(简称为 IPv4 地址)早已分配完毕,其中分配给中国的 IPv4 地址非常少,只与微软一家企业的数量相当。

在中国,公网 IPv4 极度匮乏,因此租用一个公网 IP 地址,价格非常昂贵。为了解决 IPv4 地址不够用的问题,人们发明了 IPv6。

IPv6 采用 128 位二进制数字编码,可以分配的地址数量可达 2 的128次方,这是一个天文数字,平摊下来,地球上每平方米可以分配上百万个 IPv6 地址。但是现在 IPv6 地址还没有被普遍采用,尽管现在的网络设备都已支持 IPv6。

聪明的中国人还发明了动态域名服务(DDNS,比较有名的产品有花生壳等),利用花生壳,解决了外网如何通过域名访问局域网内的计算机的问题。

现在我们再来看看深圳的云计算专家发送的“如果我能给你解释清楚,那么我的智商就下降到和你一样的水平了。”消息是如何传递到北京朋友面前的计算机的。单击“发送”按钮后,消息、自己计算机的 IP 地址、对方计算机的 IP 地址被打包在一起并通过宽带发送给深圳电信,然后电信内部传递,最后到达北京海淀区电信局后,由海淀区电信局通过对方的宽带发送给对方计算机。

注意:消息的打包和传递都是由计算机网络自动完成的,而且以电或光的速度传播,所以速度非常快。传递路径上转发机构(通常是路由器)的多少决定了一条消息到达对方计算机所消耗的时间(术语称延时),因此位于深圳的用户给美国的朋友发送消息有可能比给武汉的朋友发送消息还快。

实时输入/输出的软件对计算机网络的延时要求较高,尤其是实时强交互性软件,对计算机网络延时更苛刻。而批量输入/输出的软件对计算机网络的延时要求并不高,比如在线看电影,刚开始有点延时,后面就一直流畅地播放了。

一个云计算中心的延时半径通常为 100 毫秒,即一个数据包从云中心出发,50 毫秒所能到达的范围(返回也要 50 毫秒),这个数字与地理位置没有直接关系,而与网络路径上的转发机构和数目有关。比如深圳的超算中心 50 毫秒延时半径可能包括了美国的洛杉矶,但没有包括广东省内的梅州市,因为深圳与梅州市之间要经过太多性能低下的转发设备,而达到美国只经过少数几台高速路由器,如图 2 所示。


图 2 延时半径100毫秒

计算机网络的另一个指标是带宽,定义为每秒钟能传递的数据量。带宽越大,则每秒钟传递的数据量就越大。如果把计算机网络比喻为布满收费站的高速公路(车子从一个收费站开到另一个收费站的时间可以忽略不计,但是收费站交钱时要消耗时间),那么带宽就与车道数直接相关,延时就是从出发点到目的地经过收费站交钱时所消耗的时间之和。

计算机网络的第三个指标是丢包率(或称为掉包率),是指在一定时间内被丢掉的数据包数目占总发送数据包数目的百分比。公式如下:

本机发送的一个数据包如果在规定的时间内没有得到对方的确认,就认为此数据包被丢失,于是重发此数据包。比如对方一共收到 8 个数据包,而本机一共发送了 10 个数据包(因为重发了 2 个数据包),所以丢包率为 20%,即丢包率越小,说明网络越稳定,当丢包率超过 10% 时就很严重了,这时需要检查网络。

接下来我们再来谈谈叠加网络技术。为了方便大家去网上搜索,在这里给出这个术语的英文名称:Overlay Networks,在 Google 上搜索英文的技术资料,往往能获得很多你想要的结果。叠加网络,顾名思义就是在一张网络平面上叠加出更多层的网络平面,手法无非就是“包中之包”——把叠加协议和信息数据打包,作为底层网络平面传递的应用层数据。

实现叠加的最新技术有 VXLAN、NVGRE 和 STT,这些技术主要用来解决在大规模、多机房、跨地区的云计算中心部署多租户环境问题。叠加网络技术非常类似于在邮政系统上建立一个情报网络,利用现有的邮局来收发间谍情报。为了防止未经授权的人获取情报信息,需要先做加密处理,然后再放入信封,当然对方事先要知道解密方法。

叠加网络与虚拟局域网有着本质的不同,虚拟局域网通过分割一张大的局域网来减少广播风暴,本质是“分割”网络;而叠加网络是把“局域网”延伸到底层网络平面的任何地点,本质是“连通”。这里的“局域网”是虚拟的概念,对用户是透明的。

VPN 就是一个典型的在广域网中通过叠加网络技术构建地理位置跨度很大的局域网的例子,如果不采用叠加网络技术,那么一个公司很难或者根本不可能建立一个跨城市的局域网。为了进一步说明叠加网络的概念,请看下面的多租户环境的情景案例。

中国微算科技有限公司运营一个大型公共云,包含北京、上海和西安三个计算中心,共拥有 80 万台服务器,构造出近 5000 万台虚拟机,主营业务是对外出租虚拟机(IaaS 云服务)。

中国慧献是一家全国性的集团公司,机构分布在中国各地,为了节约成本和快速部署应用,该公司向中国微算科技有限公司长期租赁 1 万台虚拟机,因而成为中国微算科技有限公司的最大租户。这 1 万台虚拟机由中国慧献集团内部的技术工程师规划成近 300 个局域网(VXLAN),每个局域网内的虚拟机个数相对固定,但是虚拟机运行的地点与使用虚拟机的员工紧密相关。

比如中国慧献员工郭淑敏在北京出差十天,她的虚拟机就在北京的云中心运行,等她返回上海后,虚拟机也将“漂移”到上海的云中心运行。这一切,对郭淑敏来说都是透明的,她只是感觉首次在北京登录云端时稍微慢一点,几分钟之后就很流畅了,首次在上海登录时也是如此。

不管在哪里,郭淑敏都是登录相同的IP地址,输入相同的账户和密码,然后看到自己熟悉的计算机桌面。是的,昨天编辑的 PPT 继续打开在桌面上,光标停在“公司今年的财务”处,郭淑敏继续输入“状况好于去年……”郭淑敏的虚拟机归口于财务部局域网,财务部局域网横跨北京、上海和西安云中心,这是一个典型的叠加网络案例。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

本文标签: 是指实时步骤动作程序