IT 人员经常与表示文件大小、数据载体的存储容量或进程的数据消耗的信息单位打交道。兆字节,或简称 MB,是一个经常出现的计量单位。但是,尽管经常使用,有时并不完全清楚它与千字节或千兆字节相比的大小比例是多少。在处理数字文本文件、图像和电子邮件附件时,了解 MB 的实际含义以及如何将其大小转换为其他常见的测量单位(如 KB 或 GB)是有帮助的。
兆字节(MB)是信息技术和数字技术中的一个标准单位,用于指定文件大小或数据存储介质的容量。这个术语是由希腊语 “mega”(百万)和 “byte “组成的。一个字节是计算机在存储和处理数据时处理的最小的数据量。但一个字节是由什么组成的呢?一个字节是由 8 个比特组成的,也称为二进制数字。这些构成了计算机之间二进制通信的基础。一个比特描述两种状态中的一种。”0″或 “1”。
如果你把几个比特结合起来,可以写入的状态的数量也会增加。一个字节,即 8 个比特,可以有 256(28)个状态。尽管如此,一个字节的大小刚好可以代表一个字符。这个例子表明,复杂的数字过程和表示方法需要大量的字节。为了保持更好的概览,字节因此被分组为不同的大小单位。根据十进制系统,一兆字节代表一百万字节。1MB 比 “1,000,000字节”容易写得多。
注意
虽然一个有 8 位的字节代表了最小的可寻址 IT 单元,但也有更小的单元的名称。一个半字节或小数点由 4 位组成,半个小数点,即 2 位,是一个二比特。
那么,什么是更大的:一个 MB 或一个 GB?KB 和 MB 之间的区别又是什么?在谈到数字存储单位时,总是会有一些混淆。千字节、兆字节和千兆字节的正确分类使我们更容易处理文件和存储载体。根据十进制系统,1 兆字节= 1,000 千字节,1,000 兆字节对应 1 吉字节。因此,1MB 明显大于 1KB,明显小于 1GB。然而,由于千字节、兆字节和千兆字节的前缀是基于十进制系统,而计算机使用的是二进制系统,这种转换并不准确。
国际电工委员会(IEC)找到了解决这个问题的办法。它引入了新的前缀,不是基于 10 的幂,而是基于计算机使用的 2 的幂。这些前缀是基于它们的十进制对应物,但被分配了音节 “bi”。因此,Megabyte 变成 mebibyte,gigabyte 变成 gibibyte,等等。因此,不使用转换数 1,000(103),而使用技术上正确的 1,024(210)。尽管如此,二进制前缀还没有流行起来。相反,旧的十进制前缀仍被广泛使用,但转换数字 1,024 更为精确。
几十年前,兆字节曾经是一个大数据量。如今,我们在各种数字技术中遇到的测量单位明显更大。下表显示了目前正在使用的数据容量,以及如何将其转换为其他存储尺寸。
储存单位 | 转换 | 以字节为单位的值 |
字节 (B) | = 8位 | 1 |
千字节 (KB) | = 1,024字节 | 1,0241 |
兆字节 (MB) | = 1,024 KB | 1,0242 |
吉字节 (GB) | = 1,024 MB | 1,0243 |
万亿字节 (TB) | = 1,024 GB | 1,0244 |
千万亿字节 (PB) | = 1,024 TB | 1,0245 |
百亿亿字节 (EB) | = 1,024 PB | 1,0246 |
十万亿亿字节 (ZB) | = 1,024 EB | 1,0247 |
一亿亿亿字节 (YB) | = 1,024 ZB | 1,0248 |
千亿亿亿字节 (BB) | = 1,024 YB | 1,0249 |
上表中的信息可能看起来相当抽象。为了让你更好地了解兆字节存储单位在数字媒体的日常使用中意味着什么,这里有几个例子。
在千兆字节和兆字节的时代,兆字节现在是相对较小的数据量。但情况并不总是这样的。1956 年,IBM 推出了第一台集成数据存储的计算机。在 35,000 美元的价格下,这个巨大的设备的存储容量只有 5MB。十年后,第一张存储容量高达 2MB 的软盘问世,这是数字技术的一个突破。如今,你几乎找不到一个存储空间小于 4GB 的 U 盘。
然而,这并不意味着 MB 作为一个计量单位已经过时了。虽然兆字节不再与数据载体的存储容量一起使用,但它们被用来表示文件大小。数字文件、图片、歌曲或演示文稿的大小通常在 MB 范围内。在移动设备上冲浪和其他消耗数据的行为时,数据量通常以 MB 表示。许多互联网用户也知道,例如,他们的邮件提供商限制发送超过 10 或 20MB 的单个附件。
目前,我们没有存储能力来容纳一个千亿亿亿字节。商业上可用的硬盘和具有大存储容量的计算机在太字节范围内运行。世界上所有的硬盘都无法存储 1 个千亿亿亿字节比特。当然,这将随着时间的推移而改变。千亿亿亿字节最可能的应用领域是物联网、人工智能、量子计算和传感器数据。智能家居和自动驾驶汽车可能将是第一批需要处理尧字节和千亿亿亿字节范围内数据的日常技术。