2

存储技术发展过程

 2 years ago
source link: https://www.cnblogs.com/rickiyang/p/15466594.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一直想写一下存储的发展,从用乌龟壳记录文字到我们造出来纸笔书写语言这其中有无数人在推动文明的发展。汉语或者英语都是文化的延续,最终的目的是让人读懂。如何将这些文化存储起来的问题,从龟壳,竹简,纸到如今的电子化设备每一个记录工具的发展都是一段有趣的故事。我们一起走进存储的世界。

从保存声音开始#

发条音乐盒#

每一个孩子的幼年都离不开一个发条音乐盒,妈妈哄睡觉的神器。严格来说发条音乐盒并不属于存储的范畴,拿到这里来说,是因为这个工具在孩童时会让我们以为音乐盒里存储了一首歌。

1607781-20211026164435865-1495381674.png

音乐盒的组成有最重要的3个部分:

​ 动力源(发条)、芯片(弹簧片)、滚筒

最最重要的就是滚筒:

1607781-20211026164445703-4207483.gif

你能看到上面一个个斑斑点点,它的作用就是流动的音符,通过预设的音符刻在滚筒上,弹簧片在滚筒滚动时摩擦上面的凸起处发出声音。所以你可以把滚筒理解为一段音符的存储器皿。就这么个小小的零件,当你上满发条之后就能播放一段美丽的音乐。

你可以把它当做歌曲播放器的雏形,正因为有前人的创意才有后继者用新时代的技术继续发扬光大。

爱迪生这个“大灯泡”一辈子几乎大部分时间都泡在实验室,研究电话和电报机的时候无意之中发现了记录声音和回放声音的秘密,在这之前人类从未踏足保存声音这个领域。

最先发明的是圆筒式机械录音,圆筒式机械录音是纵深式录音,圆筒中间有一根螺丝作轴,用手摇引轴时圆筒会从一端移动到另一端,圆筒表面塗有胶蜡,胶蜡上面有一根录音刻针,与声膜相连,声膜连着喇叭口。

1607781-20211026164455919-76471569.png

对着喇叭大声说话,声膜振动带动刻针在圆筒胶蜡上滑动,圆筒随转而移动就随说话声音刻上深浅不同的螺旋声纹。放音时先退回原位,摇动转轴刻针在声纹里随着振动,带着声膜从喇叭发出说话声。

为了能很好录音,录音时必须大声说话。圆筒胶蜡在较高温度下,接近熔化。放音时要冷都低温。这是没有电子放音机技术制作的最早的留声机。所以最开始的留声机限制于记录声音的材料导致声音不清晰。

1887年,爱弥尔·柏林纳制造了一种新型留声机。它的特点是,用圆盘形的唱片代替了大唱筒,唱片用两个手摇转轮带动。这种唱片留声机与唱筒留声机相比性能有了明显提高,是现代电唱机的雏形。

1607781-20211026164505659-1604219147.png

​ 手摇圆盘唱片式

记录声音的材质一直在发展,从一开始爱迪生使用的的锡箔纸到蜡筒:

1607781-20211026164514523-986082946.jpg

从蜡筒到圆盘式唱片的鼻祖-78转虫胶唱片:

1607781-20211026164534395-1677195027.png

78转虫胶唱片很重、很硬,但很脆弱,在运输、使用过程中极易破损。这使得它用来记录声音的凹槽数量十分有限,一旦刻纹变多就容易损毁。所以78转虫胶唱片一面最多只能刻录4-5分钟的音乐,大部头的古典乐压根没有办法完整记录下来,总是在精彩的乐章中断。这才使得唱片公司将目光瞄准后来出现的人工合成材料——聚氯乙烯,也就是如今常见的PVC塑料。

材料的变化让记录的声音越来越清晰,越来越长。电机替代了唱片机上的手摇杆,再也不用专人在机器边上守着上发条。

进入电气时代#

磁带机#

我们说的磁带、磁盘都属于磁存储的范畴,磁表面存储器是在不同形状(如盘状、带状等)的载体上,涂有磁性材料层,工作时靠载磁体高速运动,由磁头在磁层上进行读写操作,信息被记录在磁层上,这些信息的轨迹就是磁道。磁盘的磁道是一个个同心圆,磁带的磁道是沿磁带长度方向的直线。

磁存储器通过磁头和记录介质的相对运动完成读写操作。写入时,记录介质在磁头下方匀速通过,根据写入数据的要求,对写入线圈输入一定方向和大小的电流,使磁头导磁体磁化,产生一定方向和强度的磁场。由于磁头与磁层表面间距非常小,磁力线直接穿透到磁层表面,将对应磁头下方的微小区域磁化(叫作磁化单元)。可以根据写入驱动电流的不同方向,使磁层表面被磁化的极性方向不同,以区别记录 0 或者 1。

电气时代的存储和“原始”时代有本质的区别,存储 01 要比存储原始刻录简单的多,所以这时候的存储设备也逐渐变小,但是容量反而递增。比如一个 4mm 宽的磁带:

1607781-20211026164546248-886571528.png

数据传输的速度约在 ~150 kB/s, 到 ~500 kB/s 之间,可存储 空间从 1.3 GB 到 2.0 GB 之间,硬件压缩可使空间加倍。

磁带发展之初我们主要用来录音,因为烧录磁带的过程是让磁带绕线圈不断旋转以拉取后面未烧取的部分,所以磁带这种存储工具不具备随机存储的特性。在时代的洪流中虽然它不能提供快捷查找,但是对于冷数据的场景它非常适用。

如今的磁带技术不仅没有因为时代发展而摒弃反而发展的相当瞩目。在 2018 年发布的 IBM 3592 数据磁带 使用 TS1160 格式最大未压缩容量可达 20TB,而读写速度也可以达到 400MB/s,均超过现在的硬盘。

1607781-20211026164604372-624989325.jpg

像博物馆、科学研究的历史数据、地址勘探的数据这些需要保存但又不经常使用的数据使用磁带来保存就非常合适。价格比同级别的硬盘便宜,不占空间,适合存储。

能动的画面-胶片

声音的记录我们已经没有什么问题,接下来到了画面的保存。这又是一个历史性的时刻。

胶片的诞生要迟于照相机的发明。早在 1826 年,世界上第一架照相机便出现了 - 它由 17 世纪的一种便携式绘图仪器的暗箱脱胎而来,看上去有些笨重。聪明的法国人尼埃普斯对暗箱作了一番改造,加上镜头、光圈和毛玻璃,就制成了照相机,并在室外花了八个小时曝光,拍下了世界上第一张照片。他给它取了个好听的名字,叫“日光绘画”。

1607781-20211026164612268-1164505780.jpg

这块宽20厘米、高16.5厘米的锡版,是尼埃普斯拍摄的人类第一张存世照片《窗外风景》,现存于哈里·兰瑟姆中心。(图片来盖蒂博物馆)

当时使用的锡板成像曝光时间太长,并且成像质量也不太清晰,一位叫做达盖尔的设计师通过银盐来感光,在曝光后用水银蒸气冲洗出潜在的影像,这种方式可以大大缩短曝光时间。成像之后使用硫代硫酸钠定影液,即大苏打或称“海波”,这样洗出来的照片可以留存很久的时间。

生化材料的发展也给处于不同历史时期的人提供更多思路支撑,1851年英国人阿彻发明的火棉胶湿版法摄影工艺,采用玻璃作为片基,并在上面涂上蛋清、碘化钾以及氯化钠的混合液。

11.jpeg

上图:美国总统林肯肖像的玻璃湿版转成正像。
下图:1864 年2月9日摄影 师 安 东 尼· 伯berger)利用玻璃湿版拍摄的林肯肖像原版。(上下图片均 来 自Abraham Lincon at Gettysburg)

玻璃处于湿润的状态下曝光和显影,因此摄影师外出拍摄时,必须携带着遮光的帐篷、化学药品、玻璃片、笨重的支架以及一壶水,全套装备通常是整整一马车。

在随后的 20 年里,一项更伟大的发明诞生了:胶卷。

主要得益于在此前之前诞生的干版工艺,这种摄影工艺是英国人马多克斯在1871 年发明出来的,全名为溴化银感光乳剂玻璃干版工艺,它让摄影师解脱了湿版操作的麻烦。

1879年,美国纽约一位年轻的银行职员乔治·伊斯曼计划购买一套相机外出旅行,那个时候玻璃干版摄影工艺还没有在美国普及,市场上能买到的只有笨重且麻烦的湿版工艺。伊斯曼在学习使用这套设备期间产生了困惑:假如带着它远足,一路上还有什么乐趣呢!于是他下决心研究更加方便的摄影方式。伊斯曼偶尔在一本英国摄影杂志上读到了关于玻璃干版的介绍,这给他带来了很大的启发。1880 年 4 月,伊斯曼辞去银行职务,在罗彻斯特市创业,开始研制照相干版。尽管干版比湿版方便了不少,但伊斯曼并不满意,因为玻璃沉重而且易碎,也不易携带。1884 年,伊斯曼就尝试用纸张代替玻璃作为片基,制造出可以卷起来的纸基胶卷。后来他又开始尝试用透明的赛璐珞代替纸张作为片基。1888 年,伊斯曼对外正式宣布,他已经制造出可以卷起来的新型“伊斯曼胶卷”,这就是一直通用至今的标准透明片基胶卷。

至此,人类对于声音和画面的存储已经完成,从刀耕火种时代到数字化时代,我们一直在不断进步。

光盘#

电气化临门一脚直接让我们的信息量几何倍数递增,存储当然也不能落后。01表示的电子正负极称为数字存储的基石。二进制编码作为数字化存储的底层编码必然要求所有的存储设备都以利于二进制存储的状态出现。

我们想一下我们用什么形状的容器来装这些二进制数据,我们假设用一个方形的容器来存储二进制数据,是不是感觉很怪,当你的探针移动到右边界之后还需要先走回来到左边界才能开始下一行的读取,这很浪费时间。

1607781-20211026164649765-169565923.png

所以存储容器的选择最好是让容器转动而探针不动。符合这个特性的容器也就只有圆形。

1607781-20211026164658910-115882534.png

有了容器我们就得想办法把二进制数据放上去。光盘是用极薄的铝质或金质音膜加上聚氯乙烯塑料保护层制作而成的,表面有很多级细的凹凸不平的数据轨:

1607781-20211026164828642-1503538644.gif

这些数据轨就是我们在光盘上烧录的数据,它里面的数据轨单位以微米记。所以你如果想用针戳,恐怕是做梦。

想要读取光盘上面的这些数据你需要用聚焦的氢离子激光束打到光盘表面通过记录槽的长短不同来判断是 0 还是 1。

常见的刻录光盘主要有3种:CD、DVD 和蓝光光盘。普通的 CD 光盘的容量大概为 700M,DVD 的容量最大为 17G,而蓝光光盘单层最大能存储 27G,如果是多层的话,最大能达到400G。

TF卡和闪存技术#

半导体芯片的发展又加速了存储技术的发展。光盘少说直径有 15cm,而使用半导体芯片作为介质存储则可以把体积缩小到 1cm。不仅便于携带,因为它没有机械结构,不怕碰撞,没有噪音。基于电擦写方式可以做到比传统机械读写快很多倍的速度。

唯一的缺点就是价格比较贵!

常见基于闪存技术出现的 产品有 TF 卡,SD 卡。

1607781-20211026164852205-420997220.jpg

1607781-20211026164926836-974764076.png

闪存技术的底层实现又是什么呢?那就是三极管。

1607781-20211026164903935-1486741126.jpg

我们知道三极管具备导通和不导通两种状态,这两种状态可以用来表示数据 0 和数据 1,因此利用三极管作为存储单元的三极管阵列就可作为存储设备。栅极与硅衬底之间有二氧化硅绝缘层,用来保护浮置栅极中的电荷不会泄漏。采用这种结构,使得存储单元具有了电荷保持能力,就像是装进瓶子里的水,当你倒入水后,水位就一直保持在那里,直到你再次倒入或倒出,所以闪存具有记忆能力。

上图我们看到闪存技术采用的浮珊场效应管跟普通的不一样,它有两个珊极。

闪存技术是采用特殊的浮栅场效应管作为存储单元,它具有两个栅极,一个如普通场管栅极一样,用导线引出,称为“选择栅”;另一个则处于二氧化硅的包围之中不与任何部分相连,这个不与任何部分相连的栅极称为“浮栅”。通常情况下,浮栅不带电荷,则场效应管处于不导通状态,场效应管的漏极电平为高,则表示数据1。由于选择栅加有高电压,在电场作用下,这些电子又通过二氧化硅层到达浮栅,并在浮栅上形成电子团。浮栅上的电子团即使在掉电的情况下,仍然会存留在浮栅上,所以信息能够长期保存。擦除时,源极加上较高的编程电压,选择栅接地,漏极开路。根据隧道效应和量子力学的原理,浮栅上的电子将穿过势垒到达源极,浮栅上没有电子后,就意味着信息被擦除了。

闪存带最小存储单元是晶浮栅晶体管,对应于磁盘中的一个 bit 的存储单元,难以想象这么大点的TF卡里面到底有多少晶体管!

闪存卡发展之初是为了支撑便携式设备的存储,1997 年推出的卡种只有128M,现在 SDXC 格式的存储卡目前最大容量能支持 64G,理论容量能支持 2TB。

硬盘#

终于说到了目前存储的终极形态:磁盘。同磁带一样都是基于电磁效应,当闭合电路内的磁场发生变化(磁通量变化)时,闭合电路内会产生感应电动势。即闭合电路内磁场的变化会使电路内产生感应电流。 电流的方向与磁极方向有关。

绝命毒师第五季第一季中,记录着老白制毒过程的笔记本电脑被警方获得并放到了物证室里。老白利用电磁效应,在物证室外弄了一个大‘磁铁’破坏了笔记本里面的数据,就是上面的原理。

硬盘主要由碟片、磁头、电机马达、接口和控制电路控制芯片组成。

磁头是一个外面被线圈缠绕着的 U 型磁芯,可以看出当磁头通电时便会产生磁场,磁场的方向随电流方向的变化而变化。

磁头在读取数据时不与盘片接触,但是又要越近越好,因为太远无法感应到磁粉的极性,这个距离现在已经可以做到人类头发丝的千分之一,肉眼看上去是挨着的实则还有亿点点距离!

当给磁头施加不同的电流方向时,使磁盘局部产生不同的磁极,产生的磁极在未受到外部磁场干扰下是不会改变的,这样便将输入数据时的电信号转化为磁信号持久化到磁盘上。在磁盘读取时,磁头就相当于一个探测器,其“扫描”过磁盘面的各个区域时,各个区域中磁颗粒的不同磁化方向被感应转换成相应的电信号,电信号的变化进而被表达为 “0” 和 “1”,成为所有数据的原始译码。通过这种双向的电磁感应作用便完成了磁盘数据的记录和读取。

碟片的表面涂有磁性材料,厚度一般在 0.5mm 左右。碟片安装在主轴马达的转轴上,工作时碟片在主轴马达的带动下高速旋转。

盘片有电机带动做高速旋转,常见的转速为 7200 转/分,就是指盘片每分钟转过的圈数。这样磁头就相对盘片做圆周运动,也就能够按磁道来读取数据。除此之外,磁头的机械臂还由步进电机控制,沿盘片半径做直线运动,以读取不同磁道的数据。一块磁盘拥有多个盘片,每个盘片的上下面都可以读写数据,而且每个盘面都有对应的磁头读写。例如,如果一块磁盘有4个盘面,那么磁头就有8个,分别编号 0-7。虽然有多个磁头在工作,但是同一时刻只能有一个磁头在读写数据。 在整个数据的读取过程中,机械臂的移动称为寻道,寻道的时间和盘片旋转的时间远大于半导体电路的数据传输时间,是阻碍磁盘读写性能的最大因素。

盘片这么大,数据的存储是怎么做到定位的呢?肯定是不是满盘片跑吧!硬盘的设计者把一个盘片如同切西瓜一样切成很多块,每一块被叫做扇区。

扇区是磁盘的最小逻辑存储单元。早期每个扇区的大小被设定为 512 kb,现在随着 Cache 的发展,扇区大小也被标定为 4096 kb。 数据存储到扇区之后的寻找数据又是什么样的过程呢?

在早期软盘和硬盘的寻址方式被称作「柱面-磁头-扇区寻址」,简称 CHS 寻址, 是因为这三个参数是软件交给硬件定位到某个具体扇区单元时使用的参数。 首先柱面参数让磁头臂移动到某个半径上,寻址到某个柱面,然后激活某个磁头,然后随着盘面旋转, 磁头定位到某个扇区上。

这种寻址方式带来的问题是,由于要求每个磁道的扇区数相等,而外道的周长要大于内道,所以外道的记录密度要远低于内道,不仅造成了硬盘空间的浪费,也限制了硬盘的容量。柱面和扇区数是固定的,那么这就决定了 CHS 的最大寻址范围:

​ 255 * 1023 * 63 * 512 / 1048576 = 7.837 GB ( 1M =1048576 Bytes )

根据摩尔定律,硬盘存储的密度越来越大原有的 CHS 映射方案已经不能解决最大寻址范围问题,所以硬盘厂家引入了逻辑区位寻址的方案即 LBA,操作系统和文件系统直接寻址一个连续地址空间中的扇区号, 不再关心柱面和磁头之类的物理参数,将这些物理细节交由磁盘控制器。 对操作系统和文件系统这些上层软件而言,LBA寻址的抽象仍然保证了 连续读写提供最快的读写速度 ,文件系统仍然会尝试根据 LBA 地址优化,尽量连续读写从而减少寻道时间。

如今的硬盘只有巴掌大一点,那你知道一开始硬盘是什么样子的嘛,可能会颠覆你的认知:

没错,就是这么大,一个盘片能大过你的脸!

虽然看着这么巨无霸,但是早起硬盘同现在的机械硬盘的运行原理并无不同,只是存储材质的进步使得单位存储密度得到提升。

硬盘技术发展到现在,存储密度的提升,存储材质的提升都对存储容量和读写速度产生了巨大的改变。除了传统的机械硬盘外,最新的硬盘科技还有 SSD,固态硬盘。在固态硬盘里面,闪存颗粒则替代了机械磁盘成为了存储单元。前面我们说 TF 卡的时候已经说过闪存,体积小、存储速度快是他的优点。当然弱点就是价格贵!

目前行业内单数据盘最大能支持 32 TB,硬盘厂商 Nimbus Data 推出 ExaDrive DC100 系列固态硬盘,最大容量100TB。放在现在这也是一个巨大无比的容量,够你把所有的岛国小姐姐都放进去。

最后未被破解的存储之谜:人脑#

我想没有什么比人脑这种存储介质更为神奇的。宇宙中最超凡的东西就在你的头颅里,哪怕你穿梭于外太空的每一寸说不定都找不到任何比你颈脖之上这团如海绵般柔软的东西更为复杂、神奇的东西。

初始化的大脑就像一团黑暗,寂静的云,它从未有任何修饰,也未有任何感觉。从你面世的那天起,你看到了什么,听到了什么,做过了什么,都会在大脑中记忆,存储,转化。它不断地给你提供搜索能力,整合能力,逻辑推理能力,预测能力,甚至是未知的能力。

光静静地坐着什么都不做,你的大脑在 30 秒内处理的信息就超过了哈勃望远镜 30 年的工作量。一块 1 立方毫米的皮层就能容纳 2000TB 的信息。

那拿当前最先进的电脑来说如果问你这是谁,虽然这是张卫健扮演的,但你还是会说这是孙悟空。就这一点来说,电脑也无法在这么快的时间内做出如此迅捷的反应。

这是目前做的最强大的仿真机器人,它也无法完全模仿人所有的动作机能。比如在泡脚的同时背单词和吃东西。

比如这样的一幅美景,如果你是在现场看风景,在你的眼里大概有几亿像素,可能比你看过最清晰的电影还要清晰几百倍。像这样的画面你每天要看几个小时,换成二进制存储每天最少就是TB级别的数据。而大脑能不间断存储几十年,自动压缩,去重。能随机提取,按场景提取,按特征提取。。。如果要用机器来实现,可能你需要祭很多个程序员耗费数千万资金才能实现这些功能。

重点不是人脑有这些功能,而是人能很轻松的同时去运用这些功能。如果让人类当前创造的机器来做同样的功能,那估计的把 CPU 跑爆也不一定能实现。

人类神经感知元的操作是层层传递的,比如我们的手破了一层皮:

  • 如果你的眼睛看到了手破皮,大脑会给出反馈破皮了然后告诉你疼,你会产生疼的反应。
  • 如果你的眼睛没有看到的前提下,可能是真的疼触发了手部的神经元进而告诉大脑疼,然后你的眼睛转向手部看到破皮了。

试想这些操作如果用人类的程序来模拟实现代码量是巨大的,但是对于人本体来说你不会有什么负担,这就是你作为人本来就应该会的技能。

最早神经科学家 David Hubel 和 Torsten Wiesel 对猫的视觉神经系统的研究证实,视觉特征在大脑皮层的反应是通过不同的细胞达成的。其中,简单细胞(Simple Cell)感知光照信息,复杂细胞(Complex Cell)感知运动信息。受此启发 1980 年,日本学者福岛邦彦(Kunihiko Fukushima)提出了一个网络模型“神经认知机(Neocognitron)。用以识别手写数字。这种网络分成多层每层由一种神经元组成。在网络内部两种神经元交替出现,分别用以提取图形信息和组合图形信息。这两种神经元到后来演化成了重要的卷积层(Convolution Layer)和提取层(Pooling Layer)。但是这个网络的神经元都是由人工设计而成,其神经元也不会根据结果进行自动调整,因此也就不具有学习能力,只能限制在识别少量简单数字的初级阶段。

1994年,计算机科学家Yann LeCun在Geoffrey Hinton组内做博士后期间,结合神经认知机和反向传播算法,提出了用于识别手写邮政编码的卷积神经网络LeNet,获得了99%的自动识别率,并且可以处理几乎任意的手写形式。这一算法在当时取得了巨大的成功,并被应用于美国邮政系统中。

尽管如此,深度学习并没有因此而热门。原因之一,就是神经网络需要更新大量参数(仅2012年提出的AlexNet就需要65万个神经元和6000万个参数),需要强大的数据和算力的支持。

所以现如今的神经科学并没有发展,发展最多的还是深度学习和机器学习方向,我们的重心从人脑的延期方向转到目前更加切近生活实际的领域,图像识别,医学领域,声音识别,自动驾驶等等。都是从基础领域入手,一点点模仿人的行为。相信等到材料学下一次巨大进步的时候,我们能够实现真正的”机器人“!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK