Page 29 - BP202004
P. 29

系统资源现在正在被分离,允许它               出连接到总线的设备的I/O的相互依赖,                还不止于此
           们独立地扩展并转换为服务,而不是以                 了解PCIe解决方案集的真正含义可能很                   AMD在2019年CES上宣布,它将
           前对待它们的方式。那些依赖于“共享存                复杂。计算PCIe带宽可能更具挑战性,                是第一个在企业或桌面(客户端)级
           储”模式的人正在发现,存在I/O(输入/              特别是在出现像千兆传输(GT/s)这样                别支持PCIe 4.0的公司。具有讽刺意味
           输出)性能不足且延迟过大(即吞吐量边                与速率和速度(如GHz)互换的新术语                 的是,在今年5月,PCIe  5.0规范(提供
           界),难以满足新要求的情况,网络接口                时。我们将从更简单的角度提供一些关                  的带宽是PCIe  3.0的4倍)甚至在第4代
           和服务器以及存储器也有同样的情况。                 于PCIe演化的介绍性信息,而不是查看                (PCIe 4.0)发布之前就已经发布了。
               基于闪存的设计从问世到现在已经               每代PCIe的详细信息。                          这能走多远?为什么当第五代基本
           过去了20多年,在串行数据I/O和传输                   使用PCIe连接的平台不断增加,               上具有100GbE(千兆以太网)连接的
           方面达到了一个峰值。简单地用SSD取                从第1代(24通道)到第2代(36通道,               带宽(相当于每秒大约63GB,16倍速)
           代硬盘驱动器,然后在传统的SAS(串                                                   时,还要继续发展?当然,家庭用户不
                                             带宽增加了一倍),到第3代的每通道
                                                                                需要这些值,甚至企业用户也可能质疑
           行连接SCSI)或SATA(串行ATA)接
                                             1GBps的I/O性能。
                                                                                这一命题,特别是考虑到他们连接的
           口上微调性能,已不再有效。
                                                 通道是一种数据传输链路,它由两
                                                                                SSD的限制和交换设备的成本(不管成
               当前,最新的技术是非易失性存储
                                             对线组成——一对用于传输,一对用于接
                                                                                本不断降低)。
           器主机控制器接口规范(NVMe),这
                                             收。消费PCIe插槽可以是1、4、8或16通
           是一个可扩展的主机控制器接口,与存                                                       这些数据速率指数增长的一个演进
                                             道。数据包以每周期1比特的速度穿过通
           储协议耦合,加速客户端和/或企业系                                                    场景是“始终开机”(相对于“始终联
                                             道。1个链路(一个通道)每个方向每周
           统之间的数据传输,这些系统使用基于                                                    网”)的计算平台级场景,这种场景正
                                             期传输1比特(因此每个方向两条线乘以
           高速PCIe(高速串行计算机扩展总线标                                                  悄然成形,由于电池寿命的预期,“始
                                             2)。双链路(两个通道)使用8条线,每                终开机”模式似乎在竞争中处于领先地
           准)的固态硬盘(SSD)。
                                             个方向(每周期)同时传输2比特。随着
                                                                                位。对于媒体和娱乐业,例如那些惯常
                                             PCIe迭代,这些数量不断增加。                   创作UHD/4K内容的机构,存储刷新现
           命令和队列
               至少有两个主要因素影响S S D性
           能——命令和队列。传统的SATA设备通
                                              每秒传输
           常在一个队列中最多支持32个命令;SAS               每通道数据率
           设备在一个队列中最多支持256个命令。                编码
                                              开销
           下面简要介绍这两种结构的工作原理:
                                              1倍速
               根据预期的工作量和系统配置,主                16倍速
           机软件将根据控制器支持的最大值,建立                         **所有速度都是单向,总带宽加倍
           “队列”(可用位或插槽)。通常,这是
                                              图2 在没有NVMe的情况下,数据率和速度方面PCIe的相对演进。
           由核心处理器控制的,并且在数量上受到
                                                                                在可以占用更少的空间,耗电和冷却要
                                                 作为PCIe一代和二代采用8b/10b
           限制,以避免锁定,并确保根据核心处理
                                                                                求更低,并比以前的存储解决方案集提
           器的缓存无障碍地创建数据结构。                   编码,导致20%的性能开销。编码将8位
                                                                                高了数倍的性能。
               一个循环缓冲区,即具有固定插槽               数据集转换为10位字符集,因此每个通
           大小的提交队列(SQ),被主机用来提                道250MBps带宽只能传输200MBps。
                                                                                新兴的协议
           交控制器执行的“命令”。每个SQ条目                当使用来自千兆字节带宽数中的千兆传
                                                                                   当前的存储系统的发展基于最新的
           都是一个命令。完成队列(CQ)是另                 输参数时,这些数字有一个不均匀的变
                                                                                NVMe协议。将NVMe与多核处理器结
           一个具有固定插槽大小的循环缓冲区,                 化,这在一个图表中被很好地呈现,反
                                                                                合使用有助于消除单独的传统接口所遇
           用于公布完成命令的状态。队列的数量                 映编码、传输和速度的关系,用于比较
                                                                                到的瓶颈。NVMe为高速访问存储媒体
           因应用而异——企业应用队列数从16到                (图2)。
                                                                                带来了高度可扩展的新功能,这反过来
           128,而客户端队列数量仅为2到8个。                   支持第2代的S S D有八通道,在
                                                                                又为包括媒体、视频制作和后期制作在
           两者的块大小都是4kB(采用NVMe协               3GBps上传输;第三代接口的速度提高
                                                                                内的数据驱动市场带来了更大的增长。
           议4kB以上)。                          一倍,单个设备的速度达到6Gbps。编
                                                                                   当你处于更新模式或考虑转到UHD
                                             码现在是128b/130b,导致仅1.5%的开
                                                                                制作时,可看看包含NVMe的存储解决
           换道和千兆传输                           销。延迟也降低了,而且还可以直接连                  方案,特别是那些再利用现有SSD(你
               考虑到各种各样的接口机会以及进               接到芯片组或CPU。                         可能已经拥有)的存储解决方案。B&P
                                                                                                              29
   24   25   26   27   28   29   30   31   32   33   34