71muke 71muke

数据存储基本概念

一、数据存储的定义

数据存储是指在电磁、光学或硅基存储介质中保留数字信息的方法和技术的集合。

电磁存储主要针对的是:磁带、磁盘(机械硬盘)

image.png

光学存储主要针对的是:光盘

image.png

硅基存储主要针对的是:固态硬盘、U盘

image.png

通过使用计算机或其他设备运用记录介质来保存数据。

最常用的数据存储方式有文件存储、块存储和对象存储,每种存储方式都有不同的用途。数据存储的能力和容量通常当做软件系统或者数据中心能力的重要衡量指标。

(1)文件存储介绍

  • 存储形式:就像我们在电脑上看到的文件夹和文件的组织形式一样,文件存储是把数据以文件的形式存储在磁盘上,每个文件都有自己的文件名、扩展名和存储路径。例如,你在电脑上保存的一份 Word 文档、一张图片或者一个视频,都是一个独立的文件,它们被存储在特定的文件夹中,你可以通过文件管理器方便地查找、打开、复制、删除这些文件。

  • 应用场景:非常适合日常办公和个人使用,比如我们平时在电脑上编辑文档、保存照片、下载视频等,都是使用文件存储方式。在企业中,一些非结构化数据,如员工的办公文档、设计图纸、营销资料等,也通常采用文件存储,方便员工直接通过文件系统进行访问和管理。

  • 特点:文件存储的优点是易于理解和使用,符合人们对数据组织的直观认知,用户可以方便地对文件进行各种操作。但它在处理大规模数据时,性能可能会受到一定限制,而且对文件的并发访问支持相对较弱。


(2)块存储介绍

  • 存储形式:块存储把数据分割成固定大小的数据块,然后将这些数据块存储在磁盘上。可以把它想象成一个巨大的拼图板,数据被分成一个个小方块(数据块),每个数据块都有自己的编号和位置信息。这些数据块可以被单独读写,操作系统通过逻辑卷管理来组织和管理这些数据块,使得它们在逻辑上形成一个连续的存储空间,供用户使用。

  • 应用场景:块存储主要用于对存储性能要求较高的场景,如数据库系统、高性能计算等。因为数据库需要频繁地对数据进行随机读写操作,块存储能够提供高效的随机访问性能,满足数据库系统对数据读写速度的要求。

  • 特点:块存储的优点是读写速度快,能够支持大量的并发访问,适用于对存储性能要求苛刻的应用。不过,它的管理相对复杂,需要专业的存储管理知识,而且对于小文件的存储效率可能不高,因为每个数据块都需要一定的元数据来管理,会占用一定的存储空间。


(3)对象存储介绍

  • 存储形式:对象存储将数据看作一个个对象,每个对象包含数据本身、数据的元数据(如文件名、创建时间、文件类型等)以及一个唯一的标识符。这些对象就像一个个独立的 “包裹”,被存储在一个大规模的分布式存储系统中。对象存储系统通过对象的标识符来访问和管理这些对象,而不需要像文件存储那样依赖于文件系统的层次结构。

  • 应用场景:对象存储适用于存储大量非结构化数据,如互联网公司的用户生成内容(UGC),像社交媒体上的照片、视频、音频等,以及企业的备份数据、归档数据等。它能够轻松应对海量数据的存储和管理,并且具有良好的可扩展性,可以根据业务需求灵活地增加存储容量。

  • 特点:对象存储的优点是具有高度的可扩展性和灵活性,能够处理海量的非结构化数据,并且支持高并发的读写操作。同时,它的成本相对较低,因为可以利用普通的服务器构建大规模的存储集群。但是,对象存储对数据的访问方式相对复杂,不像文件存储那样直接通过文件路径访问,需要通过特定的 API 来操作对象



1. 数据存储是计算机信息交换的基础

数字信息在数据存储介质中有两种作用形式:输入数据和输出数据。最早的数据都是从计算机通过手动输入的,但是持续地手动输入数据会耗费大量的时间和精力

于是,RAM(随机存取器)的方案应运而生。RAM是与CPU直接交换数据的内部存储器,可以随时读写,而且速度很快,通常作为操作系统或其他运行程序的临时资料存储介质。随之数据的增加,采用RAM这一方式并不能满足复杂计算的需要。原因在于:首先,内存的存储容量和保留时间都非常有限,无法长期保存其次是RAM的每字节价格太高,尽管计算机内存技术取得了巨大进步,出现了动态RAM(DRAM)和同步DRAM (SDRAM),但这一技术仍受到成本高、容量小和无法长期保留等方面的限制。

ROM(只读存储器)虽然可以长期保存数据,但缺乏写入功能,所以只能当做诸如操作系统等几乎不改变的软件的存储介质。

image.png

  • 静态 RAM:常用于高速缓存(Cache),因为 Cache 需要快速响应 CPU 的访问请求,以提高数据的访问速度,减少 CPU 等待数据的时间,从而提高整个计算机系统的性能。

  • 动态 RAM:主要用于计算机的主存储器,即通常所说的内存。计算机在运行时,操作系统、应用程序和正在处理的数据都临时存储在主存储器中,DRAM 的大容量和低成本使其能够满足计算机对主存容量的需求。


2. 数据存储的方式

数据存储的工作方式是通过现代计算机(或称为终端)或网络连接到存储设备的。用户使用计算机访问存储设备中的数据,或将数据存储到设备。根据数据存储方式的不同,数据存储可分为直连存储(Direct-Attached Storage,DAS)、网络附加存储(Network-Attached Storage,NAS)、存储区域网络(Storage Area Network,SAN)。

image.png

1)DAS 

 DAS是最简单的存储类型:存储设备直接连接到主机设备。DAS设备可以由单个机箱中的多个硬盘驱动器组成,无须任何网络连接。以下是常见的DAS的连接方式:USB(通用串行总线)、SATA(串行高级技术附件)、eSATA(外部串行高级技术附件)、SAS(串行连接 SCSI)。

优点:最佳性能和最低的延迟。

缺点:不适合为多个用户或设备提供存储连接,并且可扩展性有限。

主要存储设备:硬盘、软盘、磁带、磁芯存储器、磁泡存储器

image.png


2)NAS 

NAS是一种文件级的数据存储解决方案通过网络提供存储服务。NAS 设备可以同时连接到多个用户或PC和服务器,而不会显著降低性能,是目前最受个人和企业欢迎的存储解决方案之一。

大多数NAS设备都以多设备(SSD/HDD)机箱的形式出现。NAS中的磁盘通常使用RAID阵列等冗余解决方案或SHR(Synology Hybrid RAID)等专有解决方案进行组合。大多数NAS设备支持从RAID1到RAID5的典型RAID配置,而更高级的NAS设备支持高级 RAID 配置,如RAID 50 和 RAID 60。

SSD指固态硬盘;HDD指机械硬盘。


image.pngimage.pngimage.png

典型的NAS解决方案使用SMB(Server Message Block) NFS(Network File System)等网络协议来提供跨网络的连接。

image.png

优点:NAS提供基于网络连接的存储服务,存储连接到网络,可以在几乎无限数量的主机之间实现轻松共享。大多数设备都支持集成额外的机箱来扩展存储,所以NAS可以轻松实现扩容。此外,由于NAS设备本身可以支持RAID配置,因此它们天然支持数据冗余方案。NAS设备便于配置,而且需要相对较少的维护。

缺点:NAS的性能严重依赖于网络性能,慢速网络会对 NAS 解决方案产生负面影响。此外,NAS 设备利用CPU、RAM等设备,这些设备升级潜力非常有限。如果设备面临性能问题,难以升级底层硬件

image.png


3)SAN

SAN是一种面向企业和数据中心的的高性能存储解决方案可提供对主机设备的块级存储访问。SAN是从在企业和数据中心提供可靠且可扩展的块级存储的需求演变而来的。在SAN之前,获得块级访问权限的唯一选择是使用连接到单独服务器的内部存储设备,它严重限制了可用的存储容量,或转向昂贵的多服务器系统。SAN通过允许用户的存储作为通过网络访问的独立设备解决了这个问题。

SAN提供了DAS的性能和NAS的灵活性,但同时也增加了配置和维护的复杂性。SAN 通常使用以下协议来实现主机和 SAN 解决方案之间的连接:SCSI(小型计算机系统接口)、ISCSI(互联网小型计算机系统接口)和光纤通道。

image.png

在商业应用方面, IBM、Dell EMC、Hewlett Packard Enterprise 和 NetApp 等公司积极提供 SAN 解决方案。虽然 SAN 还支持诸如RAID 的存储冗余选项,但它超越了简单的 RAID 配置,支持多阵列 RAID、缓存,甚至内置灾难恢复和备份选项。


 优点:SAN具有高可靠性、高性能以及高扩展性的优点。块级访问允许企业降低对本地存储的需求,并通过网络引导优化包括操作系统在内的环境,主机设备从中可以通过SAN访问所有存储。

与其他解决方案相比,SAN可以提供几乎无限的容量和可扩展性,原因在于可以将任意数量的SAN设备添加到应用级存储方案中。

缺点:高复杂性。即使是基本的SAN解决方案,实施和维护也很复杂,需要具有优化的高性能网络架构的专用硬件和软件解决方案才能达到最佳性能。




毕设系统定制、课程教学、问题1对1远程解答,可联系村长QQ:330168885

留言

发布留言

需要购买本课才能留言哦~

{{ item.createtime | dateStr }}
×