1 / 8
文档名称:

基于内容相关性的面向对象文件系统预取策略.pdf

格式:pdf   大小:535KB   页数:8页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于内容相关性的面向对象文件系统预取策略.pdf

上传人:碧痕 2022/8/10 文件大小:535 KB

下载得到文件列表

基于内容相关性的面向对象文件系统预取策略.pdf

相关文档

文档介绍

文档介绍:中国科技论文在线
基于内容相关性的面向对象文件系统预取策略1
OSD。每个对象由 MD5 算法(消
息摘要算法 5)映射到标识空间的一个值。之后,数据对象将被存储在相应的 OSD 中。


图 1 名字空间散布算法

3. 内容相关预取
在分布式面向对象的文件系统中,对象是分散分布的。根据上面提到的对象散布算法,
存储在单个 OSD 的数据对象,在逻辑上不一定是一个文件的连续部分。因此,传统对磁盘
相邻部分进行预取的策略不再适用。相反,我们要从不同的OSD 上预取逻辑相关的数据对象。
由于多个数据对象分布在多个 OSD 中,所以要想预取一些逻辑上相邻的数据对象需要在多个
OSD 上发起预取请求。因此,随着系统规模的增长,系统的网络压力就会显著的增长。为了
解决这一问题,本文提出一种“文件聚集”副本策略,将属于相同文件的对象以副本的方式
聚集在一起,因此,只需发起一个预取请求就可以完成一个批次的预取操作。
对象操作
这里并没有为每个 OSD 提供 RAID-1 [5],而是采用面向对象的副本机制。此外,我们根
据对象之间的相关性将其聚集起来。在这里,考虑“文件所属”相关性,即把在 OID 中具
有相同“fno”字段的数据对象进行聚集。注意,也可以利用其他相关性进行副本聚集。
我们对每个对象都制作并且维持一个副本,并且保证一个对象相同的两个副本存储在不
同的 OSD 上。为了方便说明,其中一个称为原始对象,另一个称为副本对象。原始对象将
按照第 2 部分提到的名字空间散列算法来对应 OSD;副本对象则利用文件标识(“fno”)
做 MD5 摘要来和 OSD 对应。由于属于同一个文件的对象具有相同的“fno”字段值,该文
件的副本对象将聚集在单个特定的 OSD 中,而原始对象会分布在其他的 OSD 中。对于一个
特定的文件,我们把存放它的副本对象的 OSD 称为该文件的副本 OSD 或者副本节点,把其
他的 OSD 成为该文件的原始 OSD 或者原始节点。

图 2 给出了正交散布的一个例子。其中 Xi 指代文件 X 的第 i 个原始对象,Xi’指代它的
副本对象。本例中,一共有 A,B,C,D 四个文件。注意,在 N