1 网格的数据管理
1.1 网格数据 【程序编程相关:Gentoo对SPE升级】
数据是网格中的一种重要资源,具有可复制.可移动.可压缩.可加密等特性.网格上许多数据的数据量非常大,且通常为分布式存储,需要专门的管理机制来管理网格上的数据,如数据传输.数据存储.副本管理等. 【推荐阅读:Fedora对lynx中的漏洞升级】
(1)网格中数据的量是巨大的 【扩展信息:Gentoo对koffice/kword】
网格数据也是一种资源,但这种资源与其他网格资源相比,具有一些与众不同的特点:
网格计算,特别是数据密集型的众多科学与工程计算,通常会需要处理大量的数据,如美国宇航局的卫星每天都将处理与生成超过2tb的数据,全球气候变暖模拟实验也产生tb数量级的数据.另外,对于追求高精度的网格应用,如天气预报的计算.大型仿真计算等,为了提高计算问题的精度,就需要处理更大的数据量.
(2)数据资源是网格应用或程序之间联系的纽带
网格应用领域中的程序需要访问与产生大量的数据,不同的程序之间也需要传输大量的数据,以实现信息的交互与协调的工作.以天气预报为例,原始的数据来自各个地区观测台的实时观测数据以及某个数据中心的历史天气信息,它们经计算中心处理加工后,形成未来天气的预报信息,该信息数据再由发布系统发布给用户,如电视台.专业网站等.贯穿此过程的就是数据资源,包括实时观测数据.历史数据.预报数据,它们将观测系统.处理系统.发布系统联系起来,构成完整的天气预报网格应用.
(3)数据资源具有可无限复制的特点
只要通过合法的用户请求,网格数据资源就可以被复制成指定的多个备份.例如一份数字地图的数据,可以复制给多个使用者;或者是一类商品的类型.价格.销量等信息,可以在厂家.代理与销售商之间复制与同步.而其他类型的网格资源则不一定具有可复制的特点.例如硬件资源就无法复制,操作系统.应用软件及其许可证(license)也不应该被复制.
(4)数据资源具有特殊的存储机制
网格中的数据资源可以创建多个副本,并存于不同的地方,用户请求该数据时,网格管理机构在原始数据与多个备份之间选择合适的数据副本供用户使用.一个数据集也可以是地理上分布的,即一个数据集的多个部分存放在不同的地方,但对用户而言,看到的还是一个完整的数据集,请求使用时当作一个资源来请求,网格管理机构将分散的数据部分合理地组织起来交给用户使用.... 下一页