基于Hadoop的小文件存储优化方案
李孟 曹晟 秦志光 · 2016
收藏
阅读量:180
期刊名称:
电子科技大学学报   2016 年 01 期
摘要:
Hadoop作为成熟的分布式云平台,对较大的文件提供了可靠高效的存储服务,但在处理海量小文件时效率显著降低。该文提出了基于Hadoop的海量教育资源小文件的存储优化方案,利用教育资源小文件间的关联关系,将小文件进行合并成大文件以减少文件数量,并索引机制访问小文件、元数据缓存和关联小文件预取机制来提高文件的读取效率。实验结果表明,该方法提高了Hadoop文件系统存储小文件的存取效率。
相关专家
相关课题