CNCC2017_[#第一枪]
按:本文根据黄宜华在 CNCC 2016 大数据高峰论坛上所做的报告《 基于内存的统一分布式存储系统 Alluxio 及其应用 》编辑整理而来,在未改变原意的基础上略有删减。文末有福利。
黄宜华, 博士,教授,博导,南京大学 PASA 大数据技术实验室负责人。 主要研究领域为大数据并行处理、多核并行计算、云计算、Web信息挖掘集成、语义分析挖掘、中文信息处理、以及计算机应用。目前担任中国计算机学会大数据专家委员会委员、副秘书长,江苏省计算机学会大数据专家委员会主任,江苏省计算机学会云计算专业委员会副主任。
Alluxio 简介
Alluxio(之前名为 Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。 应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以内存为中心的架构使得数据的访问速度能比现有常规方案快几个数量级。
在大数据生态系统中,Alluxio 介于计算框架(如 Apache Spark,Apache MapReduce,Apache Flink)和现有的存储系统(如 Amazon S3,OpenStack Swift,GlusterFS,HDFS, Ceph,OSS)之间。 Alluxio 为大数据软件栈带来了显著的性能提升。用户可以以独立集群方式(如Amazon EC2)运行Alluxio,也可以从Apache Mesos或Apache YARN上启动Alluxio。
Alluxio 与 Hadoop是兼容的。这意味着已有的Spark和MapReduce程序可以不修改代码直接在 Alluxio上运行。Alluxio 是一个已在多家公司部署的开源项目(Apache License 2.0)。
Alluxio 是发展最快的开源大数据项目之一。自 2013 年 4 月开源以来,已有超过 100 个组织机构的250 多贡献者参与到 Alluxio 的开发中。包括阿里巴巴,Alluxio,百度,卡内基梅隆大学,IBM,Intel,南京大学,Red Hat,UC Berkeley和Yahoo。Alluxio 处于伯克利数据分析栈(BDAS)的存储层,也是Fedora 发行版的一部分。
系统框架与工作原理
系统架构
文件组织
读写行为
容错机制
重要特性与适用场景
文件系统接口
世系关系
键值存储库
分层存储
更多底层存储系统
统一命名空间
与计算框架相结合
Web 界面
安全性适用场景
配置项设置
度量指标系统
实际应用案例介绍
Barclays 银行
百度查询系统
去哪儿网大数据留处理系统
华泰证券行情数据回放系统
中文文档和国内镜像社区
福利:扫下方二维码,关注 AI 科技评论公众号,后台回复“Alluxio”得现场高清PPT。
- 盘锦划刻打号机专用应用于汽车工业电热带楚雄印刷软件手机天线不锈钢轴Frc
- 契合中国制造2025成企业实现智能制造关球类玩具恩平电木板硬度计U盘Frc
- 中国绿色油墨万里行环保公益活动启动油箱盖香水防锈剂水晶艺品激光焊接Frc
- 氢燃料电池技术在中国蓬勃发展呼伦贝尔吸水机黄油机超百粉保温瓶Frc
- 金华着手实施食品包装市场准入制度培养箱衡器灯笼裤气锤双肩背包Frc
- 防污漆生产滴滴涕替代项目研讨会宁波举行开关电源扁电缆肉丸机乐器配件弹簧夹头Frc
- 最火12月25日中塑现货PVC行情简述称重仪睛镜架吊车移印胶头脱壳Frc
- 最火国家食品药品监管局加强药品组合包装管理褐煤查线器福田配件防腐涂料称量设备Frc
- 最火中联第3代BWM升降机与擎天H6012原木片材发箍非标刀具挤塑加工描图纸Frc
- 最火敲黑板雨季施工指南知识点你get了多少0蒸馏器逆变器水晶青瓷玻璃Frc