【摘要】 在数据和经济时代,业务和数据的多样性需要新的计算架构,海量的数据增长也带来了更高的计算需求。那么在这个过程中,鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务,致力于为智能世界持续提供我们的先进算力支持,使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为
文章目录
- 前言
- 一、开源大数据与鲲鹏多核结构渊源
- 1.1、海量数据处理的难题
- 1.2、大数据并行计算特点天然匹配鲲鹏多核架构
- 二、开源大数据整体与组件介绍
- 2.1、大数据组件:Hadoop-HDFS 模块
- 2.2、大数据组件:Hadoop-Yarn 模块
- 2.3、大数据组件:Hadoop-MapReduce 模块
- 2.4、大数据组件:Spark 平台
- 三、鲲鹏 BoostKit 使能套件介绍
- 3.1、鲲鹏 BoostKit 是什么?
- 3.2、开源使能:开源软件可用、好用
- 3.3、基础加速:超越业界水平的应用性能
- 3.4、应用加速:极致事务倍级应用性能
- 四、BoostKit 在开源使能上的结果
- 4.1、全面支持开源大数据
- 4.2、开源社区接纳 ARM 生态
- 五、鲲鹏 BoostKit 如何应对大数据关键挑战?
- 5.1、遇到的问题
- 5.2、如何应对关键挑战?
- 六、BoostKit 机器学习/图算法的深度优化
- 6.1、算法深度优化实例
- 6.2、鲲鹏算法库
- 七、BoostKit 做了哪些深度优化?
- 7.1、鲲鹏亲和性优化效果
- 7.2、机器学习算法优化方案:分布式 SVD 算法
- 7.3、图分析算法优化方案:分布式 PageRank 算法
- 八、鲲鹏 BoostKit 机器学习&图算法的 Spark 性能加速实践
- 8.1、环境准备
- 8.2、环境配置
- 8.3、部署 Hadoop、Spark 等组件
- 8.4、算法库优化效果运行实践
- 8.4.1、运行 SVD 算法
- 8.4.2、运行 PageRank 算法
- 九、相关材料获取
- 9.1、鲲鹏 BoostKit
- 9.2、机器学习算法加速库
- 9.3、图算法加速库
- 总结
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
喜欢就支持一下吧
相关推荐