【云驻共创】“大鹏一日同风起”Kunpeng BoostKit 使能套件如何实现大数据场景倍级性能提升?

【摘要】 在数据和经济时代,业务和数据的多样性需要新的计算架构,海量的数据增长也带来了更高的计算需求。那么在这个过程中,鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务,致力于为智能世界持续提供我们的先进算力支持,使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为

文章目录

  • 前言
  • 一、开源大数据与鲲鹏多核结构渊源
    • 1.1、海量数据处理的难题
    • 1.2、大数据并行计算特点天然匹配鲲鹏多核架构
  • 二、开源大数据整体与组件介绍
    • 2.1、大数据组件:Hadoop-HDFS 模块
    • 2.2、大数据组件:Hadoop-Yarn 模块
    • 2.3、大数据组件:Hadoop-MapReduce 模块
    • 2.4、大数据组件:Spark 平台
  • 三、鲲鹏 BoostKit 使能套件介绍
    • 3.1、鲲鹏 BoostKit 是什么?
    • 3.2、开源使能:开源软件可用、好用
    • 3.3、基础加速:超越业界水平的应用性能
    • 3.4、应用加速:极致事务倍级应用性能
  • 四、BoostKit 在开源使能上的结果
    • 4.1、全面支持开源大数据
    • 4.2、开源社区接纳 ARM 生态
  • 五、鲲鹏 BoostKit 如何应对大数据关键挑战?
    • 5.1、遇到的问题
    • 5.2、如何应对关键挑战?
  • 六、BoostKit 机器学习/图算法的深度优化
    • 6.1、算法深度优化实例
    • 6.2、鲲鹏算法库
  • 七、BoostKit 做了哪些深度优化?
    • 7.1、鲲鹏亲和性优化效果
    • 7.2、机器学习算法优化方案:分布式 SVD 算法
    • 7.3、图分析算法优化方案:分布式 PageRank 算法
  • 八、鲲鹏 BoostKit 机器学习&图算法的 Spark 性能加速实践
    • 8.1、环境准备
    • 8.2、环境配置
    • 8.3、部署 Hadoop、Spark 等组件
    • 8.4、算法库优化效果运行实践
      • 8.4.1、运行 SVD 算法
      • 8.4.2、运行 PageRank 算法
  • 九、相关材料获取
    • 9.1、鲲鹏 BoostKit
    • 9.2、机器学习算法加速库
    • 9.3、图算法加速库
  • 总结
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享