【云驻共创】“大鹏一日同风起”Kunpeng BoostKit 使能套件如何实现大数据场景倍级性能提升？

4年前更新

5250

【摘要】在数据和经济时代，业务和数据的多样性需要新的计算架构，海量的数据增长也带来了更高的计算需求。那么在这个过程中，鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务，致力于为智能世界持续提供我们的先进算力支持，使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为

文章目录

前言
一、开源大数据与鲲鹏多核结构渊源

1.1、海量数据处理的难题
1.2、大数据并行计算特点天然匹配鲲鹏多核架构

二、开源大数据整体与组件介绍

2.1、大数据组件：Hadoop-HDFS 模块
2.2、大数据组件：Hadoop-Yarn 模块
2.3、大数据组件：Hadoop-MapReduce 模块
2.4、大数据组件：Spark 平台

三、鲲鹏 BoostKit 使能套件介绍

3.1、鲲鹏 BoostKit 是什么？
3.2、开源使能：开源软件可用、好用
3.3、基础加速：超越业界水平的应用性能
3.4、应用加速：极致事务倍级应用性能

四、BoostKit 在开源使能上的结果

4.1、全面支持开源大数据
4.2、开源社区接纳 ARM 生态

五、鲲鹏 BoostKit 如何应对大数据关键挑战？

5.1、遇到的问题
5.2、如何应对关键挑战？

六、BoostKit 机器学习/图算法的深度优化

6.1、算法深度优化实例
6.2、鲲鹏算法库

七、BoostKit 做了哪些深度优化？

7.1、鲲鹏亲和性优化效果
7.2、机器学习算法优化方案：分布式 SVD 算法
7.3、图分析算法优化方案：分布式 PageRank 算法

八、鲲鹏 BoostKit 机器学习&图算法的 Spark 性能加速实践

8.1、环境准备
8.2、环境配置
8.3、部署 Hadoop、Spark 等组件
8.4、算法库优化效果运行实践

8.4.1、运行 SVD 算法
8.4.2、运行 PageRank 算法

九、相关材料获取

9.1、鲲鹏 BoostKit
9.2、机器学习算法加速库
9.3、图算法加速库

总结

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

喜欢就支持一下吧

相关推荐