当前位置:首页 > 编程笔记 > 正文
已解决

Spark 平障录

来自网友在路上 163863提问 提问时间:2023-11-19 21:21:00阅读次数: 63

最佳答案 问答题库638位专家为你答疑解惑

Profile

Profile 是最重要的第一环。

  • 利用好 spark UI 和 yarn container log
  • 分析业务代码,对其计算代价进行预判
  • 建设基准,进行对比,比如application id 进行对比,精确到 job DAG 环节
充分利用 UI
Stage 页面

页头 summary,也很重要。
在这里插入图片描述

勾选所有 UI metrics,提供判断依据

在这里插入图片描述

task 维度 metrics

在这里插入图片描述

在这里插入图片描述

Executor 维度

在这里插入图片描述

application id 对比

如果两个application id, shuflfle read/write 差不多,input/output 差不多。
慢的那一个,如果内存消耗大,那说明计算量大,比如 sum, count 等

Executor 页面

选中所有 metrics,增加判断依据
在这里插入图片描述

注意GC
在这里插入图片描述

查看全文

99%的人还看了

猜你感兴趣

版权申明

本文"Spark 平障录":http://eshow365.cn/6-39657-0.html 内容来自互联网,请自行判断内容的正确性。如有侵权请联系我们,立即删除!