Spark高级算子aggregate所遇到的坑「建议收藏」

小小码 • 2023-02-26 17:00 • 代码基础 • 阅读 150

一键激活最新全家桶

Spark高级算子aggregate所遇到的坑「建议收藏」val rdd3 = sc.parallelize(List("12","23","345","4567"),2) rd

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说Spark高级算子aggregate所遇到的坑「建议收藏」,希望您对编程的造诣更进一步.

val rdd3 = sc.parallelize(List(“12″,”23″,”345″,”4567”),2)

rdd3.aggregate(“”)((x,y) => math.max(x.length, y.length).toString, (x,y) => x + y)

两个分区先计算出字符串的最大长度，然后合成字符串

结果可能是：”24”，也可能是：”42”，体现了并行化特点。

val rdd4 = sc.parallelize(List(“12″,”23″,”345″,””),2)

rdd4.aggregate(“”)((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)

结果是：”10”，也可能是”01”，

原因：注意有个初始值””，其长度0，然后0.toString变成字符串。值”0″.toString的长度为0,”0″.toString.length的长度为1 。分区可能为（“12”，“23”）和（“345”，“”）；初始值为””，然后初始值和“12”，“34”比较，或者是””和“345”比较，然后和“”比较。

math.min(“”.length, “12”.length ) 的结果是：0 , math.min(“0”.length, “23”.length ) 的结果是1

math.min(“”.length, “345”.length) 的结果是：0 , math.min(“0”.length, “”.length) 的结果是：0

val rdd5 = sc.parallelize(List(“12″,”23″,””,”345″),2)

rdd5.aggregate(“”)((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)

结果是：”11”，原因如下：

math.min(“”.length, “12”.length ) 的结果是：0 , math.min(“0”.length, “23”.length ) 的结果是：1

math.min(“”.length, “”.length) 的结果是：0 , math.min(“0”.length, “345”.length) 的结果是：1

注意：值”0″.toString的长度为0,”0″.toString.length的长度为1

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/8544.html

赞 (0)

0 0

mysql 一些常用sql语句[亲测有效]

上一篇 2023-02-26

千万数据级别的数据库查找_千万级数据库查询优化

下一篇 2023-02-26

代码基础

AutoMySQLBackup 3.0在MySQL 5.7中的问题修复[亲测有效]

AutoMySQLBackup 3.0在MySQL 5.7中的问题修复[亲测有效]最近一个电子看板小项目上线，由于数据库非常小，而且数据也不太重要。因此未选择XtraBackup备份，打算用AutoMySQLBackup来备份，结果部署后测试发现，有一些小问题是之前解决过的。有一些

小小码
2023-03-11
141
代码基础

Python实现Unity游戏开发倒计时功能

Python实现Unity游戏开发倒计时功能在Unity游戏开发中，倒计时功能是非常基础和常用的一个功能。比如，在赛车游戏中，需要倒计时开始，玩家才能开始比赛；或者在跳一跳游戏中，需要倒计时开始，玩家才能开始跳跃。

admin
2023-12-17
100
代码基础

1. MySQL体系结构和存储引擎——MySQL体系结构、存储引擎、连接MySQL[通俗易懂]

1. MySQL体系结构和存储引擎——MySQL体系结构、存储引擎、连接MySQL[通俗易懂]一、MySQL体系结构和存储引擎尽管各个平台在底层（如线程）实现方面都各不相同，但MySQL基本上能保证在各个平台上的物理结构的一致性。因此，用户应该能很好的理解MySQL数据库在所有这些平台是如何

小小码
2023-02-15
158
代码基础

如何升级Python

如何升级PythonPython是一门非常流行的编程语言。每当新版本的Python发布时，都会有一些新特性和修复了一些问题，因此及时升级Python版本是非常重要的。下面是关于如何升级Python版本的方法：

admin
2024-08-30
21
代码基础

NoSql非关系型数据库之MongoDB应用(一)：安装MongoDB服务 – 熊泽「终于解决」

NoSql非关系型数据库之MongoDB应用(一)：安装MongoDB服务 – 熊泽「终于解决」业精于勤，荒于嬉；行成于思，毁于随。一、MongoDB服务下载安装（windows环境安装） 1.进入官网：https://www.mongodb.com/，点击右上角的 Try Free ， 2.

小小码
2023-04-18
161
代码基础

Python函数参数定义：全面了解Python函数参数的含义与使用方法

Python函数参数定义：全面了解Python函数参数的含义与使用方法Python中函数参数是定义函数时给函数传递参数的一种方式。本文将深入讲解Python中的函数参数，包括位置参数、默认参数、可变参数、命名关键字参数以及关键字参数等。

admin
2024-01-09
108
代码基础

50个SQL语句(MySQL版) 问题二十二[亲测有效]

50个SQL语句(MySQL版) 问题二十二[亲测有效]表结构 student(StuId,StuName,StuAge,StuSex) 学生表 teacher(TId,Tname) 教师表 course(CId,Cname,C_TId) 课程表 sc(S

小小码
2023-03-07
153
代码基础

基于Python的图片保存技巧

基于Python的图片保存技巧现在在我们每天的生活学习中，常常需要使用图片来支撑我们的文章和观点。在处理图片时，保存图片是不可避免的。对于Python来说，处理图片和保存图片是一项非常重要的技能。

admin
2024-09-11
23

发表回复