MySQL分割一行为多行的思路「建议收藏」

MySQL分割一行为多行的思路「建议收藏」最近数据分析有需求,分析运营活动短信用户,但是发送短信的用户是通过 JSON 字符串数组存储在一个 text 字段的。内容类似于: [“user1”, “user2”, “user3″….] 数…

MySQL分割一行为多行的思路

最近数据分析有需求,分析运营活动短信用户,但是发送短信的用户是通过 JSON 字符串数组存储在一个 text 字段的。内容类似于:

["user1", "user2", "user3"....]

代码100分

数据分析想分析这些用户,那么就需要 in 这些用户查询。自己手动拼 SQL 太蛋疼,而且好几万几十万的用户,拼成SQL,复制粘贴也够蛋疼的。那么可以考虑将这一行分割为多行,作为一个字段。

mysql.help_topic 是啥

网上的思路是利用 mysql.help_topic 这个记录表,这个表是存储 mysql 各种帮助文档目录的,主要因为他有一个从零开始自增的 id 字段,所以采用这张表作为帮助表。其实他不是用来干这个的。并且,有时候我们精简安装,或者是云服务里面的 mysql,他们的这张表里面的内容,是空的,所以我们不能靠这张表。

如何自己实现呢?

思路主要是如下,首先处理数据,将 JSON 字符串数组处理成:

代码100分user1,user2,user3

通过:

select replace(replace(replace(replace(a,"[",""),"]",""), """, "")," ","") processed_data from 表

然后,我们通过substring_index函数,可以提取出user1user2user3这些用户 id。分别是:substring_index(substring_index(processed_data,",",1),",",-1)substring_index(substring_index(processed_data,",",2),",",-1)substring_index(substring_index(processed_data,",",3),",",-1).可以看出,如果我们能提供一个数字,这个数字从1开始,一直到,的个数 + 1,这样就能使用substring_index函数,将每个 userId 提取出来,也就是将数据转换成:

代码100分+-------------------+----+
| processed_data    | id |
| user1,user2,user3 | 1  |
| user1,user2,user3 | 2  |
| user1,user2,user3 | 3  |

哪里有这么一张表呢?我们可以创建一个表,里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数,我们这里是 200 万。

+----+
| id |
+----+
|  0 |
|  1 |
|  2 |
|  3 |
|  4 |
|  5 |

这样,通过 join 这张表,用 id < ,的个数为条件,就能得出上面的processed_dataid join 的数据。

最后的SQL:

SELECT
	substring_index( substring_index( processed_data, ",", b.id + 1 ), ",",- 1 ) user_id 
FROM
(
SELECT REPLACE
	(
		REPLACE ( REPLACE ( REPLACE (数据字段, "[", "" ), "]", "" ), """, "" ),
		" ",
		"" 
	) processed_data 
FROM
	表 
) temp
JOIN help表 b ON b.id < ( length( temp.processed_data ) - length( REPLACE ( temp.processed_data, ",", "" ) ) + 1 )

其中的 help 表就是里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数的这张表

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/8983.html

(0)
上一篇 2023-02-18
下一篇 2023-02-18

相关推荐

  • MySQL中几个重要的参数「建议收藏」

    MySQL中几个重要的参数「建议收藏」sync_binlog 参数含义:控制binlog刷盘的频率。 当值为 0 时,不强制刷盘,binlog依赖操作系统刷入磁盘。 当值为 1 时,确保binlog在一组事务提交前刷入磁盘。 当值为 N…

    2023-03-21
    159
  • 关于em聚类算法实现python的信息

    关于em聚类算法实现python的信息1、从Kmeans说起

    2023-10-27
    140
  • Python列表元素查找教程

    Python列表元素查找教程Python是一种高级编程语言,被广泛使用于各种应用程序开发中。其中列表是Python中最常用的数据结构之一。在处理列表中的数据时,经常需要查找具体的元素并进行相应的操作。因此,对于Python列表元素的查找特别重要。本教程将从不同的角度介绍Python列表元素的查找方法,帮助读者更加深入地理解Python中列表数据结构的应用。

    2024-08-25
    24
  • 性能调优从哪几个方面入手_MySQL调优

    性能调优从哪几个方面入手_MySQL调优上篇文章讲了MySQL架构体系,了解到MySQL Server端的优化器可以生成Explain执行计划,而执行计划可以帮助我们分析SQL语句性能瓶颈,优化SQL查询逻辑,今天就一块学习Explain执

    2023-05-28
    154
  • Python编程:如何找到最小值

    Python编程:如何找到最小值在实际编程中,有很多场景需要找到一个集合中的最小值。例如,在一个数字列表中,需要找到最小值,从而进行进一步的计算或操作。找到最小值还有助于数据统计和分析。

    2024-01-25
    104
  • 倒转列表顺序:Python .reverse方法

    倒转列表顺序:Python .reverse方法Python是一种高级编程语言,它可以轻松地实现各种算法和数据结构。Python中的列表(List)是一种特殊的数据结构,它可以用来存储一系列有序的元素,这些元素可以是数字、字符串、对象等等。Python提供了许多方法来操作列表,其中一个非常便利的方法是.reverse(),它可以将列表的顺序反转。

    2024-02-29
    86
  • 5分钟搞定 关系型数据库 到 Flink 数据同步[通俗易懂]

    5分钟搞定 关系型数据库 到 Flink 数据同步[通俗易懂]简述 实时数据处理领域中,使用 Flink 方式,除了从日志服务订阅埋点数据外,总离不开从关系型数据库订阅并处理相关业务数据,这时就需要监测并捕获数据库增量数据,将变更按发生的顺序写入到消息中间件以供

    2023-06-03
    145
  • Kotlin:字符串(String)[亲测有效]

    Kotlin:字符串(String)[亲测有效]故而, 在这篇文章中,会对字符串(String)的常用操作做出一个讲解。比如,字符串的截取、查找、获取长度、替换等等… 字符串查找功能在实际开发中,只会用到几个简单的函数,这里我只说明几个常用的。 其实查找元素提供了两个高阶函数find{}、findLast{}。不过其内部都是…

    2023-03-02
    152

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注