百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

SQL查询中笛卡尔积的巧妙使用

yuyutoo 2025-02-06 16:56 1 浏览 0 评论

本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。

假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。

笛卡尔积的写法为:

select?*
from?A,B

或者

select?*?
from?A?
cross?join?B

通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。

with as的用法

在此之前,我们先看一下with as 的用法。

with?tmp?as
(
????select?*?from?class
)

select?*?from?tmp

上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:

https://blog.csdn.net/baidu_30527569/article/details/48680745

例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0

假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:

对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):

查询的SQL为:

select?dt,?hour,?income
from?t_h_income
where?day?=?'2020-04-19'

显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:

with?t_hour?as?(
select?'00'?as?dhour
union?all?
select?'01'?as?dhour
union?all?
select?'02'?as?dhour
union?all?
select?'03'?as?dhour
union?all?
select?'04'?as?dhour
union?all?
select?'05'?as?dhour
union?all?
select?'06'?as?dhour
union?all?
select?'07'?as?dhour
union?all?
select?'08'?as?dhour
union?all?
select?'09'?as?dhour
union?all?
select?'10'?as?dhour
union?all?
select?'11'?as?dhour
union?all?
select?'12'?as?dhour
union?all?
select?'13'?as?dhour
union?all?
select?'14'?as?dhour
union?all?
select?'15'?as?dhour
union?all?
select?'16'?as?dhour
union?all?
select?'17'?as?dhour
union?all?
select?'18'?as?dhour
union?all?
select?'19'?as?dhour
union?all?
select?'20'?as?dhour
union?all?
select?'21'?as?dhour
union?all?
select?'22'?as?dhour
union?all?
select?'23'?as?dhour
),t_day?as?
(
select?'2020-04-19'?as?dt
)
select?*?
from?t_day,?t_hour

得到的结果如下,生成了这一天每个小时的结构。

将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:

with?t_hour?as?(
select?'00'?as?dhour
union?all?
select?'01'?as?dhour
union?all?
select?'02'?as?dhour
union?all?
select?'03'?as?dhour
union?all?
select?'04'?as?dhour
union?all?
select?'05'?as?dhour
union?all?
select?'06'?as?dhour
union?all?
select?'07'?as?dhour
union?all?
select?'08'?as?dhour
union?all?
select?'09'?as?dhour
union?all?
select?'10'?as?dhour
union?all?
select?'11'?as?dhour
union?all?
select?'12'?as?dhour
union?all?
select?'13'?as?dhour
union?all?
select?'14'?as?dhour
union?all?
select?'15'?as?dhour
union?all?
select?'16'?as?dhour
union?all?
select?'17'?as?dhour
union?all?
select?'18'?as?dhour
union?all?
select?'19'?as?dhour
union?all?
select?'20'?as?dhour
union?all?
select?'21'?as?dhour
union?all?
select?'22'?as?dhour
union?all?
select?'23'?as?dhour
),t_day?as?
(
select?'2020-04-19'?as?dt
)

select?*?
from?t_day,?t_hour

select?a.dt,?a.dhour,?case?when?b.income?is?null?then?0?else?b.income?end?as?income
from
(
select?dt,?dhour
from?t_day,?t_hour
)?a?
left?join?
t_h_income?b
on?a.dt?=?b.dt?and?a.dhour?=?b.hour

通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:

with?t_hour?as?
(
select?'0'?as?id
union?all?
select?'1'?as?id
union?all?
select?'2'?as?id?
),
f_hour?as?(
select?'0'?as?id
union?all?
select?'1'?as?id
union?all?
select?'2'?as?id
union?all?
select?'3'?as?id
union?all?
select?'4'?as?id
union?all?
select?'5'?as?id
union?all?
select?'6'?as?id
union?all?
select?'7'?as?id
union?all?
select?'8'?as?id
union?all?
select?'9'?as?id
)

select?concat(a.id,?b.id)?hour
from?t_hour?a,?f_hour?b
where?concat(a.id,?b.id)?<=?'23'
order?by?hour

以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。

例子2-模拟循环:遍历字符串,每行按顺序输出一个字符

注:例子来源于《SQL Cookbook》第6章,经过自己的修改。

问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。

这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:

with?t5?as?
(
select?1?as?pos
union?all?
select?2?as?pos?
union?all
select?3?as?pos?
union?all
select?4?as?pos?
union?all
select?5?as?pos?
),
emp?as?
(
select?'KING'?as?name
)

select?*
from?emp,?t5

得到的结果如下图所示:

考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:

with?t5?as?
(
select?1?as?pos
union?all?
select?2?as?pos?
union?all
select?3?as?pos?
union?all
select?4?as?pos?
union?all
select?5?as?pos?
),
emp?as?
(
select?'KING'?as?name
)

select?substr(name,?pos,?1)
from?emp,?t5
where?t5.pos?<=?length(emp.name)

可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。

还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:

select?
substr(name,?pos)?char_name1,
substr(name,?length(name)-pos+1)?char_name1
from?emp,?t5
where?t5.pos?<=?length(emp.name)

这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。

小结

本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。

https://blog.csdn.net/xiaolinyouni/article/details/6943337

实际中应该有很多类似的场景。

而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。

除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

相关推荐

史上最全的浏览器兼容性问题和解决方案

微信ID:WEB_wysj(点击关注)◎◎◎◎◎◎◎◎◎一┳═┻︻▄(页底留言开放,欢迎来吐槽)●●●...

平面设计基础知识_平面设计基础知识实验收获与总结
平面设计基础知识_平面设计基础知识实验收获与总结

CSS构造颜色,背景与图像1.使用span更好的控制文本中局部区域的文本:文本;2.使用display属性提供区块转变:display:inline(是内联的...

2025-02-21 16:01 yuyutoo

写作排版简单三步就行-工具篇_作文排版模板

和我们工作中日常word排版内部交流不同,这篇教程介绍的写作排版主要是用于“微信公众号、头条号”网络展示。写作展现的是我的思考,排版是让写作在网格上更好地展现。在写作上花费时间是有累积复利优势的,在排...

写一个2048的游戏_2048小游戏功能实现

1.创建HTML文件1.打开一个文本编辑器,例如Notepad++、SublimeText、VisualStudioCode等。2.将以下HTML代码复制并粘贴到文本编辑器中:html...

今天你穿“短袖”了吗?青岛最高23℃!接下来几天气温更刺激……

  最近的天气暖和得让很多小伙伴们喊“热”!!!  昨天的气温到底升得有多高呢?你家有没有榜上有名?...

CSS不规则卡片,纯CSS制作优惠券样式,CSS实现锯齿样式

之前也有写过CSS优惠券样式《CSS3径向渐变实现优惠券波浪造型》,这次再来温习一遍,并且将更为详细的讲解,从布局到具体样式说明,最后定义CSS变量,自定义主题颜色。布局...

柠檬科技肖勃飞:大数据风控助力信用社会建设

...

你的自我界限够强大吗?_你的自我界限够强大吗英文

我的结果:A、该设立新的界限...

行内元素与块级元素,以及区别_行内元素和块级元素有什么区别?

行内元素与块级元素首先,CSS规范规定,每个元素都有display属性,确定该元素的类型,每个元素都有默认的display值,分别为块级(block)、行内(inline)。块级元素:(以下列举比较常...

让“成都速度”跑得潇潇洒洒,地上地下共享轨交繁华
让“成都速度”跑得潇潇洒洒,地上地下共享轨交繁华

去年的两会期间,习近平总书记在参加人大会议四川代表团审议时,对治蜀兴川提出了明确要求,指明了前行方向,并带来了“祝四川人民的生活越来越安逸”的美好祝福。又是一年...

2025-02-21 16:00 yuyutoo

今年国家综合性消防救援队伍计划招录消防员15000名

记者24日从应急管理部获悉,国家综合性消防救援队伍2023年消防员招录工作已正式启动。今年共计划招录消防员15000名,其中高校应届毕业生5000名、退役士兵5000名、社会青年5000名。本次招录的...

一起盘点最新 Chrome v133 的5大主流特性 ?

1.CSS的高级attr()方法CSSattr()函数是CSSLevel5中用于检索DOM元素的属性值并将其用于CSS属性值,类似于var()函数替换自定义属性值的方式。...

竞走团体世锦赛5月太仓举行 世界冠军杨家玉担任形象大使

style="text-align:center;"data-mce-style="text-align:...

学物理能做什么?_学物理能做什么 卢昌海

作者:曹则贤中国科学院物理研究所原标题:《物理学:ASourceofPowerforMan》在2006年中央电视台《对话》栏目的某期节目中,主持人问过我一个的问题:“学物理的人,如果日后不...

你不知道的关于这只眯眼兔的6个小秘密
你不知道的关于这只眯眼兔的6个小秘密

在你们忙着给熊本君做表情包的时候,要知道,最先在网络上引起轰动的可是这只脸上只有两条缝的兔子——兔斯基。今年,它更是迎来了自己的10岁生日。①关于德艺双馨“老艺...

2025-02-21 16:00 yuyutoo

取消回复欢迎 发表评论: