很多数据库开发人员都听说过笛卡尔积的概念,也可能偶尔碰上过因为SQL语句或者数据表数据问题而产生的笛卡尔积问题。但是很多人对于笛卡尔积产生的原因和如何避免还是有些一知半解。所以我们今天就简单明了地给大家介绍一下什么情况下会产生笛卡尔积问题,以及如何避免。
一、什么是笛卡尔积
笛卡尔积是指在数学中,两个集合X和Y的笛卡尓积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。
假设集合A={a, b}有两个元素,集合B={0, 1, 2}有三个元素,则两个集合的笛卡尔积为{(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)}有2*3为6个元素。
在SQL查询语句中,出现笛卡尔积的情况都是出现在关联查询上,具体包括下面两种。我们以下面两张表为例,给大家介绍一下。
第一张表是雇员表:有20条数据,如下图

第二张表为工资表:也有二十条数据,如下图

二、数据表关联查询时,如果连接没有ON条件,会出现全部笛卡尔积
对于以上的两张表,如果我们查询
select * from employees, salary
结果为

可以看出,一共出现了20*20=400条数据。即出现了全部笛卡尔积。
三、数据表关联查询时,如果ON条件字段是非唯一字段,会出现部分笛卡尔积
以上面的数据为例,如果我们以ejob字段进行连接的话,语句如下:
select * from employees, salary where employees.ejob=salary.ejob
结果为

可以看出,由于ejob不是唯一字段,最终出现了36条结果,也就是出现了部分笛卡尔积。
四、如何才能不出现笛卡尔积的查询结果
为避免出现查询结果为笛卡尔积的冗余数据情况,应该在连接查询时,使用唯一字段进行连接。
相关文章:
宋朝的由来:是怎么建立的? 06-24
明朝七省总督,你们都了解吗 06-24
明朝工匠皇帝,不爱江山美人,偏爱做“鲁班”,被称中国建筑鼻祖 06-23
南宋最好的皇帝是谁?最有作为的皇帝不是宋高宗而是谁? 06-23
民国的瓷器值钱吗 80后问:民国瓷器到底有没有收藏价值? 06-22
宋朝真实的宋仁宗是位怎样的皇上,真如《清平乐》里演的那样吗 06-22
横跨南北宋的7位词人排行榜,你能猜到其中几位?全猜到的是高手 06-21
宋朝颍州儒学发起者,兵部尚书,蔡文忠公,禹州蔡齐墓 06-21
贾谊朝代 ,西汉时期杰出的政治家和文学家 06-20
民国时期的“法币”是怎么一回事? 06-20