MySQL中基本的多表连接查询教程
一、多表连接类型
1.笛卡尔积(交叉连接)在MySQL中可以为CROSSJOIN或者省略CROSS即JOIN,或者使用',' 如:
由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE,ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢。一般使用LEFT[OUTER]JOIN或者RIGHT[OUTER]JOIN
2. 内连接INNERJOIN在MySQL中把I
SELECT*FROMtable1CROSSJOINtable2 SELECT*FROMtable1JOINtable2 SELECT*FROMtable1,table2
NNERJOIN叫做等值连接,即需要指定等值连接条件在MySQL中CROSS和INNERJOIN被划分在一起。join_table:table_reference[INNER|CROSS]JOINtable_factor[join_condition]
3.MySQL中的外连接,分为左外连接和右连接,即除了返回符合连接条件的结果之外,还要返回左表(左连接)或者右表(右连接)中不符合连接条件的结果,相对应的使用NULL对应。
例子:
user表:
id|name ——— 1|libk 2|zyfon 3|daodao
user_action表:
user_id|action ————— 1|jump 1|kick 1|jump 2|run 4|swim
sql:
selectid,name,actionfromuserasu leftjoinuser_actionaonu.id=a.user_id
result:
id|name|action ——————————– 1|libk|jump① 1|libk|kick② 1|libk|jump③ 2|zyfon|run④ 3|daodao|null⑤
分析:
注意到user_action中还有一个user_id=4,action=swim的纪录,但是没有在结果中出现,
而user表中的id=3,name=daodao的用户在user_action中没有相应的纪录,但是却出现在了结果集中
因为现在是leftjoin,所有的工作以left为准.
结果1,2,3,4都是既在左表又在右表的纪录,5是只在左表,不在右表的纪录
工作原理:
从左表读出一条,选出所有与on匹配的右表纪录(n条)进行连接,形成n条纪录(包括重复的行,如:结果1和结果3),如果右边没有与on条件匹配的表,那连接的字段都是null.然后继续读下一条。
引申:
我们可以用右表没有on匹配则显示null的规律,来找出所有在左表,不在右表的纪录,注意用来判断的那列必须声明为notnull的。
如:
sql:
selectid,name,actionfromuserasu leftjoinuser_actionaonu.id=a.user_id wherea.user_idisNULL
(注意:
1.列值为null应该用isnull而不能用=NULL
2.这里a.user_id列必须声明为NOTNULL的.
)
上面sql的result:
id|name|action ————————– 3|daodao|NULL ——————————————————————————–
一般用法:
a.LEFT[OUTER]JOIN:
除了返回符合连接条件的结果之外,还需要显示左表中不符合连接条件的数据列,相对应使用NULL对应
SELECTcolumn_nameFROMtable1LEFT[OUTER]JOINtable2ONtable1.column=table2.column
b.RIGHT[OUTER]JOIN:
RIGHT与LEFTJOIN相似不同的仅仅是除了显示符合连接条件的结果之外,还需要显示右表中不符合连接条件的数据列,相应使用NULL对应
SELECTcolumn_nameFROMtable1RIGHT[OUTER]JOINtable2ONtable1.column=table2.column
Tips:
1.ona.c1=b.c1等同于using(c1)
2.INNERJOIN和,(逗号)在语义上是等同的
3.当MySQL在从一个表中检索信息时,你可以提示它选择了哪一个索引。
如果EXPLAIN显示MySQL使用了可能的索引列表中错误的索引,这个特性将是很有用的。
通过指定USEINDEX(key_list),你可以告诉MySQL使用可能的索引中最合适的一个索引在表中查找记录行。
可选的二选一句法IGNOREINDEX(key_list)可被用于告诉MySQL不使用特定的索引。如:
mysql>SELECT*FROMtable1USEINDEX(key1,key2) ->WHEREkey1=1ANDkey2=2ANDkey3=3; mysql>SELECT*FROMtable1IGNOREINDEX(key3) ->WHEREkey1=1ANDkey2=2ANDkey3=3;
二、表连接的约束条件
添加显示条件WHERE,ON,USING
1.WHERE子句
mysql> SELECT*FROMtable1,table2WHEREtable1.id=table2.id;
2.ON
mysql> SELECT*FROMtable1LEFTJOINtable2ONtable1.id=table2.id; SELECT*FROMtable1LEFTJOINtable2ONtable1.id=table2.id LEFTJOINtable3ONtable2.id=table3.id;
3.USING子句,如果连接的两个表连接条件的两个列具有相同的名字的话可以使用USING
例如:
SELECTFROMLEFTJOINUSING()
连接多于两个表的情况举例:
mysql> SELECTartists.Artist,cds.title,genres.genre FROMcds LEFTJOINgenresNcds.genreID=genres.genreID LEFTJOINartistsONcds.artistID=artists.artistID;
或者
mysql> SELECTartists.Artist,cds.title,genres.genre FROMcds LEFTJOINgenresONcds.genreID=genres.genreID LEFTJOINartists->ONcds.artistID=artists.artistID WHERE(genres.genre='Pop'); --------------------------------------------
另外需要注意的地方在MySQL中涉及到多表查询的时候,需要根据查询的情况,想好使用哪种连接方式效率更高。
1.交叉连接(笛卡尔积)或者内连接[INNER|CROSS]JOIN
2.左外连接LEFT[OUTER]JOIN或者右外连接RIGHT[OUTER]JOIN注意指定连接条件WHERE,ON,USING.
PS:基本的JOIN用法
首先我们假设有2个表A和B,他们的表结构和字段分别为:
表A:
ID Name
1 Tim
2 Jimmy
3 John
4 Tom
表B:
ID Hobby
1 Football
2 Basketball
2 Tennis
4 Soccer
1. 内联结:
SelectA.Name,B.HobbyfromA,BwhereA.id=B.id
,这是隐式的内联结,查询的结果是:
NameHobby TimFootball JimmyBasketball JimmyTennis TomSoccer
它的作用和
SelectA.NamefromAINNERJOINBONA.id=B.id
是一样的。这里的INNERJOIN换成CROSSJOIN也是可以的。
2. 外左联结
SelectA.NamefromALeftJOINBONA.id=B.id
,典型的外左联结,这样查询得到的结果将会是保留所有A表中联结字段的记录,若无与其相对应的B表中的字段记录则留空,结果如下:
NameHobby TimFootball JimmyBasketball,Tennis John TomSoccer
所以从上面结果看出,因为A表中的John记录的ID没有在B表中有对应ID,因此为空,但Name栏仍有John记录。
3. 外右联结
如果把上面查询改成外右联结:
SelectA.NamefromARightJOINBONA.id=B.id
,则结果将会是:
NameHobby TimFootball JimmyBasketball JimmyTennis TomSoccer
这样的结果都是我们可以从外左联结的结果中猜到的了。
说到这里大家是否对联结查询了解多了?这个原本看来高深的概念一下子就理解了,恍然大悟了吧(呵呵,开玩笑了)?最后给大家讲讲MySQL联结查询中的某些参数的作用:
1.USING(column_list):其作用是为了方便书写联结的多对应关系,大部分情况下USING语句可以用ON语句来代替,如下面例子:
aLEFTJOINbUSING(c1,c2,c3)
,其作用相当于下面语句
aLEFTJOINbONa.c1=b.c1ANDa.c2=b.c2ANDa.c3=b.c3
只是用ON来代替会书写比较麻烦而已。
2.NATURAL[LEFT]JOIN:这个句子的作用相当于INNERJOIN,或者是在USING子句中包含了联结的表中所有字段的LeftJOIN(左联结)。
3.STRAIGHT_JOIN:由于默认情况下MySQL在进行表的联结的时候会先读入左表,当使用了这个参数后MySQL将会先读入右表,这是个MySQL的内置优化参数,大家应该在特定情况下使用,譬如已经确认右表中的记录数量少,在筛选后能大大提高查询速度。
最后要说的就是,在MySQL5.0以后,运算顺序得到了重视,所以对多表的联结查询可能会错误以子联结查询的方式进行。譬如你需要进行多表联结,因此你输入了下面的联结查询:
SELECTt1.id,t2.id,t3.id FROMt1,t2 LEFTJOINt3ON(t3.id=t1.id) WHEREt1.id=t2.id;
但是MySQL并不是这样执行的,其后台的真正执行方式是下面的语句:
SELECTt1.id,t2.id,t3.id FROMt1,(t2LEFTJOINt3ON(t3.id=t1.id)) WHEREt1.id=t2.id;
这并不是我们想要的效果,所以我们需要这样输入:
SELECTt1.id,t2.id,t3.id FROM(t1,t2) LEFTJOINt3ON(t3.id=t1.id) WHEREt1.id=t2.id;