MySQL中distinct语句去查询重复记录及相关的性能讨论

不过，如果更仔细地分析一下，前后两个版本的代码还有些更微妙的差异。含关联子查询的代码中，至关重要的是 orders 表中的 custid 字段要有索引，而这对另一段代码并不重要，因为这时要用到的索引（如果有的话）是表 customers 的主键索引。
你或许注意到，新版的查询中执行了隐式的 distinct 。的确，由于连接操作，子查询可能会返回有关一个客户的多条记录。但重复项目不会有影响，因为 in 条件只检查该项目是否出现在子查询返回的列表中，且 in 不在乎某值在列表中出现了一次还是一百次。但为了一致性，作为整体，应该对子查询和主查询应用相同的规则，也就是在子查询中也加入存在性测试：

select custname from customers where city = 'GOTHAM' and custid in (select o.custid from orders o where o.ordered >= somefunc and exists (select null from orderdetail od, articles a where a.artname = 'BATMOBILE' and a.artid = od.artid and od.ordid = o.ordid))

或者

select custname from customers where city = 'GOTHAM' and custid in (select custid from orders where ordered >= somefunc and ordid in (select od.ordid from orderdetail od, articles a where a.artname = 'BATMOBILE' and a.artid = od.artid)

尽管嵌套变得更深、也更难懂了，但子查询内应选择 exists 还是 in 的选择规则相同：此选择取决于日期与商品条件的有效性。除非过去六个月的生意非常清淡，否则商品名称应为最有效的过滤条件，因此子查询中用 in 比 exists 好，这是因为，先找出所有蝙蝠车的订单、再检查销售是否发生在最近六个月，比反过来操作要快。如果表 orderdetail 的 artid 字段有索引，这个方法会更快，否则，这个聪明巧妙的举措就会黯然失色。
每当对大量记录做存在性检查时，选择 in 还是 exists 须斟酌。
利于多数 SQL 方言，非关联子查询可以被改写成 from 子句中的内嵌视图。然而，一定要记住的是， in 会隐式地剔除重复项目，当子查询改写为 from 子句中的内嵌视图时，必须要显式地消除重复项目。例如：

select custname from customers where city = 'GOTHAM' and custid in (select o.custid from orders o, (select distinct od.ordid from orderdetail od, articles a where a.artname = 'BATMOBILE' and a.artid = od.artid) x where o.ordered >= somefunc and x.ordid = o.ordid)

总结：保证 SQL 语句返回正确结果，只是建立最佳 SQL 语句的第一步。

MySQL中distinct语句去查询重复记录及相关的性能讨论

解读数据库的嵌套查询的性能问题

MySQL数据库改名的详细方法教程

Mysql中使用时间查询的详细图文教程

一步步教你MySQL密码忘记了该如何操作

MySQL8.0 Command Line Client输入密码后出现闪退

MySQL5.7升级MySQL8.0的完整卸载与安装及连接Navicat

Mysql存储二进制对象数据问题

Mysql存储二进制对象数据问题

MySQL5.7升级MySQL8.0的完整卸载与安装及连接Navicat

一步步教你MySQL密码忘记了该如何操作

解读数据库的嵌套查询的性能问题

MySQL数据库改名的详细方法教程

Mysql中使用时间查询的详细图文教程

一步步教你MySQL密码忘记了该如何操作

MySQL8.0 Command Line Client输入密码后出现闪退

MySQL5.7升级MySQL8.0的完整卸载与安装及连接Navicat

Mysql存储二进制对象数据问题

Mysql存储二进制对象数据问题

MySQL5.7升级MySQL8.0的完整卸载与安装及连接Navicat

一步步教你MySQL密码忘记了该如何操作