在一个表中有重复的记录,重复的次数可能是一条或多条,如何在重复记录中只留下一条,删除其他多余的记录,使数据集的每条记录都是唯一的? 本文运用了一种比较笨拙不过逻辑比较清楚的方法,希望大家能提供更好的方法! 1列出表中的重复记录 (sameoda) SELECT [2].[地级市], Count(*) AS 记录数 FROM 2 GROUP BY [2].[地级市] HAVING count(*)>1 ORDER BY [地级市]; 地级市 | 记录数 |
---|
100000951094 | 2 | 100000951116 | 2 | 100000951127 | 2 | 100000951138 | 2 | 100000951149 | 2 | 100000951150 | 2 |
2以下是除去相同记录的过程 1)列出表中的所有重复记录 (表2中重复记录) SELECT 2.* FROM 2 RIGHT JOIN sameoda ON [2].[地级市]=[sameoda].[地级市]; ID | 编号 | 地级市 | 保险货物名称 | 数量及包装单位 | 声明价值(元) | 运输自 | 运输到 |
---|
7469 | 1466 | 100000951094 | 苯扎贝特片、水飞蓟宾胶囊 | 3箱 | 18600 | 天津 | 佳木斯 | 5351 | 1077 | 100000951094 | 苯扎贝特片、水飞蓟宾胶囊 | 3箱 | 18600 | 天津 | 佳木斯 | 5350 | 1076 | 100000951116 | 水飞蓟宾胶囊 | 5箱 | 29000 | 天津 | 乌鲁木齐 | 7468 | 1465 | 100000951116 | 水飞蓟宾胶囊 | 5箱 | 29000 | 天津 | 乌鲁木齐 | 5353 | 1079 | 100000951127 | 氟他胺片 | 4箱 | 66800 | 天津 | 哈尔滨 | 7471 | 1468 | 100000951127 | 氟他胺片 | 4箱 | 66800 | 天津 | 哈尔滨 |
2)从重复记录中找到唯一的一条记录 minbihanhao SELECT 2.* FROM 2 LEFT JOIN 表2中重复记录 ON [2].[ID]=[表2中重复记录].[ID] WHERE [表2中重复记录].[id] Is Null; 地级市 | id |
---|
100000951094 | 5351 | 100000951116 | 5350 | 100000951127 | 5353 | 100000951138 | 5354 | 100000951149 | 5352 | 100000951150 | 5355 |
3)显示唯一记录的全部信息 allsame1 SELECT 2.* FROM 2 LEFT JOIN minbihanhao ON ([2].[地级市]=[minbihanhao].[地级市]) AND ([2].[id]=[minbihanhao].[id]) WHERE [minbihanhao].[地级市] Is Not Null ORDER BY [2].[id]; 4)在原表中除去所有相同的记录 dropsame2 SELECT 2.* FROM 2 LEFT JOIN 表2中重复记录 ON [2].[ID]=[表2中重复记录].[ID] WHERE [表2中重复记录].[id] Is Null; 5)表2除去重复记录=在原表中除去所有相同的记录+显示唯一记录的全部信息 表2除去重复记录 SELECT * FROM dropsame2 UNION select * from allsame1;

|