前回はソートした検索結果を出力しましたね。今回は、フィールドの値が同じレコードをグルーピングし、そのレコード集の任意のカラムに対してAVG(),MIN(),MAX(),COUNT(),SUM()…などの関数計算を適応してみます。使用するレコードは以下のものを用います。
mysql> SELECT * FROM product_list
-> ORDER BY date, name;
+----+-----------+----------+------------+
| id | name | quantity | date |
+----+-----------+----------+------------+
| 10 | chocolate | 18 | 2009-11-17 |
| 7 | cake | 35 | 2009-11-18 |
| 6 | candy | 28 | 2009-11-18 |
| 3 | chocolate | 40 | 2009-11-18 |
| 8 | parfait | 18 | 2009-11-18 |
| 4 | cake | 29 | 2009-11-19 |
| 2 | candy | 32 | 2009-11-19 |
| 1 | chocolate | 16 | 2009-11-19 |
| 5 | parfait | 29 | 2009-11-19 |
| 9 | eclair | 56 | 2009-11-20 |
+----+-----------+----------+------------+
背景状況はとあるお菓子工場の11/17~20までの出荷製品とその個数の記録、とでもしておきましょう。さて、このレコード集から「4日間で一番出荷されたお菓子」を判別するクエリは以下のようになります。
mysql> SELECT name, SUM(quantity)
-> FROM product_list
-> GROUP BY name
-> ORDER BY SUM(quantity) DESC;
+-----------+---------------+
| name | SUM(quantity) |
+-----------+---------------+
| chocolate | 74 |
| cake | 64 |
| candy | 60 |
| eclair | 56 |
| parfait | 47 |
+-----------+---------------+
<SELECT文の前半(FROM, WHERE句など)>
GROUP BY <列名>
まず、結果の列名がSUM(quantity)になっていることに注目してください。GROUP BY句によりnameフィールドが同じ値のレコードを集計します。例えばnameフィールドがcakeのレコードはidが7と4です。その二つのレコードは一つのグループとみなされます(同じ値なので)。そのグループ(レコード集)に対してSUM()関数を適応しています。SUM()は合計を返しますので、35+29=64と上の出力結果になります。他のフィールド値に対しても同様の計算を行うことで、「4日間で一番出荷されたお菓子」はchocolateと分かります(最後にLIMIT 1を付けてもいいです)。
同様に「1日あたりの平均出荷量が最高のお菓子」を求めるクエリは下のようになります。
mysql> SELECT name, ROUND(AVG(quantity),0)
-> FROM product_list
-> GROUP BY name
-> ORDER BY AVG(quantity) DESC;
+-----------+------------------------+
| name | ROUND(AVG(quantity),0) |
+-----------+------------------------+
| eclair | 56 |
| cake | 32 |
| candy | 30 |
| chocolate | 25 |
| parfait | 23 |
+-----------+------------------------+
ROUND()関数は小数点の切捨てに使っています。
もしGROUP BY句を用いずに上述の関数(AVG,SUM)を用いると以下のようなエラーが出ます。
mysql> SELECT name, ROUND(AVG(quantity),0)
-> FROM product_list;
ERROR 1140 (42000): Mixing of GROUP columns (MIN(),MAX(),COUNT(),...)
with no GROUP columns is illegal if there is no GROUP BY clause
グループカラム(=同値のフィールドのレコード集)を渡さなければいけませんので、1つのカラムを渡しても意味無い、という解釈でいいのかな。
ちなみに、COUNT()関数は引数に列(カラム)名を取り、その行(レコード)数を返します。
mysql> SELECT COUNT(name)
-> FROM product_list;
+-------------+
| count(name) |
+-------------+
| 10 |
+-------------+
この場合はGROUP BY句も必要ありません。
今記事では取り上げませんでしたがMIN(),MAX()はそれぞれ最小、最大値を返します(文字どおりですね)。
リファレンス
- MySQL :: MySQL 5.1 Reference Manual :: 7.2.15 GROUP BY Optimization
- MySQL :: MySQL 5.1 Reference Manual :: 11.12.1 GROUP BY (Aggregate) Functions
コメント
MySQL: 同じ値のフィールドをグルーピング – GROUP BY句
[…] MySQL」で検索したところこんなページが見つかりました。 MySQL: 同じ値のフィールドをグルーピング – GROUP BY句 […]