Summary  
This chapter explains how to group rows by a specified column and apply aggregate functions (like COUNT and AVG) to compute summary statistics, and how to assign aliases to result columns for clarity.  

General domain of usage  
Analyzing public transit travel time data.

Välkommen till kursen **Intermediate SQL**!

I det första avsnittet utforskar du hur du kan **gruppera och aggregera data** i dina tabeller.

Här är vad 'gruppering av data' innebär med ett enkelt exempel på en employees-tabell:

## Gruppering av data

**Uppgiften** är att **ta reda på antalet anställda** i varje avdelning. För att göra detta grupperar du data efter kolumnen `department` och använder aggregering med funktionen `COUNT(*)`.

Så här kommer implementationen att se ut:

SELECT department, COUNT(*) AS number_of_employees
FROM employees
GROUP BY department

Som du kan se ser **syntaxen** för att gruppera data ut så här:

```sql
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
```

`AGG_FUNC` betyder aggregeringsfunktioner som `MAX`, `MIN`, `COUNT` osv.

Notering

Denna syntax används för att **hitta vissa värden med hjälp av aggregeringsfunktioner i specifika kolumner**.

Här är ett annat exempel: du har fått i uppgift att **hitta avdelningen med högst genomsnittlig lön.**

För att hämta sådan data behöver du **gruppera** data efter kolumnen `department` och sedan använda funktionen `AVG()` för att beräkna den genomsnittliga lönen:

SELECT department, AVG(salary) as average_salary
FROM employees
GROUP BY department

I denna del av avsnittet kommer du att arbeta med **Montreal Metro-systemets databas**, som innehåller tabellen `metro_travel_time`. 



Denna tabell innehåller information om **stationens linje** (`line_name`), dess **namn** (`station_name`) och **tiden det tar** för ett tåg **att resa från en station till nästa** (`time_to_next_station`).

Här är hur denna **tabell** ser ut och en **datavisning** i den:


Som du kan se är detta **ingen komplex tabell**. Fundera på var vi kan **använda gruppering** här.

Det mest uppenbara alternativet är **gruppering efter färgerna på metrolinjerna**. Det innebär att vi kan aggregera data genom att gruppera efter metrolinjens färg. 




## Alias

I uppgifterna kommer du ofta att använda ett koncept som kallas **alias**. Ett alias är i princip ett "smeknamn" för en kolumn som du hämtar med ett `SELECT`-uttryck. Det anges med följande syntax:

```sql
SELECT column AS alias
```

Ett alias påverkar endast hur kolumnen visas i svaret.

Till exempel, istället för `MAX(time)`, kan kolumnen kallas `max_time` om du tilldelar det aliaset. Detta gör resultatet mer läsbart och tydligt.

Denna kurs är perfekt för dig som redan har grundläggande kunskaper i SQL och vill fördjupa dig i mer avancerade koncept för att skapa kraftfullare frågor. Under kursens gång kommer du att bekanta dig med gruppering av data och filtrering av grupperad data. Du kommer även att lära dig arbeta med flera tabeller samtidigt, inklusive hur du kombinerar dem. Dessutom kommer du att utforska olika typer av tabelljoiner och hur de tillämpas i praktiken.

I det här avsnittet kommer du att lära dig hur du grupperar och hanterar data effektivt. Vi introducerar operatorn GROUP BY för gruppering av data. Dessutom kommer du att lära dig hur du filtrerar grupperad data med hjälp av operatorn HAVING.

Du kommer att lära dig om nästlade underfrågor, hur de skapas och hur de används effektivt.

Här kommer du att lära dig hur man kombinerar flera tabeller, vilket gör det möjligt att arbeta med en enhetlig tabell och förenkla skapandet av frågor.

Lär dig grunderna i Data Definition Language (DDL) och Data Manipulation Language (DML) i SQL, inklusive hur man skapar, ändrar och tar bort databasobjekt samt hur man infogar, uppdaterar och tar bort data i tabeller.

Group By-sats

Gruppering av data

Alias

Kortfattade instruktioner

Lösning