Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Uuden Sarakkeen Lisääminen | Ensimmäiset Askeleet
Johdanto Pandas-kirjastoon

bookUuden Sarakkeen Lisääminen

Olet oppinut, kuinka luodaan DataFrame. Seuraavaksi tutustu, mitä kaikkea sillä voi tehdä. Aloita luomalla tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame:a lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, saraketta 'population' ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookUuden Sarakkeen Lisääminen

Pyyhkäise näyttääksesi valikon

Olet oppinut, kuinka luodaan DataFrame. Seuraavaksi tutustu, mitä kaikkea sillä voi tehdä. Aloita luomalla tiivis DataFrame, jossa on 3 saraketta ja 7 riviä.

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
copy

Voit laajentaa DataFrame:a lisäämällä uusia sarakkeita seuraavalla syntaksilla:

dataframe['name_of_new_column'] = [value_1, value_2, value_3]
  • dataframe on olemassa oleva DataFrame, johon lisätään sarake;
  • name_of_new_column on uuden sarakkeen nimi;
  • value_1, value_2, value_3 ovat uuden sarakkeen arvot.
Note
Huomio

Uuden sarakkeen nimi tulee laittaa lainausmerkkeihin ja hakasulkeisiin, esimerkiksi ['NewColumnName']. Uudelle sarakkeelle annettavat arvot tulee myös laittaa hakasulkeisiin, esimerkiksi data['NewColumnName'] = [value1, value2, value3]. Jos arvot ovat numeerisia, ne voidaan kirjoittaa ilman lainausmerkkejä, kuten [1, 2, 3]. Jos arvot ovat merkkijonoja, jokainen tulee laittaa lainausmerkkeihin, kuten ['A', 'B', 'C'].

Lisää seuraavaksi 'population'-sarake olemassa olevaan countries DataFrameen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries['population'] = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Piste-notaatiota (esim. df.column) voidaan käyttää olemassa olevien sarakkeiden käsittelemiseen, mutta sitä ei voi käyttää uusien sarakkeiden luomiseen. Käytä aina hakasulkuja (esim. df['column']) tähän tarkoitukseen.

12345678
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.population = [61399000, 75967000, 39244, 380200, 10380491, 5496000, 2424200] print(countries)
copy

Kuten odotettua, saraketta 'population' ei luotu, koska Pandas ei salli sarakkeiden luomista tällä tavalla.

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
some-alt