Aule Blog

Transkrypt

Aule Blog
Pobrano z http://aule.pythonanywhere.com/
Uzupełnienie kolumny w pliku csv
przy użyciu pandas
1 czerwca 2016 popełniony przez aule
Pandas (http://pandas.pydata.org/) jest biblioteką do Pythona służąca do
analizy danych. Doskonale radzi sobie ona z dużymi plikami csv. W moim
przypadku miałem do uzupełnia danymi około 150 plików csv w których
jedna kolumna nie zawierała potrzebnych danych. Dlaczego akurat Pandas a
nie biblioteka csv? Po to żeby nauczyć się czegoś nowego i wydawało mi się
to prostsze do wykonania.
from pandas import DataFrame, read_csv
import pandas as pd
import glob, os
files = raw_input("Podaj sciezke do plikow: \n")
#wyszukanie plikow csv
for csv in glob.glob(files+"\\"+"*.csv"):
#okreslenie DataFrame i wyczytanie csv z okresleniem kodowania
#i separatora
df = pd.read_csv(csv,sep='\t',encoding='latin2',index_col=False)
#okreslenie kolumny oraz wierszy do zmiany
#.fillna wypenia tylko puste komorki
#inplace musi byc True jesli chce sie zaktualizowac wartosci
df['Unnamed: 15'][3:].fillna(value=10, inplace=True)
#zapis zmienionego csv z okresleniem kodowania i separatora
df.to_csv(csv,sep='\t',index=False,encoding='latin2')
print "Done"

Podobne dokumenty