Aule Blog
Transkrypt
Aule Blog
Pobrano z http://aule.pythonanywhere.com/ Uzupełnienie kolumny w pliku csv przy użyciu pandas 1 czerwca 2016 popełniony przez aule Pandas (http://pandas.pydata.org/) jest biblioteką do Pythona służąca do analizy danych. Doskonale radzi sobie ona z dużymi plikami csv. W moim przypadku miałem do uzupełnia danymi około 150 plików csv w których jedna kolumna nie zawierała potrzebnych danych. Dlaczego akurat Pandas a nie biblioteka csv? Po to żeby nauczyć się czegoś nowego i wydawało mi się to prostsze do wykonania. from pandas import DataFrame, read_csv import pandas as pd import glob, os files = raw_input("Podaj sciezke do plikow: \n") #wyszukanie plikow csv for csv in glob.glob(files+"\\"+"*.csv"): #okreslenie DataFrame i wyczytanie csv z okresleniem kodowania #i separatora df = pd.read_csv(csv,sep='\t',encoding='latin2',index_col=False) #okreslenie kolumny oraz wierszy do zmiany #.fillna wypenia tylko puste komorki #inplace musi byc True jesli chce sie zaktualizowac wartosci df['Unnamed: 15'][3:].fillna(value=10, inplace=True) #zapis zmienionego csv z okresleniem kodowania i separatora df.to_csv(csv,sep='\t',index=False,encoding='latin2') print "Done"