팬더 데이터를 기존 CSV 파일에 추가하려면 어떻게 해야 합니까?

programing

팬더 데이터를 기존 CSV 파일에 추가하려면 어떻게 해야 합니까?

copyandpastes 2022. 10. 30. 21:05

팬더 데이터를 기존 CSV 파일에 추가하려면 어떻게 해야 합니까?

팬더를 사용할 수 있는지 알고 싶습니다.to_csv()기존 CSV 파일에 데이터 프레임을 추가하는 함수입니다.csv 파일의 구조는 로드된 데이터와 동일합니다.

팬더 함수에 python 쓰기 모드를 지정할 수 있습니다.덧붙여서 그것은 'a'이다.

고객님의 경우:

df.to_csv('my_csv.csv', mode='a', header=False)

기본 모드는 'w'입니다.

파일이 처음에 누락되었을 가능성이 있는 경우는, 다음의 편차를 사용해 헤더가 최초의 기입시에 인쇄되고 있는 것을 확인할 수 있습니다.

output_path='my_csv.csv'
df.to_csv(output_path, mode='a', header=not os.path.exists(output_path))

추가 모드에서 파일을 열면 csv에 추가할 수 있습니다.

with open('my_csv.csv', 'a') as f:
    df.to_csv(f, header=False)

이게 CSV라면foo.csv:

,A,B,C
0,1,2,3
1,4,5,6

예를 들어 이 글을 읽고 첨부하면df + 6:

In [1]: df = pd.read_csv('foo.csv', index_col=0)

In [2]: df
Out[2]:
   A  B  C
0  1  2  3
1  4  5  6

In [3]: df + 6
Out[3]:
    A   B   C
0   7   8   9
1  10  11  12

In [4]: with open('foo.csv', 'a') as f:
             (df + 6).to_csv(f, header=False)

foo.csv다음과 같이 됩니다.

,A,B,C
0,1,2,3
1,4,5,6
0,7,8,9
1,10,11,12

with open(filename, 'a') as f:
    df.to_csv(f, header=f.tell()==0)

존재하지 않는 한 파일 생성, 그렇지 않은 경우 추가
파일이 생성되면 헤더를 추가하고, 그렇지 않으면 건너뜁니다.

헤더 체크 세이프가드와 함께 사용하는 도우미 기능:

def appendDFToCSV_void(df, csvFilePath, sep=","):
    import os
    if not os.path.isfile(csvFilePath):
        df.to_csv(csvFilePath, mode='a', index=False, sep=sep)
    elif len(df.columns) != len(pd.read_csv(csvFilePath, nrows=1, sep=sep).columns):
        raise Exception("Columns do not match!! Dataframe has " + str(len(df.columns)) + " columns. CSV file has " + str(len(pd.read_csv(csvFilePath, nrows=1, sep=sep).columns)) + " columns.")
    elif not (df.columns == pd.read_csv(csvFilePath, nrows=1, sep=sep).columns).all():
        raise Exception("Columns and column order of dataframe and csv file do not match!!")
    else:
        df.to_csv(csvFilePath, mode='a', index=False, sep=sep, header=False)

처음에는 pyspark 데이터 프레임으로 시작 - pyspark 데이터 프레임의 스키마/컬럼 유형에 따라 유형 변환 오류가 발생하였습니다(팬더 df로 변환한 후 csv로 추가).

각 df의 모든 컬럼을 강제로 type string으로 하고 이를 다음과 같이 csv에 추가하여 문제를 해결했습니다.

with open('testAppend.csv', 'a') as f:
    df2.toPandas().astype(str).to_csv(f, header=False)

파티에는 조금 늦었지만 파일을 여러 번 열고 닫거나 데이터, 통계 등을 기록하는 경우 컨텍스트 관리자를 사용할 수도 있습니다.

from contextlib import contextmanager
import pandas as pd
@contextmanager
def open_file(path, mode):
     file_to=open(path,mode)
     yield file_to
     file_to.close()


##later
saved_df=pd.DataFrame(data)
with open_file('yourcsv.csv','r') as infile:
      saved_df.to_csv('yourcsv.csv',mode='a',header=False)`

2021년에는 이렇게 했어요.

예를 들어 csv가 있다고 합시다.sales.csv다음과 같은 데이터가 포함되어 있습니다.

sales.csv:

Order Name,Price,Qty
oil,200,2
butter,180,10

행을 추가하려면 데이터 프레임에 로드하여 다음과 같이 csv에 추가합니다.

import pandas

data = [
    ['matchstick', '60', '11'],
    ['cookies', '10', '120']
]
dataframe = pandas.DataFrame(data)
dataframe.to_csv("sales.csv", index=False, mode='a', header=False)

출력은 다음과 같습니다.

Order Name,Price,Qty
oil,200,2
butter,180,10
matchstick,60,11
cookies,10,120

언급URL : https://stackoverflow.com/questions/17530542/how-to-add-pandas-data-to-an-existing-csv-file

저작자표시 (새창열림)

'programing' 카테고리의 다른 글

JavaScript를 사용하여 새 페이지를 로드하지 않고 브라우저에서 URL 변경 (0)	2022.11.08
WHERE 절을 사용하여 쿼리에 배열 전달 (0)	2022.11.08
var 키워드의 목적과 사용(또는 생략)은 무엇입니까? (0)	2022.10.30
Apache Tomcat 응용 프로그램의 기본 세션 시간 초과 (0)	2022.10.30
for loop 끝에 있는 ";"의 목적은 무엇입니까? (0)	2022.10.30

현재글팬더 데이터를 기존 CSV 파일에 추가하려면 어떻게 해야 합니까?

댓글

각종 프로그래밍 정보를 다루는 블로그입니다.

Spring, Vuex, jquery, java, C++, javascript, vuejs2, C, c#, spring3,

Today :
Yesterday :

티스토리툴바