728x90

result = list() #result = [] 빈  리스트를 만들어줌 
oldfile=open("세종특별자치시.txt","r") #oldfile 은 세종특별자치시 파일을 읽기형식으로 오픈
datalines = oldfile.readlines() #datalines = 데이터를 옮겨줌 (읽어서 datalines에 저장)
#datalines 는 한줄씩 리스트형식[] 으로 저장해줌

for i in range(1,len(datalines)):
    items = datalines[i].split("|") #items 에는 datalines이 줄별로 |쳐져있는데 데이터를 |로 또 리스트형식으로만듬
    before = items[1] + "|" + items[3] + "|" + items[5]+ "|" + items[8] + "\n"#데이터들을 before에 넣어줌
    if before not in result: #before의 데이터가 result에 있는지 확인
        result.append(before) # result에 before의데이터가 없으면 데이터추가해줌

oldfile.close() #oldfile 종료
newfile = open("세종결과.txt","w") #쓰기전용
for line in result: #result은 list이므로 한배열씩 반복
               newfile.write(line)  #newfile=(세종결과)에 써줌
newfile.close() #newfile 종료
print(len(result),"건 데이터 생성완료")\\

 

우편번호는 www.epost.go.kr에서 지역별주소 DB를 다운받은후 세종특별자치시.txt 파일을 이용하여 대용량 자료를 다뤘습니다.

728x90

+ Recent posts