본문 바로가기
반응형

PROGRAMMING/Python43

[PYTHON] Assert (가정 설정문) 개념, 정리, 설명 안녕하세요, HELLO 파이썬에서 try, except 구문 등을 통해 예외를 발생시키는 예외 처리랑 비슷하지만, 예외 처리는 에러가 발생했을 때 대응하기 위한 목적이라면, assert (가정 설정문)은 입력이 조건과 일치하도록 확인하고자 할 때 사용됩니다. assert 구문은 1. 이후에 연산이 진행되고 나서 실패하기보다는, 사전에 문제를 파악하는 데 도움이 되며, 2. 다른 개발자와 코드를 공유할 때, 문제가 발생한 부분에 이해를 도울 수 있습니다. 오늘은 파이썬에 assert 구문을 살펴보도록 하겠습니다. STEP 1. 'assert' 개념 STEP 2. 'assert' 설명 STEP 1. 'assert' 개념 Assert 조건문은 True가 아닐 경우에, 예외를 발생시킵니다. 코드를 추가, 수정 .. 2022. 8. 7.
[PYTHON] Pandas Groupby 그룹별 처리 (파이썬, 판다스) 안녕하세요, HELLO Python, 파이썬에서 pandas의 groupby 함수를 통해 데이터를 집단화하여 데이터를 분석, 처리합니다. 이번에는 groupby 함수에 대해서 정리하며, 사용법에 대해서 공유하려고 합니다. STEP 1. 'Pandas Groupby' 개념 STEP 2. 'Pandas Groupby' 설명 STEP 1. 'Pandas Groupby' 개념 pandas의 groupby 함수는 데이터를 집단, 그룹별로 요약하고 판단할 수 있습니다. 전체 데이터를 그룹으로 나누고 (split), 그룹별로 정리하여 (apply), 이후에 해당 결과를 모으는 단계 (combine)로 이뤄집니다. (Function workflow: Spilt → Apply → Combine) pandas에서도 이와 .. 2022. 7. 22.
[PYTHON] stale error 해결 방법 (selenium, 셀레니움) 안녕하세요, HELLO 오늘은 selenium library를 사용할 경우 발생하게 되는 'stale error'의 해결 방법에 대해서 살펴보고자 합니다. selenium.common.exceptions.StaleElementReferenceException: Message: stale element reference: element is not attached to the page document 위 에러는 페이지에서 데이터가 업로드되기 전에 너무 빨리 데이터를 가져올 경우, 발생하는 에러입니다. 이를 해결하기 위해서는 명시적으로 'time.sleep()'을 입력해서 해결도 가능합니다. 다만, 이처럼 진행하게 되면 페이지 구성에 따라 데이터마다 가져오는 속도가 상이하기에, 오랜 시간이 걸릴 수도 있으며.. 2022. 7. 1.
[PYTHON] Dictionary 조건 하에 key, value 삭제 안녕하세요, HELLO 오늘은 파이썬에서 Dictionary에서 조건을 통해 key, value를 삭제하는 방법에 대해서 살펴보고자 합니다. for, while loop를 통해 dictionary에서 제거할 시, 아래처럼 error가 발생하게 됩니다. 이 같은 error의 경우에는, if 조건문을 통해 해결할 가능합니다. (RuntimeError: dictionary changed size during iteration) STEP 1. 'Dictionary 조건 key, value 삭제' 방법 목표 key, value를 if 조건식으로 아래처럼 작성해서 제거할 수 있습니다. # sample dictionary sample_dic = {'p': 0,'y': 1, 't': 2, 'h': 3,'o': 4, '.. 2022. 6. 24.
[PYTHON] sort, sorted 항목 정렬 (오름차순, 내림차순) 안녕하세요, HELLO 이번에는 Python 내장 메서드 sort와 함수 sorted에 대해서 살펴보고자 합니다. sort는 일정한 규칙에 따라 순서대로 나열하는 것을 의미합니다. 인자를 전달하지 않고 sort 함수를 호출하면, 오름차순 정렬로 배열됩니다. STEP 1. 'sort, sorted 항목 정렬' 개념 파이썬 array, list, dictionary는 sort()라는 메서드를 가지고, 이를 활용해서 항목을 정렬된 상태로 배열할 수 있습니다. 그리고 sorted() 내장 함수는 객체로부터 정렬된 상태로 배열합니다. 인자를 전달하지 않고 sort 메서드와 sorted 함수를 호출하면, 오름차순 정렬로 배열됩니다. STEP 2. 'sort, sorted 항목 정렬' 설명 sort 메서드는 arra.. 2022. 6. 17.
[PYTHON] pandas "Unnamed : 0" column 삭제, 제거 안녕하세요, HELLO 오늘은 read_csv() 함수를 사용하여 csv 파일을 읽어올 때, 의도하지 않은 컬럼(unnamed: 0)이 추가됩니다. 이번에는 'unnamed: 0' 컬럼을 제거하는 방법에 대해서 알아보겠습니다. STEP 1. 'unnamed: 0' 제거 방법 csv, excel 등을 불러오는 pandas library를 호출한 후, read_csv 함수를 이용해 데이터를 불러오면, 아래 그림처럼 'unnamed: 0' 컬럼이 추가됩니다. import pandas as pd df_test = pd.read_csv('../[기업마당]/스타트업 지원 사업 2022-04-22 검색결과.csv') df_test.head() 컬럼을 제거하는 방법에는 두 가지가 있습니다. 1. read_csv 함수의.. 2022. 4. 22.
[PYTHON] 기업마당_정부 지원 사업 자동화 수집 (크롤링) 안녕하세요, HELLO 중소벤처기업부는 중소기업, 스타트업, 예비창업자 등을 위한 정부 사업을 '기업마당' 사이트에 통합하여 관리하고 있습니다. 2022년 업데이트를 통해 기존에 제공하던 지원 사업 엑셀(excel)을 더이상 제공하고 있지 않습니다. 스타트업 지원 사업 뉴스레터를 관리하면서, 정보를 원할하게 수집하기 위해 python 크롤링 코드를 작성하여 공유합니다. 엑셀로 지원 사업을 관리하는 정부 사업 담당자분들은 확인하시기 바랍니다. STEP 1. '기업마당' 개념 STEP 2. '기업마당' 수집 크롤링 설명 STEP 1. '기업마당' 개념 기업마당은 금융, 인력, 경영, 수출 등 중소기업 등을 위한 정책, 지원 사업을 통합하여 안내하고 있습니다. URL : https://www.bizinfo.g.. 2022. 4. 10.
[PYTHON] numpy.random.randn (NumPy 난수) 안녕하세요, HELLO PYTHON에서 데이터 분석을 할 때 기초 라이브러리로 사용되는 Numpy에 대해서 알아보도록 하겠습니다. NumPy는 수학, 과학 연산을 위한 파이썬의 필수적이고 기본적인 패키지이며, 오늘은 Numpy에서 난수 생성 함수인 random 모듈에서 표준 정규분포(Standard normal distribution)를 만드는 randn 함수에 대해서 정리해보겠습니다. STEP 1. 'numpy.random.randn' 개념 STEP 2. 'numpy.random.randn' 설명 STEP 1. 'numpy.random.randn' 개념 random.randn 함수는 표준정규분포 (Standard normal distribution)로부터 샘플링된 무작위 난수를 반환합니다. Return.. 2022. 2. 28.
[PYTHON] numpy.random.randint (NumPy 난수) 안녕하세요, HELLO PYTHON에서 데이터 분석을 할 때 기초 라이브러리로 사용되는 Numpy에 대해서 알아보도록 하겠습니다. NumPy는 수학, 과학 연산을 위한 파이썬의 필수적이고 기본적인 패키지이며, 오늘은 Numpy에서 난수 생성 함수인 random 모듈에 randint 함수에 대해서 정리해보겠습니다. STEP 1. 'numpy.random.randint' 개념 STEP 2. 'numpy.random.randint' 설명 STEP 1. 'numpy.random.randint' 개념 random.randint() 함수는 최소값 이상, 최대값 미만 [최소값, 최대값)의 범위에서 임의의 정수를 만듭니다. Return random integers from low (inclusive) to high (.. 2022. 2. 27.
반응형