본문 바로가기
반응형

Python127

Python - 도메인, 서브도메인, URL 구분 방법 tldextract Python을 이용해서 도메인과 서브 도메인을 구분하는 방법은 Regex를 사용할 수도 있지만, .com과 같은 2차 도메인과 .co.kr 3차 도메인의 차이점, 그리고 서브에 서브도메인을 구분하기 위해서는 많은 조건이 필요해지게 된다. 이를 효과적으로 활용할 수 있는 라이브러리인 tldextract가 있어 간단히 사용할 수 있는 방법을 소개해 보겠다. tldextract는 아래와 같이 co.kr과 같은 국가 2차 도메인 이외 dev와 같은 1차 도메인도 아래처럼 쉽게 구분해 낸다. import tldextract url = '01-sub.web.testsite.co.kr' ext = tldextract.extract(url) url = '01-sub.web.testsite.dev' ext = tldex.. 2024. 3. 2.
Python - 지역 변수와 전역 변수 그리고 global 지역 변수와 전역 변수 파이썬에서 변수는 크게 지역 변수와 전역 변수로 나뉜다. 지역 변수는 함수 안에서만 사용 가능한 변수를 의미한다. 함수 밖에서 호출하면 에러가 발생한다. def 지역변수(): a = '지역변수' print(a) 지역변수() print(a) # 에러 발생 전역 변수는 함수와 상관없이 프로그램 전체에서 사용 가능한 변수를 의미한다. 함수 밖에서 선언하거나, 함수 안에서 global 키워드를 사용하여 선언하면 전역 변수가 된다. a = '전역변수' def 지역변수(): print(a) 지역변수() print(a) 지역 변수와 전역 변수의 차이점 지역 변수 선언 위치: 함수 내부 사용 범위: 함수 내부 선언 방법: a = 1전역 변수 전역 변수 선언 위치: 함수 내부,함수 외부 사용 범위.. 2024. 3. 2.
Python - 파이썬 코드 실행 시간 측정 perf_counter, process_time 차이점 파이썬 코드 실행 시간 측정 파이썬 코드를 작성하다 보면 특정 코드가 얼마나 걸리는지 확인하고 싶을 때가 있다. 이때 사용할 수 있는 함수가 time 라이브러리의 perf_counter()와 process_time()이다. perf_counter, process_time 차이점 perf_counter()는 프로그램의 전체 실행 시간을 측정한다. 여기에는 프로그램이 실행되지 않고 대기하는 시간도 포함된다. 반면, process_time()은 프로그램이 실제 프로세싱(처리)된 시간만 측정한다. 아래 예제를 보자. import time def perf_proc(): time.sleep(1) for value in range(1, 5): pass start = time.perf_counter() perf_pro.. 2024. 3. 2.
SQLAlchemy로 MySQL 데이터베이스 연결 및 쿼리하기 SQLAlchemy는 Python에서 데이터베이스를 연결하고 쿼리하는 데 사용할 수 있는 강력한 라이브러리이. MySQL을 포함한 다양한 데이터베이스와 호환된다. 데이터베이스 연결 SQLAlchemy를 사용하여 MySQL 데이터베이스에 연결하려면 먼저 create_engine() 함수를 사용해. 이 함수의 인수에는 데이터베이스 연결 정보가 포함된다. import sqlalchemy as db database_url = "mysql+pymysql://username:password@host:port/database" engine = db.create_engine(database_url) 위 예제에서는 다음과 같은 데이터베이스 연결 정보를 사용한다. 사용자 이름: username 비밀번호: password .. 2024. 3. 2.
Pylint - docstring "Missing function or method docstring" 메시지 Pylint는 파이썬 코드의 품질을 향상시키기 위한 도구로, 코드의 구문 오류, 스타일 오류, 잠재적인 버그 등을 검사한다. 이 중 "Missing function or method docstring" 메시지는 함수나 메서드에 docstring이 없음을 나타난다. docstring이란? docstring은 함수나 클래스, 모듈의 목적, 사용 방법, 반환값 등을 설명하는 주석이다. docstring을 작성하면 코드의 이해도를 높이고, 다른 개발자가 코드를 이해하고 수정하기 쉽게 할 수 있다. docstring의 구조 docstring은 세 부분으로 구성된다. 개요(summary) 함수나 메서드의 목적을 한 문장으로 요약 문서화(documentation 함수나 메서드의 사용 방법, 반환값, 입력값 등을 설명.. 2024. 3. 2.
Python - Zipfile 한글 파일이름 깨짐 해결하기 Zipfile에서 압축을 해제한 파일의 한글깨짐이 발생하는데 이는 인코딩 문제이다. 이를 해결하기 위해서는 파일 이름 정보를 압축을 해제하기 전에 디코딩을 진행해야 한다. 아래 euc-kr 으로 디코딩을 하는 방식으로 파일에서 사용된 한글을 정상적으로 인식시킬 수 있다. import zipfile def extract_korean_zip(zip_path, extract_path): with zipfile.ZipFile(zip_path, 'r') as zip_ref: for zip_info in zip_ref.infolist(): # 깨진 한글 파일 이름 복원 filename = zip_info.filename.encode('cp437').decode('euc-kr') # 폴더 경로 처리 if filena.. 2024. 3. 1.
Sqlachemy - 특정 날짜 하루의 데이터를 가져오기 다음은 SQLAlchemy를 사용하여 특정 날짜 하루의 데이터를 가져오는 코드이다. from sqlalchemy import create_engine from sqlalchemy.orm import Session # 데이터베이스 연결 설정 engine = create_engine("postgresql://user:password@localhost/database") # 세션 생성 session = Session(engine) # 특정 날짜 date = "2024-01-07" # 쿼리 query = session.query(Table).filter(Table.created_at >= date).filter(Table.created_at < date + timedelta(days=1)) # 결과 조회 res.. 2024. 2. 29.
Python - Missing optional dependency 'openpyxl' 해결 Missing optional dependency 'openpyxl' Pandas의 엑셀 읽기의 호환성을 위해서 보통 openpyxl 을 사용한다. openpyxl을 별도로 제공되는 Python용의 엑셀 라이브러리로써, 현재 3.1.2버전까지 나왔으며, Pandas에서 제공하는 기본 엑셀 라이브러리보다 좋은 호환성을 제공하여 많이 이용한다. 위 에러는 Pandas에서 openpyxl를 사용하는데, 해당 라이브러가 없을 때 발생한다. pd.read_excel(file_path, engine='openpyxl') 즉 openpyxl를 이용하고자 한다면, pip를 이용해서 설치하도록 하자. pip install openpyxl 2024. 2. 29.
Python - URL, WebContent Encode / Decode 하기 HTTP 호출을 진행하면, URL을 인코딩하거나 디코딩하는 일을 자주 경험하게 된다. 이때 주의할 점음 문자열을 encode/decode 를 Byte 레벨로하는 것이 아닌 문자열 수준으로 진행해주어야 한다. 즉 전체 문자열이 아닌 일부 UTF-8 로 작성된 문자열만 변환해주면 된다. 이를 효과적으로 해주는 라이브러리가 urllib 의 parse의 quote와 unquote 를 통해 진행할 수 있다. urllib.parse — URL을 구성 요소로 구문 분석 — Python 3.12.2 문서 urllib.parse — Parse URLs into components Source code: Lib/urllib/parse.py This module defines a standard interface to br.. 2024. 2. 29.
반응형