본문 바로가기
반응형

전체 글907

RNN - Python numpy 기초 코드 실습 딥러닝을 공부한다면, 시작은 RNN부터 하는것이 전체적인 흐름을 이해하는데 큰 도움이 된다.여기에서는 RNN을 파이썬 코드로 작성하는 방식으로 이해해보도록 하겠다.RNN은 Recurrent Neural Network의 약자로, 시퀀스 데이터를 처리하는 데 유용한 인공 신경망의 한 종류이다.RNN은 자연어 처리, 음성 인식, 이미지 캡셔닝 등 다양한 분야에 적용될 수 있으며, RNN은 시간 단계의 입력으로 사용하여, 이전 시간 단계의 출력을 현재 시간적인 의존성을 모델링할 수 있다.RNN을 파이썬으로 구현하는 방법은 여러 가지가 있고, 가장 간단한 방법은 numpy 라이브러리를 사용하는 것이다.numpy는 다차원 배열과 행렬 연산을 지원하는 파이썬 패키지로, numpy를 사용하면 RNN의 순전파와 역전파를.. 2024. 6. 8.
2023년 빅데이터 오픈소스 플랫폼 Top 3 2023년 빅데이터 오픈소스 플랫폼 중 가장 유용한 오픈 소스 플랫폼 3가지를 소개한다.1. Hadoop대규모 데이터 처리에 최적화된 분산 처리 프레임워크로, HDFS(Hadoop Distributed File System)와 MapReduce를 기반으로 하며, 저렴한 비용으로 대규모 데이터를 효율적으로 처리할 수 있어서, 구조화 데이터와 비구조화 데이터를 모두 처리할 수 있으며, 확장성이 뛰어나 대규모 데이터 분석에 적합하다.장점저렴한 비용: 오픈소스 프로젝트이기 때문에 라이선스 비용이 발생하지 않는다. 또한, 하드웨어 요구 사항이 낮기 때문에 저렴한 하드웨어를 사용하여 Hadoop 클러스터를 구축할 수 있다.고성능: 분산 처리를 통해 대규모 데이터를 빠르게 처리할 수 있다.신뢰성: 데이터를 3중으로 .. 2024. 6. 8.
LLM.int8() - Large Language Model (LLM)의 계산 성능을 개선하기 위한 양자화 방법 LLM.int8() 개요LLM.int8()은 Large Language Model (LLM)의 계산 성능을 개선하기 위한 8-bit 양자화 방법이다. 기존의 8-bit 양자화 방법은 성능 저하가 발생하는 문제점이 있었는데, LLM.int8()은 이를 해결하여 LLM의 성능을 유지하면서도 계산 성능을 크게 향상시킬 수 있다 LLM.int8()의 핵심 요소는 vector-wise quantization과 mixed-precision decomposition이다. vector-wise quantization은 텐서 당 여러 개의 scaling constant를 사용하여 outlier의 영향력을 줄이는 방법이다. mixed-precision decomposition은 0.1%의 outlier만 16-bit로 나.. 2024. 6. 8.
LLM - Llama2(라마2) 모델 개인 노트북으로 실행하기(CPU기반) 오늘 발견한 아주 좋은 글이 있어서 여기에 공유해 본다.내용은 라마2 모델을 CPU기반으로 실행할 수 있다는 것이다.요즘 GPU 메모리 부분을 많이 최적화 하고 있는 것으로 알고 있었는데, 이제 CPU+GPU 등 점점 모델들이 최적화 되고 있음을 느끼고 있다.이는 어떻게 가능할까? 여기게 요점 위주로 간단히 정리해보도록 하겠다.관련 내용은 아래에서 확인이 가능하다.Running Llama 2 on CPU Inference Locally for Document Q&A | by Kenneth Leung | Towards Data Science Running Llama 2 on CPU Inference Locally for Document Q&AClearly explained guide for running .. 2024. 6. 8.
Python - 스플렁크(Splunk) Query 검색 Splunk 는 외부에서 손쉽게 쿼리 검색등 다양한 작업을 할 수 있도록 지원하고 있다.그중 쿼리 검색에 대해서 알아보도록 하자.먼저 Splunk 라이브러리 splunk-sdk를 설치하자.pip install splunk-sdk이후 아래와 같은 코드를 통해 쿼리 검색이 가능하다.import splunklib.client as client# 스플렁크 연결HOST = "splunk_host"PORT = 8089USERNAME = "account_username"PASSWORD = "account_password"# 검색 쿼리 설정SEARCH_QUERY = "search index=my_index | stats count by _time"# 스플렁크 연결service = client.connect( ho.. 2024. 6. 8.
Python - 리스트(list) 중복제거, 고유값 만들기 Python에서 리스트를 중복값을 제거하는 가장 손쉬운 방법은 set() 이라는 내부 함수를 이용하는 방법이다.set()을 이용하면 리턴 값으로 중복된 값을 제거한 list를 기본적으로 dict()로 반환하게 된다.다음과 같이 이용이 가능하다. >>> set([1,2,3,4,5,1,2,4,5,6,2,1,1,34,3,]){1, 2, 3, 4, 5, 6, 34}한글과 같은 문자열도 정상적으로 사용이 가능하다. >>> set(["2","1","1","ㄴ","ㄱ","ㄷ","한","ㄴ","ㄱ"]){'한', '1', 'ㄴ', 'ㄱ', 'ㄷ', '2'}결과를 보면, 딕셔너리 형태이긴 하지만 리스트처럼 활용이 가능하다. 하지만 dict 사용에 데이터타입을 list로 활용하고자 한다면, list 문을 추가하여 결과를 반.. 2024. 6. 8.
Tool - 파티션 매직 포터블 파티션 확장/이동하기 (무료 파티션 관리) 간혹 파티션 크기를 새로 잡거나 조정하고 싶을 때 윈도우 기본 프로그램만으로 진행하기에는 어려운 느낌이 강하가.여기에서는 파티션 조정하는 방안에 대해서 몇가지 주요 팁을 얘기해보도록 하겠다.우선 프로그램은 다음 프로그램을 이용하면 무료로 조정이 가능하다.[Macrorit Partition Expert Portable v5] - 설치하지 않고 바로 사용이 가능하다.Download윈도우 11/10에서도 잘 동작하기 때문에 파티션 조정이 필요할 때 유용하게 사용할 수 있다.프로그램은 무료로 설치 없이 바로 사용이 가능하다.그럼 주요 기능인 공간을 확장하는 방법에 대해서 알아보도록 하자.공간 확장하기공간을 확장하는 방법은 디스크에서 현재 파티션의 앞과 뒤로 할당되지 않은 공간이 존재해야 가능하다.따라서 사용하지.. 2024. 6. 8.
Python - ' '.join() 리스트(list) 연결하여 문자열 로 만들기 파이썬의 join() 함수는 리스트(list)에 있는 요소들을 지정된 구분자로 연결하여 문자열을 반환하는 함수이다.실무에서 리스트 값을 문자열로 표현하고자 할 때 자주 사용된다.예제 코드로 살펴보면, 아래와 같이 구분자를 \n 를 줄경우 각 리스트에 항목 사이에 \n(줄바꿈)이 들어가서 화면에 표시될때 줄바꿈 효과가 나타나게 된다.strings = ["Hello", "Python", "World"]result = "\n".join(strings)print(result) 만약 공객을 이용하게 되면, 문자열 사이에 공백이 들어가게 된다.strings = ["Hello", "Python", "World"]result = " ".join(strings)print(result) 2024. 6. 8.
Python - Blogger API 로 글 작성하기 먼저 블로거를 API로 활용하기 위해서는 블로거에 로그인하는 구글 계정이 필요하다.헤당 계정을 통해  https://console.cloud.google.com/ 으로 로그인하여 API 계정이 생성할 수 있다.먼저 인증 부분을 해결해야 한다. 인증은 API 페이지를 이용한 간편 방법과아래는 클라우드 콘솔에서 진행하는 정식 방법으로 가능하다.먼저 API 페이지에서 진행하는 방법으로 블로거 API를 위한 간편 설정 부분이다.Blogger API 페이지에서 인증 생성1. Oauth 를 이용한 방법Blogger API: API 사용  |  Google for Developers위 링크에 접속하면, 요청 승인 및 애플리케이션 식별 페이지가 열리는데, 여기에서 블로거용 Oauth의 발급과 요청 승인을 바로 진행할 .. 2024. 6. 8.
반응형