본문 바로가기

Bigdata77

[LLM 리뷰] 범용 모델 압도하는 번역 특화 AI, Tencent Hy-MT2-7B GGUF 분석 텐센트(Tencent) 훈위안 팀이 2026년 5월에 공개한 번역 특화 대형 언어 모델 Hy-MT2-7B에 대한 기술 분석 보고서입니다. 본 포스팅에서는 개인 PC 등 로컬 환경에서 가볍고 빠르게 실행할 수 있도록 양자화된 GGUF 파일 형식을 중심으로 핵심 성능과 실사용 평을 정리했습니다.💡 요약: "Fast-Thinking" 추론 기법을 탑재하여 7B 크기임에도 수백억 파라미터급 범용 모델과 대등한 번역 품질을 보여주는 다국어 기계 번역 특화 모델입니다.1. 모델 개요 및 핵심 아키텍처Architecture공식 명칭: Hy-MT2 (Hunyuan Machine Translation 2)개발사: 텐센트 훈위안(Tencent Hunyuan) 연구팀파라미터 사이즈: 70억 (7B)지원 언어: 한국어, 중.. 2026. 5. 29.

AMD Radeon/ryzen 에서 PyTorch 설치 및 LLM 구동 가이드 (7.2.1) AMD 의 ROCm 도구를 사용한 PyTorch Windows 설치 방법과 LLM 실행까지 정리했습니다.📋 사전 준비 사항필수 요구사항Python 3.12 이상 (필수)AMD 그래픽 드라이버: 버전 26.2.2 이상AMD 공식 다운로드 페이지🚀 설치 방법 (PIP 사용)단계 1: ROCm SDK 설치CMD 또는 PowerShell 에서 다음 명령 실행:CMD:cmdpip install --no-cache-dir ^ https://repo.radeon.com/rocm/windows/rocm-rel-7.2.1/rocm_sdk_core-7.2.1-py3-none-win_amd64.whl ^ https://repo.radeon.com/rocm/windows/rocm-rel-7.2.1/rocm_sd.. 2026. 5. 12.

GPT2로 이해하는 로봇이 학습하는 법 GPT-2: 이해하는 로봇이 학습하는 법GPT-2 논문(Language Models are Unsupervised Multitask Learners)은 "다음에 올 단어를 예측하는 것만으로 모든 문제를 풀 수 있다"는 것을 증명했습니다.1. Encode: 입력을 숫자로 바꾸는 세부 과정단순한 숫자가 아니라, 단어의 의미와 위치를 결합하는 과정입니다.(1) BPE (Byte Pair Encoding)GPT-2는 단어를 무작정 쪼개지 않고, 가장 자주 나타나는 문자 쌍을 하나로 합쳐서 어휘 사전(Vocab)을 만듭니다. (약 50,257개 토큰)(2) 코드 구현: Embedding & Position# 768차원의 숫자로 변환하는 과정self.wte = nn.Embedding(vocab_size, n_emb.. 2026. 2. 3.

ROCm - Ryzen AI HX 370, 450 이하 PyTorch와 ComfyUI 설치하기 ROCm 7.10.0 프리뷰 버전을 활용해 AMD GPU에서 PyTorch와 ComfyUI를 설치하고, 텍스트‑투‑이미지 AI 모델을 실행하는 전체 흐름을 단계별로 설명합니다.필수 조건지원되는 AMD GPU (Radeon™ Instinct, Radeon™ Pro, Radeon™ RDNA 기반) Linux 배포판 (Ubuntu 22.04, RHEL 9 등) 혹은 Windows 10/11Python 3.9 이상 및 pipDocker (선택 사항, 이미지 Pull을 위한)1. Python 가상환경 준비시스템 전체에 영향을 주지 않도록 별도의 가상환경을 생성합니다.python -m venv rocm-envsource rocm-env/bin/activate # Linux/macOS# .\rocm-env\Scr.. 2026. 1. 30.

Nemotron 3에 대해서 다른 모델보다 다른점 NVIDIA Nemotron 3는 “모델 자체”보다도, 데이터·훈련 포맷·엔터프라이즈 파이프라인까지 묶어서 내놓는 풀스택 패키지라는 점이 다른 오픈 모델들과 가장 크게 다르다.1. 모델 계열과 아키텍처 포지션Nemotron 3는 Nano/Ultra 등 여러 스케일로 구성된 패밀리로, 엔터프라이즈·에이전트용을 겨냥한 기본/추론/코드 특화 변형까지 포함하는 “기반 모델 군”이다.기존 Nemotron‑3‑8B 같은 버전은 표준 디코더‑온리 Transformer지만, 최신 Nemotron 3에서는 하이브리드 Transformer‑Mamba + MoE 구조가 도입되어, 토큰당 활성 파라미터를 줄이면서 긴 컨텍스트와 추론 효율을 동시에 노린다.같은 세대의 Llama 3.1, Qwen3, DeepSeek 등은 .. 2025. 12. 23.

ComfyUI on Windows + 8 GB GPU  메모리 제한을 극복하는 방법 8 GB VRAM은 Stable Diffusion 시리즈 모델을 실행하는 데는 충분하지만, 고해상도, 고품질 옵션을 동시에 켜면 금 금 메모리 부족(Out‑of‑Memory) 문제가 발생할 수 있다. 아래에 실제 적용 가능한 설정 순서와 추가 팁을 정리했으니, 단계별로 따라해 보세요.1️⃣ 기본 설정 – “안전하게 시작하기”설정권장값이유SamplerEuler a 또는 DPM++ 2M Karras메모리 소모가 적은 samplerResolution512 × 512 (기본) → 640 × 640 (가능하면)해상도가 클수록 VRAM 사용량 ↑Batch size1여러 이미지를 동시에 생성하면 메모리 급증PrecisionFP16 (자동)FP32 대비 절반의 메모리 사용ModelStable Diffusion 1.5 .. 2025. 12. 23.

이전 1 2 3 4 ··· 13 다음

티스토리툴바