codingstairs
노트에듀라이프연락
⌕검색⌘K
koen

Navigation

  • Intro
  • Blog
  • Life

연락하기

로그인 없이도 보낼 수 있어요. 답변이 필요하면 이메일을 함께 적어 주세요.

  • 익명 폼으로 의견 남기기 →
  • ✉ warragon112@gmail.com
  • 카카오톡 오픈채팅 ↗

© 2026 codingstairs

  • 노트
  • 에듀
  • 검색
  • 라이프
  • 연락
  • 약관
  • RSS
  • GitHub
에듀›로컬 LLM · pgvector · RAG 챗봇 만들기

로컬 LLM · pgvector · RAG 챗봇 만들기

LM Studio + pgvector + Gemini 로 내 문서에 답하는 챗봇을 짓는 7단계. 임베딩부터 프롬프트까지.

1단계부터 시작하기 →
난이도
advanced
강의
7

로컬 LLM · pgvector · RAG 챗봇 만들기

ChatGPT 한 줄로 해결되지 않는 자리가 있어요. 사내 문서 · 개인 정리 · 외부 반출 불가 자료. RAG (Retrieval Augmented Generation) 은 LLM 이 내가 고른 자료 안에서만 답하게 만드는 패턴입니다.

누구를 위한 강좌인가

  • 로컬 GPU · 사내 환경에서 외부로 데이터 보내지 않고 LLM 을 돌리고 싶은 분
  • 내 문서에 대해 정확한 인용으로 답하는 챗봇을 만들고 싶은 분
  • 임베딩 · 벡터 검색 · 프롬프트 설계의 기본을 한 묶음으로 익히고 싶은 분

다 끝내면 가능한 것

  • LM Studio 로 Gemma · Llama 계열 로컬 모델 실행
  • PostgreSQL + pgvector 로 임베딩 저장 · HNSW 인덱스 검색
  • FastAPI + LangChain 최소 파이프라인 (retrieve → prompt → generate)
  • Gemini API 와 로컬 LLM 을 자유롭게 교체
  • 시스템 프롬프트 · few-shot · 출력 형식 제어

단계 흐름

[1] 로컬 LLM ──▶ [2] 임베딩 ──▶ [3] pgvector ──▶ [4] RAG 파이프라인
                                                       │
                                                       ▼
                          [7] SaaS RAG 비교 ◀── [6] 프롬프트 ◀── [5] 클라우드 스위치

전반부 (14) 는 "의미를 숫자로 바꿔 검색" 의 기계 부품. 후반부 (57) 는 모델 · 프롬프트 · 도구 선택 의 운영 판단.

단계 구성

  1. 왜 로컬 LLM · LM Studio 시작 — OpenAI 호환 endpoint / 모델 교체 / VRAM
  2. 임베딩 — 텍스트를 벡터로 — 의미 기반 검색의 수학 · 768차원
  3. pgvector + HNSW 설정 — 설치 · 인덱스 선택 · 코사인 vs 내적
  4. RAG 파이프라인 — 청킹 · retrieve · top-k · rerank · prompt 주입
  5. Gemini · OpenAI 호환 API — 로컬 ↔ 클라우드 스위치 · 비용 · latency
  6. 프롬프트 설계 — 시스템 프롬프트 · few-shot · 출력 스키마 · hallucination
  7. NotebookLM vs 자체 RAG — SaaS 형 RAG 와 비교, 어느 자리가 어떤 도구에 맞는지 결정

전제 — python-data-pipeline 강좌 + Python 3.13+ + uv + PostgreSQL 15+ + LM Studio.

단계별 강의

  1. 1

    왜 로컬 LLM · LM Studio 시작

    →
  2. 2

    임베딩 — 텍스트를 벡터로

    →
  3. 3

    pgvector + HNSW 설정

    →
  4. 4

    RAG 파이프라인

    →
  5. 5

    Gemini · OpenAI 호환 API

    →
  6. 6

    프롬프트 설계

    →
  7. 7

    7단계 — NotebookLM vs 자체 RAG

    →

다른 강좌

전체 보기 →
  • 처음 시작하는 개발 환경
  • HTML/CSS/JS 부터 React, Next, Tailwind 까지
  • Next.js 16 으로 첫 풀스택 앱 만들기
  • Spring Boot 4 로 시작하는 백엔드
  • Python · FastAPI · 데이터 파이프라인
  • AI 시대의 개발 도구 — Claude Code · MCP · 디자인 도구
  • Docker · Caddy · 클라우드 10단계 배포 옵션
  • 중앙 관리자 플랫폼 — 여러 도메인을 한 허브에서
  • Tauri 2 — 데스크탑 · 모바일 한 코드베이스
  • 테스트 전략과 품질 게이트
  • 웹 보안의 기초 — JWT · OAuth · OWASP
  • PostgreSQL 깊게 다루기 + Redis · Kafka
  • 공공데이터 크롤러 만들기
  • 모노레포 · SSOT · 계층 분리 사고