(폐쇄망 LLM 7-4) Open-WebUI 설치 - 로컬 ChatGPT 인터페이스 구축

사내 ChatGPT 구축 - 업무망/폐쇄망에서 Open-WebUI로 ChatGPT와 유사한 웹 인터페이스를 만드는 방법. Docker 이미지를 오프라인 환경으로 전송하고 vLLM 서버와 연동합니다.

(폐쇄망 LLM 7-3) vLLM 서버 설치 가이드

사내 LLM 서버 구축 실전 - 업무망/폐쇄망에서 vLLM으로 로컬 LLM 서버를 구축하는 가이드. Docker 이미지와 HuggingFace 모델을 오프라인 환경으로 전송하고 AI 서비스를 구동합니다.

사내 LLM 서버 구축을 위한 Docker 환경 준비. 업무망/폐쇄망에서 Docker와 NVIDIA Container Toolkit을 오프라인 설치하는 방법.

사내 AI 시스템 설계 - 업무망/폐쇄망에서 로컬 에이전트 코딩 시스템을 구축하기 위한 GPU 서버 사양과 소프트웨어 스택 설계 가이드. vLLM, Open-WebUI, Claude-Code 조합으로 사내 AI 서비스를 구성합니다.

사내 AI 코딩 환경 구축 - 업무망/폐쇄망에서 Claude Code를 로컬 LLM과 연동하는 방법. claude-code-router로 vLLM 서버와 연결하여 에이전트 코딩 환경을 구축합니다.

사내 LLM 구축 시 양자화 기법 선택 가이드. 업무망/폐쇄망 환경에서 FP8, AWQ, GPTQ, GGUF의 특징과 vLLM, llama.cpp 호환성을 정리합니다.

사내 AI 서버 구축 시 서빙 프레임워크 선택 가이드. 업무망/폐쇄망에서 vLLM, SGLang, llama.cpp, Ollama의 장단점을 비교합니다.

사내 LLM 서버 구축 시 알아야 할 추론 속도(TPS) 개념. 업무망/폐쇄망 환경에서 Prefill/Decode 차이와 MoE vs Dense 모델 비교를 통해 모델 선택 기준을 제시합니다.

사내 LLM 구축을 위한 모델 선택 가이드. 폐쇄망/업무망 환경에서 로컬 LLM 벤치마크 분석과 VRAM 메모리 요구량 계산법, FP8 모델과 KV Cache 메모리 산정 방법을 다룹니다.

사내 AI 구축의 첫걸음 - 업무망/폐쇄망에서 로컬 LLM 서버를 구축하여 Claude Code 에이전트 코딩 환경을 만드는 방법. 망분리 환경 vLLM 기반 AI 코딩 시스템 구축 가이드.