Open Source · AI 반도체 클라우드

openKcloud
Platform

AI반도체(NPU, PIM, GPU) 기반 하이퍼스케일 클라우드 서비스 플랫폼. 초거대 AI 모델 서비스의 최적 성능 확보부터 운영 비용 최소화까지
통합 지원합니다.

↓ v0.1.0 다운로드 ⌥ Github 보기

Stable: v0.1.0 · Apache 2.0 · K-Cloud

PLATFORM STACK

kcloud-mnt AI반도체 클라우드 서비스 통합 관리KCLOUD-MNT

kcloud-llm 초거대 AI 서비스 지원KCLOUD-LLM

kcloud-opt AI반도체 클라우드 서비스 최적화KCLOUD-OPT

kcloud-svc AI반도체 클라우드 서비스 제공KCLOUD-SVC

AI반도체 NPU / PIM / GPUAI SEMICONDUCTOR

서브모듈

v0.1

최신 릴리스

100%

오픈소스

K8s

Cloud Native

// Core Features

주요 기능

이기종 AI반도체 자원 최적 관리부터 초거대 AI 모델 실행환경 구축/실증까지, openKcloud의 핵심 기능을 소개합니다.

01 / 06

🔷

이기종 AI반도체 자원 최적 관리

NPU, PIM, GPU 등 이종 AI반도체 지원 VM·컨테이너 및 Kubernetes 서비스. 논리적 분할·시간 분할 및 이기종 장치 결합 활용 지원.

02 / 06

🔀

이종 클라우드 서비스 오케스트레이션

AI반도체 자원 최적 성능을 위한 인스턴스 스케줄링. 초거대 AI모델 특화 클러스터링 및 다중 사용자 워크로드 격리 지원.

03 / 06

📊

클라우드 서비스 옵저버빌리티

AI반도체 특화 모니터링·로깅·트레이싱. 이상징후 감시·알람, 장애 탐지·복구, 비용 예측 기능 제공.

04 / 06

🔌

클라우드 서비스 개방형 인터페이스

AI SW 개발 환경 제공·관리, 멀티테넌시 지원, IAM 접근제어·인증. 3rd Party 연계 개방형 API 및 사용자·관리자 포털 제공.

05 / 06

💡

클라우드 플랫폼 운용 비용 최적화

자원 할당·워크로드 스케줄링 최적화. 실시간 전력 사용량 최적화 및 컴퓨팅 인프라 재구성 지원으로 TCO 절감.

06 / 06

🧠

초거대 AI 모델 실행환경 구축/실증

LLM 320B 이상 규모 모델 실운영 지원. AI반도체 클라우드 플랫폼 기능 검증 및 동작 호환성·성능 최적화 검증 환경 제공.

// 4 Frameworks

시스템 프레임워크

openKcloud는 4개의 독립적이면서 상호연계된 프레임워크로 구성되어 AI반도체 기반 초거대 AI 모델 서비스를 안정적으로 지원합니다.

🖥️

kcloud-cyborg / kcloud-nova / kcloud-operator / kcloud-loci / kcloud-requirements

AI반도체 클라우드 서비스 제공 프레임워크

이기종 AI반도체 자원의 가상화·공유·배치·실행을 담당하는 핵심 인프라 계층. GPU, NPU, PIM 등 물리자원을 추상화하여 상위 계층에 제공.

이종 클라우드 서비스 오케스트레이션 모듈 — VM·컨테이너 통합, 스케줄링·배포·격리
이기종 AI반도체 자원 최적 관리 모듈 — 디스커버리, 자원 공유, 최적 할당

⚡

kcloud-monitor / kcloud-cost-optimizer / kcloud-infra-optimization / kcloud-cost-scheduler / kcloud-cost-estimator

AI반도체 클라우드 서비스 최적화 프레임워크

플랫폼 운영 효율성과 전력·비용 최적화 기능 제공. 초거대 AI 모델 실행 시 성능과 전성비를 동시에 고려하는 운영 제어.

클라우드 서비스 옵저버빌리티 모듈 — 이상감지·알람, 통합 모니터링·트레이싱
클라우드 서비스 최적 운영비용 모듈 — 재구성·재배치 정책, 전력 최적화

🧠

kcloud-mlperf

초거대 AI 서비스 지원 프레임워크

초거대 AI 모델의 학습·추론을 직접 지원하는 서비스 계층. LLM 320B 이상 규모의 모델이 실제 운용 가능하도록 환경 지원.

초거대 AI 모델 서비스 관리 모듈 — 서비스 관리·서빙, 추론 성능 증강, 모델 튜닝 및 오케스트레이션, 입출력 데이터 관리

🔗

kcloud-manage

AI반도체 클라우드 서비스 통합 관리 프레임워크

플랫폼 전반의 관리·인터페이스 계층으로 외부 솔루션 연계성과 통합 운영 기능 제공. 정책·요구사항 전달 및 실행 결과 수집·전달.

클라우드 서비스 개방형 인터페이스 모듈 — 개방형 API, 포털, AI SW 개발 환경, 멀티테넌시·접근 제어·통합 인증, 비용 예측 연동·리포팅

// Architecture

시스템 아키텍처

상위 계층의 정책과 제어가 하위 계층의 자원 운용에 반영되는 다계층 프레임워크 구조.

kcloud-mnt
통합 관리

클라우드 서비스 개방형 인터페이스 모듈

개방형 API 사용자/관리자 포털 AI SW개발 환경 멀티테넌시 / 접근제어 및 인증 비용예측모델 연동/리포팅

↕

kcloud-llm
AI 서비스

초거대 AI 모델 서비스 관리 모듈

초거대 AI 서비스 관리 초거대 AI 서비스 서빙 추론 성능 증강 입출력 데이터 관리 초거대 AI 모델 튜닝 초거대 AI 모델 오케스트레이션

↕

kcloud-opt
최적화

클라우드 서비스 옵저버빌리티 지원 모듈

이상징후 감지 및 알람 장애 탐지 및 복구 지원 특화 모니터링 특화 로깅/트레이싱 비용예측모델

클라우드 서비스 최적 운용비용 모듈

클라우드 서비스 재구성/재배치 정책 플랫폼 운영 비용 최적화 서비스 전력 사용 최적화

↕

kcloud-svc
서비스 제공

이종 클라우드 서비스 오케스트레이션 모듈

이종 클라우드 서비스 실행환경 / 스케줄링 / 배포 / 관리 (격리/확장) AI반도체 디스크립터 AI반도체 자원관리 AI반도체 클러스터링 이기종 자원 결합 활용 융합 네트워크 / 고속 이미지 / 통합 저장소 운영·관리

이기종 AI반도체 자원 최적 관리 모듈

AI반도체 I/F 플러그인 이기종 자원 디스커버리 이기종 자원 공유 (논리/시간분할) 이기종 자원 최적 할당

↕

Hardware
인프라

GPUNPU PIMCPU / Memory Storage컴포저블 클러스터

// Community

COMMUNITY MEMBERS

openKcloud는 국내 주요 연구기관·기업·대학·협회가 함께 만들어가는 오픈소스 AI반도체 클라우드 플랫폼입니다.

// Related Links

// Contact

openKcloud Community. SINCE 2025

Email : openkcloud@googlegroups.com

🚀 시작하기▾

소개 릴리스 노트

🏗️ 아키텍처▾

전체 구조 플랫폼 레이어

🔷 클라우드 서비스 제공▾

kcloud-svc 개요

⚡ 서비스 최적화 운용▾

kcloud-opt 개요

🧠 초거대 AI 모델 서비스▾

kcloud-llm 개요

📊 서비스 통합 관리▾

kcloud-mnt 개요

// 시작하기 · 01

소개

openKcloud Platform — 국산 AI반도체 기반 오픈소스 클라우드 서비스 플랫폼

openKcloud는 고성능·저전력의 초거대 AI 모델 서비스를 안정적으로 제공하기 위하여, AI반도체(NPU, PIM, GPU 등)를 활용한 최적화된 클라우드 서비스 플랫폼 기술을 제공하는 것을 목표로 합니다. 특히, 최적 성능 확보와 운용비용 최소화를 동시에 달성할 수 있는 AI반도체 기반 클라우드 인프라 및 플랫폼 기술 개발이 핵심 범위입니다.

프로젝트 개요

openKcloud는 국내 AI반도체(NPU/GPU/PIM) 생태계를 위한 오픈소스 클라우드 플랫폼입니다. 퍼블릭·프라이빗 클라우드를 통합한 하이브리드 구조 위에 다계층 프레임워크로 설계되어 있으며, 이종 AI반도체 자원 기반의 VM·컨테이너 서비스를 통합 제공하는 AI반도체 중심 클라우드 플랫폼을 구현합니다.

K-클라우드 사업을 통해 확보된 이종 AI반도체 가상화 기술, 자원 분해·풀링 기술, AI반도체 라이브러리 등을 통합 적용하며, 대중적인 초거대 AI 모델을 실제 운영 환경에서 구동함으로써 플랫폼 기능과 성능을 종합적으로 검증합니다.

🔷

AI반도체 클라우드 서비스 제공

이기종 AI반도체(GPU, NPU, PIM 등)자원 가상화·공유·할당 기반 이종 최적 클라우드 서비스 제공

💡

클라우드 서비스 최적화 운용

플랫폼 운영 효율성, 전력·비용 최적화 기능기반 고성능·저전력 초거대 AI 서비스 지원

🧠

초거대 AI 모델 서비스 지원

초거대 AI 모델의 학습 및 추론 실행 지원, LLM 320B+ AI 모델 실행 환경 지원

📊

클라우드 서비스 통합 관리

플랫폼 전반의 관리 및 인터페이스 계층으로 외부 솔루션의 연계성과 통합 운영 기능 제공

시스템 특징

이기종 AI반도체 자원 최적 관리 — NPU, PIM 등 VM·컨테이너·K8s 서비스, 논리적·시간 분할, 이기종 장치 결합
이종 클라우드 서비스 오케스트레이션 — 인스턴스 스케줄링, AI모델 특화 클러스터링, 워크로드 격리
클라우드 서비스 옵저버빌리티 — AI반도체 특화 모니터링·로깅·트레이싱, 이상징후 감시·알람
클라우드 서비스 개방형 인터페이스 — AI SW 개발환경, 멀티테넌시, IAM, 포털, 3rd Party 개방형 API
클라우드 플랫폼 운용 비용 최적화 — 자원 할당·스케줄링 결정, 전력 최적화, 컴퓨팅 인프라 재구성
초거대 AI 모델 실행환경 구축/실증 — 플랫폼 기능·호환성·성능 최적화 검증

← 이전홈으로 다음 →릴리스 노트

// 시작하기 · 02

릴리스 노트

openKcloud Platform 버전별 변경 사항 및 업그레이드 가이드

📌 최신 릴리스는 v0.1.0 (2025-11-27)입니다. 아래 릴리스 노트에서 전체 변경 사항을 확인하세요. 업그레이드 전 Breaking Changes 항목을 반드시 검토하시기 바랍니다.

v0.1.5

UPCOMING · 2026 Q2

예정 릴리스 — 2026-07 (예정)

v0.1.5에서는 각 모듈별 기능 추가가 진행될 예정이며 다수 NPU 연동 제공이 주요 변경으로 포함될 예정입니다

v0.1.0

LATEST INITIAL RELEASE

2025-11-27 · openKcloud Community

openKcloud v0.1.0은 AI반도체 클라우드 플랫폼의 첫 번째 공식 오픈소스 릴리스입니다. 4개의 핵심 프레임워크(kcloud-svc, kcloud-opt, kcloud-llm, kcloud-mnt)들을 구성하는 일부 모듈들이 공개되었으며, 국산 AI반도체(NPU/GPU/PIM) 기반 이종 클라우드 서비스 환경의 기반을 제공합니다.

신규 기능 (New Features)

🔷 kcloud-svc — AI반도체 클라우드 서비스 제공 프레임워크

이종 AI반도체(GPU, NPU) 디스커버리 및 자원 관리 기능 최초 제공
VM기반 AI반도체 서비스 실행 환경 제공 (kcloud-nova 초기 릴리스)
AI반도체 I/F 플러그인 구조 지원 — NPU 드라이버 플러그인 연동 기능 포함
kcloud-operator 초기 릴리스: Kubernetes 기반 AI반도체 자원 오케스트레이션
kcloud-cyborg 초기 릴리스: Openstack 기반 AI반도체 자원 오케스트레이션
AI반도체 클러스터링 및 자원 결합 활용 기능 (실험적 지원)
워크로드 기반 자원 최적 할당 스케줄러

⚡ kcloud-opt — AI반도체 클라우드 서비스 최적화 프레임워크

kcloud-monitor 초기 릴리스: AI반도체 특화 메트릭 수집 및 Prometheus 연동
Grafana 대시보드 템플릿 제공 — GPU/NPU/PIM 사용률, 온도, 전력 시각화
이상 징후 감지 및 알람 기능 (Alertmanager 연동)
kcloud-cost-optimizer 초기 릴리스: 비용 예측 모델 기반 분석 및 보고
서비스 전력 사용 최적화 정책 엔진 (DVFS 기반 프리셋 제공)
통합 로그 및 분산 트레이싱 지원 (OpenTelemetry 호환)

🧠 kcloud-llm — 초거대 AI 서비스 지원 프레임워크

LLM 320B 이상 규모 모델 학습·추론 실행 환경 최초 지원
초거대 AI 서비스 관리 및 서빙 기능 — vLLM 호환 추론 엔드포인트 제공
추론 성능 증강 기능: KV Cache 관리, 배치 스케줄링 최적화
초거대 AI 모델 튜닝 파이프라인 (LoRA/QLoRA 파인튜닝 워크플로우)
입출력 데이터 관리 모듈 — 스트리밍 응답 및 비동기 처리 지원
MLPerf Inference 벤치마크 기반 성능 검증 파이프라인 (실험적)

📊 kcloud-mnt — AI반도체 클라우드 서비스 통합 관리 프레임워크

플랫폼 통합 관리 대시보드 UI 신규 제공 (React 기반 웹 포털)
멀티테넌시 지원 — 테넌트별 자원 격리 및 쿼터 관리
IAM(Identity and Access Management) 기본 정책 엔진 제공
3rd Party 개방형 REST API 게이트웨이 (OpenAPI 3.0 스펙 제공)
AI SW 개발환경 연계 인터페이스 — JupyterHub, MLflow 통합

개선 사항 (Improvements)

버그 수정 (Bug Fixes)

[kcloud-svc] NPU 플러그인 연동 시 kcloud-cyborg에서 발생하는 OOMKilled 오류 수정 (#42)

알려진 이슈 (Known Issues)

kcloud-llm 성능 측정 파이프라인은 현재 실험적 기능으로, 프로덕션 환경 적용 비권장
kcloud-cost-optimizer 비용 예측 모델은 GPU 환경만 지원 (NPU 지원 예정 — v0.1.5)

Breaking Changes

⚠️ 초기 릴리스(v0.1.0)로 이전 버전과의 호환성 고려 사항이 없습니다.

향후 v0.1.5 업그레이드 시 기능 추가로 인한 사용자 인터페이스가 변경될 수 있습니다. 변경 사항은 다음 릴리스 노트에서 사전 공지됩니다.

시스템 요구 사항

항목	권장 요구 사항
OS	Ubuntu 22.04 LTS
Kubernetes	v1.28 이상
GPU 드라이버	Driver 550+

기여자 (Contributors)

v0.1.0 릴리스에 기여해주신 모든 분들께 감사드립니다.

openKcloud 멤버

← 이전소개 다음 →전체 구조

// 아키텍처 · 01

전체 구조

openKcloud 4계층 프레임워크 아키텍처

시스템 구성

openKcloud는 AI반도체를 클라우드 서비스로 제공함으로써 초거대 AI모델의 학습·추론에 요구되는 AI반도체 자원의 활용 장벽을 낮추고, 최적 성능과 클라우드 플랫폼 운용 비용 최적화를 제공하기 위하여 4개의 프레임워크로 구성됩니다.

프레임워크	약칭	역할
AI반도체 클라우드 서비스 제공	kcloud-svc	이기종 AI반도체 가상화·공유·배치·실행 핵심 인프라
AI반도체 클라우드 서비스 최적화	kcloud-opt	전력·kcloud-cost-optimizer, 옵저버빌리티, 운영 제어
초거대 AI 서비스 지원	kcloud-llm	LLM 학습·추론 직접 지원 서비스 계층
AI반도체 클라우드 서비스 통합 관리	kcloud-mnt	플랫폼 전반 관리·인터페이스, 외부 연계

서브시스템 관계

4개의 프레임워크는 독립적인 기능을 수행하면서 상호 연계되어 동작합니다. 상위 계층의 정책과 제어가 하위 계층의 자원 운용에 반영되는 구조를 가집니다.

kcloud-mnt는 서비스 지원·최적화 프레임워크에 정책·요구사항 전달하고, 하위 계층의 실행 결과 수집후 사용자에게 전달
kcloud-opt는 실행 중 발생하는 로그·성능 지표·전력 사용량 데이터를 수집하고, kcloud-svc의 스케줄링 정책 조절
kcloud-llm은 AI 모델 실행을 위한 서비스 실행 계층으로 실제 자원 할당·실행은 kcloud-svc에 요청 전달
kcloud-svc는 실제 자원 제어를 수행하는 핵심 실행 계층으로 인프라 하드웨어 자원 직접 제어

              
              Subsystem Architecture Diagram
            

▲ AI반도체 클라우드 서비스 플랫폼 — 프레임워크 간 서브시스템 관계도

← 이전소개 다음 →플랫폼 레이어

// 아키텍처 · 02

플랫폼 레이어

openKcloud 플랫폼의 수직 계층 구조 — 하드웨어 인프라부터 LLM 서비스까지

openKcloud 플랫폼 레이어는 하드웨어 인프라(CPU/GPU/NPU/PIM), 클라우드 서비스 플랫폼, 오케스트레이션, LLM 서비스 계층까지 수직으로 통합된 구조로 구성됩니다. 각 계층은 독립적으로 동작하면서 상위 계층의 요청에 따라 하위 계층의 자원을 제어합니다.

              
              Platform Layer Architecture Diagram
            

▲ openKcloud 플랫폼 레이어 전체 구성도 — LLM 서비스 계층부터 하드웨어 인프라까지

Layer 1 — LLM 서비스 계층

최상위 서비스 계층으로, 초거대 AI 모델의 추론(Inference) 및 학습 워크로드를 직접 수행합니다. 안정성·고속 확장·확장성의 서비스 목표를 기준으로 4가지 배포 시나리오를 지원합니다.

SCENARIO 01 · 안정성

Kubernetes 기반 VM 클러스터

Kubernetes Controller + VM 구성으로 안정적인 LLM 서비스 제공. Cluster API 또는 Magnum (Heat)을 통해 K8s 클러스터를 자동 프로비저닝.

SCENARIO 02 · 안정성 (멀티)

다중 VM 분산 클러스터

복수의 VM 노드에 Kubernetes Worker를 분산 배치. Magnum (Heat) 오케스트레이션으로 멀티노드 LLM 추론 환경 구성.

SCENARIO 03 · 고속 확장

Inference 컨테이너 + VM 혼합

Inference 컨테이너와 VM을 혼합 운용하여 추론 처리량 확장. Nova 기반 VM 인스턴스 관리와 컨테이너 스케줄링을 병행.

SCENARIO 04 · 안정성 + 확장성

K8s + 컨테이너 혼합 고밀도 배포

Kubernetes 클러스터와 다수의 컨테이너 워커를 결합한 고밀도 배포. Iron 베어메탈 프로비저닝으로 외부 클라우드(AWS, Azure 등) 연계 확장 지원.

Layer 2 — 오케스트레이션 계층

LLM 서비스 계층에서 요청한 VM·컨테이너 인스턴스를 실제로 생성·관리하는 계층입니다. 4가지 오케스트레이터가 워크로드 특성에 따라 선택적으로 사용됩니다.

컴포넌트	유형	역할
Cluster API	실험적	Kubernetes 클러스터 수명주기 선언적 관리. 멀티클라우드 환경에서 K8s 자동 프로비저닝
Magnum (Heat)	안정	OpenStack Magnum 기반 컨테이너 인프라 관리. Heat 오케스트레이션으로 K8s 클러스터 템플릿 배포
Nova	안정	OpenStack 핵심 컴퓨팅 서비스. VM 인스턴스 생성·스케줄링·AI반도체 자원 배치 담당
Iron	베어메탈	베어메탈 서버 프로비저닝. 외부 클라우드(AWS·Azure·VMware·Google Cloud) 연계를 위한 확장 게이트웨이

Layer 3 — 클라우드 서비스 플랫폼 계층

Kubernetes와 OpenStack이 통합된 하이브리드 플랫폼 계층입니다. 서비스 큐, 분산 스토리지, 네트워크, K8s 프로비저닝 기능을 제공하며 상위 오케스트레이션 계층의 요청을 처리합니다.

Kubernetes 영역

Kubernetes Controller — 클러스터 상태 감시·제어, API 서버 관리
Kubernetes Workers — 워크로드 실행 노드. Pod 스케줄링 및 AI반도체 자원 직접 활용
Service Queue (RabbitMQ) — 서비스 간 비동기 메시지 처리. 스케줄링 이벤트·알림 전달

OpenStack Service 영역

Distributed Storage (Ceph/Rook Ceph) — 분산 스토리지 제공. AI 모델 가중치·데이터셋 대용량 저장 및 고속 접근 지원
Network Plugins (OVN) — Open Virtual Network 기반 소프트웨어 정의 네트워킹. 테넌트 간 네트워크 격리 및 오버레이 네트워크 구성
K8S Provision (Cluster API) — OpenStack 내부에서 K8s 클러스터 동적 프로비저닝. 멀티클라우드 연계 확장점

Layer 4 — 하드웨어 인프라 계층

물리 자원 계층으로, AI 모델 연산을 직접 수행하는 프로세서·메모리·스토리지·네트워크 인프라로 구성됩니다. openKcloud의 차별점인 국산 AI반도체(Korean NPU)를 포함합니다.

// PROCESSOR

프로세서

CPU GPU (Korean) NPU ★ 기타 AI반도체

국산 NPU를 포함한 이기종 AI반도체를 통합 지원. AI반도체 I/F 플러그인 구조로 신규 벤더 추가 확장 가능.

// MEMORY

메모리

DDR PIM ★ PNM ★

Processing-In-Memory(PIM)·PNM 지원으로 메모리 내 연산 가능. 대용량 LLM 모델의 메모리 병목 완화.

// STORAGE

스토리지

Smart SSD ★ SSD HDD

Smart SSD 기반 연산 가속 지원. Ceph/Rook Ceph 분산 스토리지와 연계하여 AI 모델·데이터셋 관리.

// NETWORK

네트워크 인프라

고속 이더넷·InfiniBand 기반 서버 간 상호연결 네트워크. 분산 AI 모델 학습 시 노드 간 고대역폭 통신을 지원하며, OVN 소프트웨어 정의 네트워킹으로 테넌트 격리 및 오버레이 구성.

외부 클라우드 연계 (하이브리드 확장)

Iron 베어메탈 계층과 K8S Provision을 통해 퍼블릭 클라우드로의 워크로드 버스팅 및 멀티클라우드 확장이 가능합니다.

🏢 VMware

☁️ AWS

🔷 Azure

🌐 Google Cloud

Cluster API 연계 — 멀티클라우드 환경에서 K8s 클러스터 통합 프로비저닝
하이브리드 네트워크 — OVN 기반 오버레이로 온프레미스-퍼블릭 클라우드 간 네트워크 통합

← 이전전체 구조 다음 →kcloud-svc

// 클라우드 서비스 제공 · 01

kcloud-svc

AI반도체 클라우드 서비스 제공 프레임워크

AI반도체 자원의 가상화, 공유, 배치 및 실행을 담당하는 핵심 인프라 계층. 물리 계층의 이기종 AI반도체(GPU, NPU, PIM 등) 자원을 추상화하여 상위 계층에 제공합니다.

이종 클라우드 서비스 오케스트레이션 모듈

VM 및 컨테이너 기반 서비스 실행 환경 통합 제공
이종 클라우드 서비스의 스케줄링, 배포, 관리(격리·확장)
융합 네트워크, 통합 이미지 관리 및 저장소 운영 관리
AI반도체 디스크립터 및 자원관리 기능
AI반도체 클러스터링 및 자원 결합 활용 기능

이기종 AI반도체 자원 최적 관리 모듈

AI반도체 디스커버리 및 자원 인벤토리 관리
이기종 자원 공유(분리/시간분할) 기능
AI반도체 I/F 플러그인 구조 지원 기능
워크로드 기반 자원 최적 할당 기능

← 이전전체 구조 다음 →kcloud-opt

// 서비스 최적화 운용 · 01

kcloud-opt

AI반도체 클라우드 서비스 최적화 프레임워크

플랫폼 운영 효율성과 전력·kcloud-cost-optimizer 기능을 제공하며, 초거대 AI 모델 실행 시 성능과 전성비를 동시에 고려하는 운영 제어 기능을 수행합니다.

클라우드 서비스 옵저버빌리티 지원 모듈

이상 징후 감지 및 알람 기능 / 장애 탐지 및 복구 지원
통합 모니터링 및 로그/트레이싱 제공
비용 예측 모델 기반 분석

클라우드 서비스 최적 운영비용 모듈

클라우드 서비스 재구성·재배치 정책
플랫폼 운영kcloud-cost-optimizer 기능
서비스 전력 사용 최적화 기능

← 이전kcloud-svc 다음 →kcloud-llm

// AI 모델 실행환경 · 01

kcloud-llm

초거대 AI 서비스 지원 프레임워크

초거대 AI 모델의 학습 및 추론을 직접 지원하는 서비스 계층. LLM 320B 이상 규모의 모델이 실제 운용 가능하도록 학습 및 추론 환경을 지원합니다.

초거대 AI 모델 서비스 관리 모듈

초거대 AI 서비스 관리 및 서빙 기능
추론 성능 증강 기능 / 입출력 데이터 관리
초거대 AI 모델 튜닝 및 오케스트레이션

← 이전kcloud-opt 다음 →kcloud-mnt

// 서비스 통합 관리 · 01

kcloud-mnt

AI반도체 클라우드 서비스 통합 관리 프레임워크

플랫폼 전반의 관리·인터페이스 계층으로 외부 솔루션 연계성과 통합 운영 기능 제공. 정책·요구사항 전달 및 실행 결과 수집·전달 역할 기능을 제공합니다.

클라우드 서비스 개방형 인터페이스 모듈

개방형 API 제공 / AI SW 개발 환경 제공
사용자/관리자 포털 / 멀티테넌시 및 접근 제어/인증
비용 예측 모델 연동 및 리포팅

← 이전kcloud-llm 다음 →소개

// 아키텍처 · 02

배포 모델

단일 노드 / 클러스터 배포

// 아키텍처 · 03

네트워크 구성

TBD

openKcloudPlatform

주요 기능

시스템 프레임워크

시스템 아키텍처

COMMUNITY MEMBERS

소개

프로젝트 개요

시스템 특징

릴리스 노트

v0.1.5

v0.1.0

신규 기능 (New Features)

개선 사항 (Improvements)

버그 수정 (Bug Fixes)

알려진 이슈 (Known Issues)

Breaking Changes

시스템 요구 사항

기여자 (Contributors)

전체 구조

시스템 구성

서브시스템 관계

플랫폼 레이어

Layer 1 — LLM 서비스 계층

Layer 2 — 오케스트레이션 계층

Layer 3 — 클라우드 서비스 플랫폼 계층

Layer 4 — 하드웨어 인프라 계층

외부 클라우드 연계 (하이브리드 확장)

kcloud-svc

이종 클라우드 서비스 오케스트레이션 모듈

이기종 AI반도체 자원 최적 관리 모듈

kcloud-opt

클라우드 서비스 옵저버빌리티 지원 모듈

클라우드 서비스 최적 운영비용 모듈

kcloud-llm

초거대 AI 모델 서비스 관리 모듈

kcloud-mnt

클라우드 서비스 개방형 인터페이스 모듈

배포 모델

네트워크 구성

뉴스 & 업데이트

다운로드

Github

커뮤니티

최신 게시글

openKcloud
Platform