클라우드 스토리지가 무엇이고 왜 쓰는지, 비용·확장성·보안으로 간단히 정리해 볼 것이다.
객체·파일·블록 차이와 S3·EFS·EBS, Glacier·Gateway·Snow Family 용도를 한눈에 정리해 볼 것이다.
가용성·지연·비용·규정 기준을 잡고, 버저닝·암호화·수명주기로 운영을 최적화해 볼 것이다.
클라우드 스토리지 정리
스토리지란 데이터를 보관하는 장소로, 우리가 사용하는 모든 저장 장치를 포함한다.
클라우드 스토리지는 인터넷을 통해 데이터를 저장하고 액세스할 수 있는 모델이며, 사용자는 퍼블릭 인터넷이나 전용 프라이빗 네트워크를 통해 접속한다.
용량과 비용은 on-demand 방식으로 제공되며, 자체 스토리지 인프라를 직접 구매하거나 관리할 필요가 없다.
대표 서비스로는 Amazon S3, Amazon EFS, Amazon FSx, AWS Storage Gateway, Amazon S3 Glacier, Amazon EBS, AWS Backup 등이 있다.
클라우드 스토리지 특징 및 장점
비용 효율성
필요한 만큼 사용한 만큼 지불하며, 하드웨어 구매·유지보수 비용을 절감한다.
확장성
수요 변화에 맞춰 리소스를 즉시 확장하거나 축소한다.
접근성
인터넷·전용망을 통해 언제 어디서나 안전하게 데이터에 접근한다.
민첩성
리소스 프로비저닝 시간을 대폭 단축해 출시 속도를 높인다.
데이터 관리 효율성
수명주기 정책·자동화로 보관·아카이브·삭제를 일관되게 관리한다.
보안 및 비즈니스 연속성
암호화·권한관리와 멀티 AZ/리전 중복 저장으로 데이터 보호와 연속성을 보장한다.
개발 및 혁신 지원
인프라 운영 부담을 줄여 애플리케이션 개발에 집중하고, 실험·테스트를 빠르게 반복한다.
스토리지의 종류
객체(오브젝트) 스토리지
비정형 데이터(사진, 동영상, ML/센서 데이터 등)를 저장하는 스토리지이다.
데이터를 ‘객체’ 단위로 저장하며, 사용자 지정 메타데이터를 활용할 수 있다.
높은 확장성과 경제성을 제공하며, 현대적 애플리케이션 개발·분석·백업·아카이브에 적합하다.
예시 서비스: Amazon S3
파일 스토리지
데이터를 계층적 폴더 및 파일 형태로 저장한다.
네트워크 연결 스토리지(NAS)와 유사하며, Windows(SMB), Linux(NFS) 환경에서 널리 사용된다.
애플리케이션이 파일 단위 접근을 필요로 할 때 적합하다.
예시 서비스: Amazon EFS
블록 스토리지
데이터베이스나 ERP 시스템 같은 엔터프라이즈 애플리케이션에 적합하다.
낮은 지연시간과 호스트 전용 스토리지를 제공한다.
데이터를 ‘블록’ 단위로 저장하며, 각 블록에는 고유 식별자가 부여된다.
직접 연결 스토리지(DAS), 스토리지 영역 네트워크(SAN)와 유사하다.
예시 서비스: Amazon EBS
Amazon S3 정리
Amazon Simple Storage Service (S3)
AWS에서 가장 오래되고 핵심적인 기본 서비스로 평가된다.
무제한에 가까운 데이터 저장 공간을 제공한다.
데이터 내구성은 99.99% 으로, 사실상 데이터 손실 가능성을 최소화한다.
물리적으로 분리된 3개 이상의 가용 영역(AZ) 에 자동 복제되어 안전하게 저장된다.
가용성은 S3 스토리지 클래스(Standard, IA, Glacier 등)에 따라 달라진다.
AWS S3 활용 사례
데이터 백업·아카이브 용도로 장기 보관과 재해 복구 복제를 수행한다.
정적 웹사이트를 호스팅하고 이미지·비디오 같은 미디어 파일을 저장·배포한다.
데이터 레이크를 구성해 대규모 데이터를 적재하고 분석 도구와 연계해 처리한다.
CloudFront와 연동해 전 세계 사용자에게 콘텐츠를 빠르게 전송한다.
모바일·웹 애플리케이션의 사용자 생성 콘텐츠와 로그·설정 파일을 보관한다.
IoT 디바이스에서 발생한 센서 데이터를 수집·저장하고 분석 기반을 마련한다.
소프트웨어 업데이트 파일과 모바일 앱 바이너리를 저장·배포한다.
팀 내부 및 외부 파트너와 대용량 파일을 안전하게 공유·협업한다.
Amazon S3 – 버킷 (Buckets)
객체 저장 컨테이너로서 모든 객체(object)는 반드시 버킷에 저장된다.
버킷은 ‘최상위 디렉터리’와 같은 개념으로 이해할 수 있다.
버킷은 글로벌 서비스이지만 특정 리전(region) 단위로 생성된다.
한 번 생성되면 버킷 이름과 리전은 변경할 수 없다.
버킷 이름은 전 세계에서 유일한 이름(Globally Unique Name) 으로 설정해야 한다.
여러 리전에서 중복되지 않아야 하며, 웹사이트 주소나 DNS 주소와 연결되기 때문이다.
예시:
- my-bucket → 버킷 이름
- my-folder/my-file.txt → 객체 키
Amazon S3 – 객체 (Objects)
버킷에 저장되는 이미지, 문서 등 데이터를 객체(Object) 라고 부른다.
객체는 데이터(파일 본문) + 메타데이터(속성) 로 구성된다.
객체는 고유 식별자인 객체 키(Object Key) 를 가진다.
- 예: s3://my-bucket/my_file.txt → 파일 이름
- 예: s3://my-bucket/my_folder/my_file.txt → 폴더 포함 전체 경로
버킷은 디렉터리 개념이 아니라, 객체 키의 구조로 데이터를 관리한다.
객체는 최대 5TB까지 저장 가능하다.
- 단, 크기가 5GB를 초과하면 멀티 파트 업로드 방식을 사용해야 한다.
- 멀티 파트 업로드는 파일을 여러 조각으로 나눠 병렬 업로드하여 성능을 향상시킨다.
파일 수에 제한이 없으므로, 사실상 무제한으로 객체 저장이 가능하다.
Amazon S3 – API
S3는 REST API와 HTTPS SOAP API를 모두 지원한다.
- REST (Representational State Transfer) : 리소스 기반 접근, 가볍고 단순하며 캐싱 가능
- SOAP (Simple Object Access Protocol) : XML 기반, 규격화된 메시지 구조, 무겁지만 표준화된 보안 기능 제공
높은 호환성을 제공하여 AWS EC2뿐만 아니라 Azure, GCP 등 타사 클라우드 및 SaaS 서비스와도 쉽게 연동할 수 있다.
즉, 다양한 환경에서 S3의 API를 활용할 수 있다.
SOAP vs REST 비교
| 차이점 | SOAP | REST |
| 유형 | 프로토콜 | 아키텍처 스타일 |
| 기능 | 구조화된 정보 전송 | 리소스 기반 데이터 접근 |
| 데이터 포맷 | XML | 텍스트, XML, JSON 등 다양 |
| 보안 | WS-Security + SSL | SSL + HTTPS |
| 캐시 | 사용 불가 | 사용 가능 |
| 페이로드 처리 | 엄격한 규약, 모든 요청 알림 필요 | 유연, 미리 알림 불필요 |
쉽게 말해, SOAP은 봉투처럼 무겁고 까다로운 규칙을 따르는 반면, REST는 엽서처럼 가볍고 빠르게 주고받을 수 있다.
Amazon S3 – Static Web Hosting
S3를 사용하면 인터넷을 통해 정적 웹 사이트(Static Website) 를 호스팅할 수 있다.
정적 콘텐츠는 변하지 않는 데이터로, 언제나 동일한 결과를 반환한다.
동적 콘텐츠는 요청에 따라 자주 변하는 데이터로, 사용자 맞춤 정보를 제공한다.
웹 브라우저에서는 S3 버킷에 매핑된 URL을 통해 접근한다.
- bucket-name → 버킷 이름
- ap-northeast-2 → 리전 정보
만약 403 Forbidden 오류가 발생하면, 버킷 정책(bucket policy)을 public 접근 허용으로 설정해야 한다.
Amazon S3 – Versioning
S3는 객체를 버전으로 관리한다. 기본값은 비활성(null)이며, 버킷 단위로 사용자가 버전 관리를 활성화한다.
같은 객체 키에 덮어써도 기존 데이터는 보존되고 새 버전이 추가된다(예: v1, v2 …). 필요하면 이전 버전을 지정해 다운로드하거나 최신으로 복구한다.
삭제 시에는 실제 데이터를 지우기보다 삭제 표시(Delete marker) 를 추가한다. 복구하려면 삭제 표시를 제거하고, 특정 버전을 완전히 지우려면 해당 versionId로 영구 삭제한다.
버전 관리는 실수 삭제·오버라이트·랜섬웨어 등으로부터 복구 능력을 높인다. 단, 모든 버전에 대해 저장 용량이 과금되므로 수명주기(Lifecycle) 정책으로 아카이브·만료를 함께 설정한다.
Amazon S3 – 복제(Replication): CRR & SRR
복제는 비동기(one-way)로 동작하며, 원본·대상 버킷 모두 버저닝을 활성화해야 한다. 계정이나 리전이 달라도 구성할 수 있으며, 정의한 규칙(프리픽스/태그 필터)에 따라 백그라운드로 복제한다.
CRR(Cross-Region Replication)은 서로 다른 리전의 버킷으로 복제한다. 지리적으로 가까운 액세스 지점을 늘려 지연을 낮추고, 재해 복구(DR)와 지역 규정 준수를 충족한다.
SRR(Same-Region Replication)은 동일 리전 내 다른 버킷으로 복제한다. S3가 기본적으로 다중 AZ 내구성을 제공하더라도, 데이터 분리(프로덕션↔분석), 규정 준수, 로그 집계 등 목적을 위해 별도 버킷 사본을 둔다.
주의사항으로, 삭제는 기본적으로 삭제 표시(Delete marker) 만 복제하며 영구 삭제 여부는 정책에 따른다. KMS로 암호화된 객체는 대상 리전/계정의 KMS 권한을 부여해야 하며, 기존 객체는 배치 복제를 사용해 소급 복제한다. 필요 시 Replication Time Control(RTC) 로 목표 복제 지연을 관리한다.
S3 암호화(Encryption) 정리
Server-Side Encryption(SSE)은 기본적으로 활성화되어 객체를 저장할 때 자동으로 암호화한다.
SSE 방식은 SSE-S3(서비스 관리 키, 설정이 가장 단순), SSE-KMS(KMS 키로 감사·권한 세분화), SSE-C(고객 제공 키, S3는 키 미보관)로 구분한다.
버킷 기본 암호화를 설정하면 업로드 헤더가 없어도 지정한 방식으로 강제하며, 정책으로 비암호화 PutObject를 거부하도록 설정한다.
전송 구간은 HTTPS(TLS)로 암호화하며 SDK/콘솔은 기본적으로 TLS를 사용한다.
Client-Side Encryption(CSE)은 애플리케이션이 업로드 전에 직접 암호화하고, S3에는 이미 암호화된 바이트가 저장된다.
복제에 KMS가 관여하면 대상 리전/계정의 KMS 키 권한을 부여해야 하며, 로그·백업·아카이브에도 동일 정책을 적용해 규정 준수를 확보한다.
S3 스토리지 클래스
- 모든 클래스는 11 9s 내구성을 제공한다.
- 접근 빈도·복원 속도·비용 기준으로 선택하며, Lifecycle 규칙으로 자동 전환을 설정한다.
- IA·Glacier 계열은 조회 비용과 최소 보관 기간이 있다.
클래스별 특징
- S3 Standard: 자주 접근하는 데이터용. 멀티 AZ 저장, 지연 짧다.
- S3 Standard-IA: 가끔 조회하는 장기 보관용. 저장 단가 낮고 조회 시 비용 발생. 최소 보관 30일.
- S3 Intelligent-Tiering: 접근 패턴에 따라 자동 티어링. 소액의 모니터링 비용.
- S3 One Zone-IA: 단일 AZ 저장. 재생성 가능한 2차 사본 등에 적합. 최소 보관 30일.
- S3 Glacier Instant Retrieval: 아카이브이지만 즉시 조회. 최소 보관 약 90일.
- S3 Glacier Flexible Retrieval: 분·시간 단위 복원(Expedited/Standard/Bulk). 최소 보관 약 90일.
- S3 Glacier Deep Archive: 최저 비용 장기 보관. 복원 수 시간~48시간. 최소 보관 약 180일.
목적에 따른 선택지
- 자주 조회: Standard
- 월 1~2회 조회: Standard-IA 또는 Intelligent-Tiering
- 재생성 가능한 2차 사본: One Zone-IA
- 즉시 조회 필요한 아카이브: Glacier Instant Retrieval
- 가끔 복원하는 장기 보관: Glacier Flexible Retrieval
- 거의 복원하지 않는 초장기 보관: Glacier Deep Archive
S3 Standard — 범용
자주 접근하는 데이터를 위한 기본 스토리지 클래스다. 여러 부서가 빈번히 업·다운로드하는 업무 데이터, 웹 정적 자산, 콘텐츠 배포, 데이터 레이크의 핫 데이터에 적합하다.
- 최소 3개 AZ에 동시 저장하여 내구성 99.99%, 가용성 99.99%를 제공한다.
- Pay-as-you-go 과금: 최소 사용량·조기 삭제 수수료·조회 페널티 없이 사용한 만큼 지불한다.
- 낮은 지연과 높은 처리량으로 일반적인 엔터프라이즈 워크로드에 안정적으로 동작한다.
대표 사용 사례
- 웹사이트 정적 파일, 이미지·동영상 등 콘텐츠 배포(CloudFront 연계)
- 로그·리포트 등 자주 조회되는 데이터
- 모바일·게임 애플리케이션 리소스, 데이터 레이크의 핫 영역
S3 Standard-IA — 빈번하지 않은 액세스
자주 읽지 않지만 필요할 때는 빠르게 접근해야 하는 데이터를 위한 스토리지 클래스다. 재해복구(DR), 백업, 장기 보관 파일에 적합하다.
- 최소 3개 AZ에 저장해 내구성과 가용성을 확보한다.
- 내구성 99.99%, 가용성 99.9%를 제공한다.
- 저장 단가가 Standard보다 낮다. 다만 조회 시 요금이 발생하며 최소 보관 30일(조기 삭제 수수료) 정책이 적용된다.
대표 사용 사례
- 재해복구용 복제본, 주기적 백업본
- 장기 보관 문서·로그 등 드물게 조회되는 데이터
S3 One Zone-IA — 빈번하지 않은 액세스
접근 빈도는 낮지만 필요할 때는 빠르게 읽어야 하는 데이터를, 단일 가용 영역(AZ) 에 저장해 비용을 절감한다. 해당 AZ에 장애가 발생해도 쉽게 재생성하거나 복구할 수 있는 데이터에 적합하다.
- 단일 AZ 저장으로 비용을 낮춘다.
- 내구성 99.99%, 가용성 99.95%를 제공한다.
- Standard-IA보다 저장 단가가 더 낮다. 다만 조회 시 비용이 있고 최소 보관 30일(조기 삭제 수수료)이 적용된다.
- 아카이브가 아니므로 지연은 짧고 즉시 접근한다.
적합한 사용 사례
- 재생성 가능한 2차 사본(썸네일, 파생 데이터셋, 캐시성 파일)
- 백업의 추가 복제본, 테스트/스테이징 환경용 대용량 파일
- 장애 시 유실되어도 재생성 또는 외부 원본에서 복구 가능한 데이터
주의 사항
- 단일 AZ 특성상 AZ 장애 시 데이터 가용성 영향을 받을 수 있으므로, 미션 크리티컬 데이터에는 사용하지 않는다.
- 규정 준수나 DR 목적이라면 멀티 AZ(예: Standard-IA) 또는 교차 리전 복제를 병행한다.
S3 Standard vs S3 One Zone-IA
| 구분 | S3 Standard | S3 One Zone-IA |
| 저장 범위 | 멀티 AZ(최소 3개) | 단일 AZ |
| 가용성(예시) | 약 99.99% | 약 99.5% |
| 비용 | 기준값 | 20~30% 저렴 |
| 접근 패턴 | 잦은 입·출력 | 드문 접근(필요 시 즉시 조회) |
| 주요 용도 | 웹/앱 정적 자산, 콘텐츠 배포, 빅데이터 핫 데이터 | 보조 백업, 재생성 가능한 데이터, CRR 대상 버킷 |
| 특징 | S3 수명주기 관리의 시작점으로 일반 목적에 최적 | 가용성·내구성 요구가 낮은 데이터에 비용 최적 |
※ CRR (Cross-Region Replication): 지연 단축·운영 효율·재해 복구 등을 위해 서로 다른 리전으로 객체를 자동 복제하는 기능.
S3 Intelligent-Tiering — 알 수 없거나 변동성 있는 액세스
접근 패턴을 예측하기 어렵거나 자주 바뀌는 데이터를 자동으로 비용 최적화한다.
30일간 접근이 없으면 Infrequent Access 티어로 전환하며, 다시 접근하면 즉시 Frequent Access 티어로 복귀한다.
옵션을 활성화하면 90일 미접속 시 Archive Access, 180일 미접속 시 Deep Archive Access로 단계적으로 이동한다.
빈번/비빈번 티어는 복원 없이 즉시 조회하며, 아카이브 계열은 복원 절차와 시간이 필요하다.
멀티 AZ 내구성을 유지하고 소액의 모니터링·자동화 비용이 발생한다.
접근 패턴이 불규칙한 데이터 레이크, 사용자 업로드 미디어, 혼재된 로그 버킷에 적합하다.
S3 Glacier — 아카이브 스토리지
거의 접근하지 않는 데이터를 장기간 보관할 때 비용을 크게 낮춘다. 규제 준수 문서, 백업, 로그·이미지 원본 등 콜드 데이터에 적합하다. 모든 클래스는 11 9s 내구성을 제공하며, 수명주기(Lifecycle) 정책과 함께 사용하면 자동 전환이 쉽다.
- Glacier Instant Retrieval
드물게 조회하지만 즉시(밀리초) 읽어야 하는 데이터용. 의료/미디어 원본, 대형 객체 스냅샷 등에 적합.
최소 보관 90일, 조회 요금 발생(복원 대기 없음). - Glacier Flexible Retrieval
장기 보관 데이터용. 복원(restore) 후 접근한다.- Expedited: 1–5분
- Standard: 3–5시간
- Bulk: 5–12시간
최소 보관 90일, 복원/전송 비용 발생.
- Glacier Deep Archive
최저 비용 콜드 아카이브. 12–48시간 복원. 테이프 대체 시나리오, 7–10년 장기 보관에 적합.
최소 보관 180일, 복원/전송 비용 발생.
사용 팁
- Flexible/Deep Archive는 복원 요청 후 지정한 임시 보존 기간 동안 객체 사본을 읽는다.
- 잦은 접근 가능성이 있거나 복원 시간이 부담되면 Instant Retrieval 또는 Intelligent-Tiering(아카이브 옵션) 을 고려한다.
- 라이프사이클로 Standard → IA → Glacier(Instant/Flexible) → Deep Archive 순으로 자동 전환을 설정하면 비용을 최적화한다.
Amazon S3 Express One Zone — 고성능
가장 자주 접근하는 데이터를 위한 초저지연 객체 스토리지. 단일 AZ 기반으로 일관된 성능을 제공한다.
- 지연 시간 < 10ms(일관된 요청 지연)
- S3 Standard 대비 최대 10배 빠른 액세스, 요청 비용 50% 절감
- 단일 AZ 저장, 자동 스케일 업/다운
- 가용성 99.95%
적합한 워크로드
- 분석·AI/ML (Amazon EMR, SageMaker, Athena)
- 초저지연이 필요한 핫 데이터 경로, 대량 동시 요청 처리
주의점
- 단일 AZ 특성상 AZ 장애 대비가 필요하므로, 중요 데이터는 별도 복제/백업 설계를 병행한다.
Amazon EFS (Elastic File System)
여러 AZ에 분산된 컴퓨팅 리소스가 동시에 붙어 쓰는 공유 파일 시스템이다. AWS가 관리하는 NFS(Network File System) 로, 리눅스 기반 워크로드에서 표준 파일 인터페이스로 접근한다.
EC2·Lambda·ECS·EKS 등 다양한 컴퓨팅 서비스가 파일을 함께 읽고 쓸 필요가 있을 때, 서비스/서브넷 경계를 넘는 공유 스토리지가 필요하기 때문이다. (S3는 HTTP 기반 객체 스토리지로 접근 방식이 다르다.)
핵심 특징
- 멀티 AZ 고가용성: 여러 가용 영역에 걸쳐 내구성과 가용성을 확보한다.
- 리눅스 중심 마운트: 리눅스 EC2 등에 NFS로 마운트해 사용한다.
- 자동 확장: 용량·처리량이 사용량에 맞춰 자동으로 스케일한다(용량 계획 부담 없음).
- 관리형 서비스: 파일 서버 운영(패치·확장·백업 인프라) 부담을 최소화한다.
대표 사용 사례
- 웹/미디어 콘텐츠의 공유 파일 저장소
- 컨테이너/쿠버네티스 워크로드의 공유 볼륨
- 분석·ML 파이프라인의 공동 작업 영역
Amazon EBS (Elastic Block Store)
EC2 인스턴스에 연결해 쓰는 고성능 블록 스토리지. 외장 디스크처럼 인식되며 파일 시스템(xfs, ext4, NTFS 등)으로 포맷해 마운트한다.
인스턴스 생명주기와 독립적으로 데이터가 유지되고, 스냅샷으로 백업·복제·복원을 수행한다.
핵심 특징
- 단일 AZ 리소스: 동일 AZ 내 인스턴스에만 연결. 다른 AZ로 이동 시 스냅샷 → 새 볼륨 생성.
- 볼륨 타입 선택:
- gp3 (범용 SSD, 비용 대비 성능, IOPS/처리량 개별 설정)
- io1/io2 (프로비저닝 IOPS SSD, 일관된 고성능, 멀티 어태치 지원)
- st1/sc1 (HDD 기반, 처리량 중심/콜드 데이터)
- 일관적 저지연: 밀리초 단위 I/O, 데이터베이스·트랜잭션 워크로드에 적합.
- 스냅샷(증분): S3에 저장, 교차 리전/계정 복사, AMI 제작 및 DR에 활용.
- 암호화: KMS 기반 암호화 지원(볼륨·스냅샷·복구본 일관 적용).
- 유연한 구성: 인스턴스당 다수 볼륨 연결, RAID(예: RAID0)로 처리량 확장 가능.
- 과금: 프로비저닝한 용량(+ 선택 시 IOPS/처리량)과 스냅샷 저장 용량 기준.
대표 사용 사례
- 데이터베이스/트랜잭션 로그(OLTP, 고IOPS 요구)
- 애플리케이션 서버 부트/데이터 디스크
- 컨테이너(Kubernetes) 퍼시스턴트 볼륨
- 분석/배치 작업의 고성능 작업 영역
- 스냅샷 기반 백업·재해 복구(DR)
Instance Store (EC2 임시 스토리지)
EC2 인스턴스에 물리적으로 부착된 NVMe SSD를 제공하는 임시 블록 스토리지다.
인스턴스 생성과 함께 자동 생성되며, 별도 스토리지 요금 항목이 아닌 인스턴스 비용에 포함된다.
핵심 특징
- 초저지연·고IOPS/처리량: 로컬 디스크 수준 성능.
- 비영속성: 인스턴스 중지/종료(또는 호스트 장애) 시 데이터가 소실된다. 단, 재부팅에는 유지된다.
- 제약: 인스턴스 타입별 제공 여부/용량이 다르며, 분리·재부착 또는 스냅샷 기능이 없다.
- 보안: Nitro 기반 인스턴스는 하드웨어 암호화가 적용되며, 필요 시 OS/파일시스템 암호화를 추가한다.
대표 사용 사례
- 버퍼·캐시·스크래치 공간(정렬/조인 임시 파일, 빌드 아티팩트)
- 빅데이터/분산 처리의 로컬 셔플 스페이스(예: Spark/EMR), ML 중간 산출물
- 재생성 가능한 임시 콘텐츠(썸네일 변환, 트랜스코딩 중간 파일)
- DB 임시 테이블스페이스/로그 버퍼 등 손실 시 복구 가능한 데이터
운영 팁
- 영속 데이터는 EBS/EFS/S3에 저장한다.
- 부팅 스크립트(User Data, systemd)로 포맷·마운트·캐시 재구축을 자동화한다.
- 필요 시 주기적으로 EBS/S3로 덤프해 체크포인트를 남긴다.
AWS Storage Gateway
온프레미스 데이터와 AWS 클라우드(S3/EBS/Glacier)를 연결하는 하이브리드 스토리지 게이트웨이이다.
기존 프로토콜(NFS·SMB·iSCSI)은 그대로 사용하고, 백엔드는 HTTPS로 AWS에 연결해 확장·백업·아카이브를 구현한다.
주요 활용
재해 복구(DR), 백업/복원, 멀티 티어 스토리지(핫→콜드로 계층화), 파일 서버 클라우드 확장에 활용한다.
게이트웨이 유형
1) File Gateway
- 프로토콜: NFS, SMB
- 백엔드: S3(필요 시 다양한 스토리지 클래스)
- 용도: 온프레미스 공유 폴더를 S3에 매핑, 파일 서버 확장·백업·데이터 레이크 적재
2) Volume Gateway
- 프로토콜: iSCSI(블록)
- 백엔드: S3에 데이터 저장, 스냅샷은 EBS 스냅샷으로 보관
- 용도: 온프레미스 서버 볼륨의 백업·복구, 하이브리드 블록 스토리지, DR
3) Tape Gateway
- 프로토콜: iSCSI(VTL)
- 백엔드: 가상 테이프를 S3에 저장, 장기 보관은 S3 Glacier로 이전
- 용도: 물리 테이프 대체, 장기 보관·규정 준수, 오프사이트 백업
S3의 공동 책임 모델
AWS가 책임지는 영역
- 인프라스트럭처 보안: 데이터센터, 하드웨어, 네트워크, 가상화 계층의 물리·운영 보안을 관리한다.
- 내구성·가용성 보장: 다중 AZ 복제 등으로 서비스 내구성과 가용성을 설계·운영한다.
- 서비스 패치·취약성 분석: S3 소프트웨어 구성과 보안 패치를 수행하고 내부 규정 준수를 검증한다.
사용자가 책임지는 영역
- 데이터와 구성: 저장 데이터의 기밀성·무결성·가용성을 보장하고 리소스 구성을 적절히 관리한다.
- 접근 제어: 버킷 정책, IAM 정책(최소 권한), Block Public Access, Access Points/Object Ownership을 설정한다.
- 버전 관리: S3 Versioning(필요 시 MFA Delete 포함)을 활성화해 실수 삭제·덮어쓰기 복구에 대비한다.
- 복제 전략: CRR/SRR로 재해복구·규정 준수 요건을 충족하도록 S3 복제를 설정한다.
- 로깅·모니터링: CloudTrail(관리·데이터 이벤트), S3 서버 액세스 로그, CloudWatch 지표·알람을 활성화한다.
- 스토리지 클래스 선택: 접근 패턴에 맞춰 Standard, (One Zone-)IA, Intelligent-Tiering, Glacier 계열 등을 선택·전환한다.
- 암호화: 전송 구간 TLS, 저장 시 SSE-S3/SSE-KMS(또는 CSE) 사용 및 KMS 키 권한 관리를 수행한다.
- 수명주기 관리: Lifecycle 규칙으로 보존·아카이브·만료를 자동화하고 조기 삭제 수수료·복원 비용을 고려한다.
- 거버넌스·비용 관리: 태그·정책으로 데이터 분류, 비용 알림·예산, 비용 최적화(예: Intelligent-Tiering) 전략을 적용한다.
AWS Snow Family
오프라인으로 대용량 데이터를 옮기거나 엣지에서 수집·처리할 때 쓰는 휴대형/모바일 스토리지·컴퓨팅 장치다.
로컬에서 데이터를 장치에 복사한 뒤, AWS로 반납하면 S3/EBS 등에 적재된다. 인터넷 연결이 불안정하거나 대역폭 비용이 큰 환경에서 효과적이다.
- 데이터 마이그레이션: 온프레미스 ↔ AWS 간 대규모 데이터 이전을 오프라인으로 수행한다.
- 엣지 수집·처리: 현장(공장, 선박, 원격지 등)에서 데이터를 수집하고 필요 시 로컬에서 전처리한다.
네트워크 전송 대비 장점
연결 품질, 대역폭 비용, 전송 시간 제약을 피하고 안정적으로 이전한다. 장치에 암호화·검증을 적용해 무결성과 보안을 보장한다.
제품군
- Snowcone: 소형·경량. 로컬 수집 및 간단한 엣지 처리에 적합하다.
- Snowball Edge: 이동형 랙 장치. 스토리지 중심/컴퓨트 중심 모델이 있으며, EC2·Lambda(엣지) 실행을 지원한다.
- Snowmobile: 데이터센터급 대이전용 대형 트레일러. 초대규모 마이그레이션에 사용한다.
보안·운영
모든 데이터는 디바이스 레벨 암호화(KMS 키) 로 보호한다. 체인 오브 커스터디, 탬퍼-에비던트 설계, E-Ink 라벨로 추적·관리한다.
AWS OpsHub로 장치를 프로비저닝하고 작업을 모니터링한다. 반납 후 AWS가 데이터 적재와 장치 초기화를 수행한다.
사용 사례
- 대규모 백업/보관 데이터의 일괄 이전
- 네트워크가 불안정한 현장의 로그·미디어·센서 데이터 수집
- 제조/유전/선박/국방 등 원격지 엣지 분석
- 데이터센터 이전, 규정 준수 요구로 오프사이트 이전이 필요한 경우
AWS Snowcone (스노우콘)
소형·경량의 휴대형 데이터 전송 장치로, 현장(엣지)에서 수집한 데이터를 안전하게 담아 AWS로 이전한다. 스노우볼 사용이 어려운 공간·전력·운영 제약 환경에서 대안으로 사용한다.
모델
- Snowcone: 8TB HDD
- Snowcone SSD: 14TB SSD
전송 방식
- 오프라인 배송: 장치에 파일을 복사한 뒤 장치를 AWS로 발송하면 S3 등으로 적재된다.
- 온라인 전송(DataSync): 장치를 현장에 둔 채 AWS DataSync로 인터넷을 통해 전송한다.
사용 사례
- 원격지/협소 공간에서의 데이터 수집 및 이전
- 네트워크 대역폭이 제한되거나 연결이 불안정한 현장
- 소규모 엣지 워크로드의 백업·이관
AWS Snowball Edge (스노우볼 엣지)
대용량(TB–PB) 데이터를 네트워크 대신 물리 장치로 이관하는 오프라인 데이터 전송 장치다.
현장에서 데이터를 적재해 장치를 AWS로 반납하면 S3/EBS 등으로 안전하게 적재된다. 필요 시 엣지에서 간단한 연산도 수행할 수 있다.
모델
- Compute Optimized: 연산 중심 모델, 42TB 저장 용량
- Storage Optimized: 대용량 저장 중심 모델, 80TB 저장 용량
핵심 기능
- 블록 스토리지 + S3 호환 오브젝트 스토리지 제공
- 장치 단 암호화 및 무결성 검증, 탬퍼-에비던트 설계
- 현장 배포/모니터링은 AWS OpsHub로 관리
사용 사례
- 데이터센터 폐기/이전 시 대규모 데이터 백업 → 재해 복구(DR) 용 이관
- 대역폭이 부족하거나 불안정한 환경의 대량 로그·미디어·백업 이동
- 원격지에서의 엣지 수집/전처리 후 일괄 적재
전송 흐름
- 현장에서 Snowball Edge에 데이터 적재
- 장치를 AWS로 반납(운송)
- AWS가 데이터를 S3/EBS로 적재 및 장치 초기화
AWS Snowmobile (스노우 모빌)
엑사바이트(EB)급 데이터를 오프라인으로 AWS로 이전하는 컨테이너형 트럭(45ft) 장치다. 대규모 마이그레이션에서 네트워크 전송의 시간·대역폭·비용 제약을 해소한다.
용량/스케일
- 장치 1대당 최대 100PB 저장
- 1EB = 1,000PB = 1,000,000TB → 스노우모빌 10대로 처리 가능
보안/운영
- 전송 데이터 암호화(KMS 키) 및 체계적인 체인 오브 커스터디
- 화재 진압, 전용 보안요원, GPS 추적, 경보 모니터링, 24/7 비디오 감시
- 견고한 컨테이너 설계와 현장 배치·철수까지 AWS가 관리
사용 사례
- 10PB 이상 대규모 이전에서 Snowball보다 효율적
- 데이터센터 통합·폐쇄, 대규모 백업/아카이브 클라우드 이관
- 규정 준수나 네트워크 제약으로 오프라인 이송이 필요한 경우
전송 흐름
- 현장에 스노우모빌 배치 → 보안 연결 후 데이터 적재
- 장치를 AWS 데이터센터로 이동
- S3/EBS 등으로 데이터 적재 후 장치 초기화
'Cloud' 카테고리의 다른 글
| AWS 자격증 1장 - 클라우드 컴퓨팅 개요 (1) | 2026.01.12 |
|---|---|
| Mastering Cloud Fundamentals: AWS Concepts & Core Services (0) | 2025.09.19 |
| From Virtual Servers to Serverless (1) | 2025.09.10 |
| Edge to Core, Linked by Cloud (1) | 2025.09.06 |