
천공카드부터 벡터 DB까지
데이터베이스 진화의 모든 것 (2026)
계층형 DB, RDBMS, NoSQL을 지나 AI 시대의 벡터 검색까지 — 20년 차 개발자 CoLife가 현장에서 직접 겪은 데이터베이스 역사와 지금 당장 써먹을 수 있는 선택 기준을 한 번에 정리합니다.
질서의 시작 — 계층형 · 망형 DB 1960~70s
데이터베이스라는 개념이 처음 등장했을 때는 지금처럼 유연하지 않았습니다. 마치 가계도나 조직도처럼 데이터가 엄격한 상하 관계로 묶여 있었죠. 변화보다는 '보관의 안정성'에 모든 무게를 두던 시절이었습니다.
IBM의 IMS(Information Management System) 등장 — 아폴로 우주선 부품 관리에 실제 사용된 세계 최초 상용 계층형 DB.
CODASYL 망형(Network) 모델 표준화 — 계층형의 한계를 보완해 다대다(M:N) 관계를 최초로 표현.
에드거 커드(Edgar F. Codd) 박사가 관계형 DB 이론 논문 발표 — 이후 30년 DB 패러다임을 바꾸는 역사적 분기점.
부모-자식 계층형 구조, 또는 다대다 관계를 표현하는 망형(Network) 모델. 포인터로 레코드를 직접 연결.
구조가 단순할 때 속도가 매우 빠름. 디스크 I/O를 최소화하도록 물리적 구조 최적화 가능.
구조가 조금만 바뀌어도 전체 프로그램 수정 필요. 유연성 부족이 치명적 약점.
지금도 메인프레임 환경에서는 IMS가 현역으로 돌아가고 있습니다. "구식 기술"이라 부르기 전에, 60년 이상 실전에서 검증된 안정성을 먼저 존중해야 합니다.
RDBMS의 천하통일 — Oracle, MySQL, PostgreSQL 1980~2000s
에드거 커드의 이론을 바탕으로 Oracle, IBM DB2, MSSQL이 기업 시장을 장악했습니다. 유닉스/리눅스 서버에는 Oracle을, 윈도우 서버에는 MSSQL을 올리는 것이 당시의 공식이었죠.
인터넷이 보급되고 웹 서비스가 폭발적으로 성장하면서 새로운 스타가 탄생합니다. 바로 MySQL입니다. 무거운 기업용 DB 대신 빠르고 가벼운 MySQL이 웹 개발의 대세로 자리 잡았고, 오픈소스 진영의 PostgreSQL은 조용히 실력을 쌓으며 미래를 준비했습니다.
표(Table) + SQL + ACID (원자성·일관성·고립성·지속성). 데이터 중복 최소화 정규화.
강력한 트랜잭션 관리로 데이터 신뢰도 극대화. 복잡한 조인(JOIN) 쿼리와 집계 연산에 최적화.
수직적 확장(Scale-Up)만 가능해 트래픽 폭증 시 한계 도달. 스키마 변경 비용이 큼.
-- RDBMS의 핵심: ACID 트랜잭션 예시
BEGIN TRANSACTION;
UPDATE accounts SET balance = balance - 50000
WHERE user_id = 'alice';
UPDATE accounts SET balance = balance + 50000
WHERE user_id = 'bob';
-- 오류 없으면 커밋, 하나라도 실패하면 롤백 — 무결성 보장
COMMIT;
결제, 금융, 회원 정보처럼 "돈과 신뢰"가 얽힌 데이터에서는 2026년인 지금도 RDBMS가 정답입니다. 유행을 따라 이런 데이터를 NoSQL로 이전했다가 정합성 문제를 겪는 사례를 여럿 봤습니다.
NoSQL의 반란과 일상화 — MongoDB · Redis 2010s~현재
'빅데이터'라는 물결이 IT 업계를 덮치면서 기존 RDBMS는 한계에 부딪혔습니다. 수억 건의 비정형 데이터를 실시간으로 처리하기엔 너무 무거웠거든요. 이 갈망에서 NoSQL(Not Only SQL)이 탄생했습니다.
| 유형 | 대표 DB | 저장 방식 | 주 사용처 |
|---|---|---|---|
| Document | MongoDB | JSON/BSON 문서 | 콘텐츠 관리, 카탈로그, CMS |
| Key-Value | Redis, DynamoDB | 키:값 쌍 | 세션 캐싱, 리더보드, 큐 |
| Column-Family | Cassandra, HBase | 열 중심 저장 | 시계열, IoT, 로그 분석 |
| Graph | Neo4j, Amazon Neptune | 노드 · 엣지 | 소셜 그래프, 추천 엔진 |
💬 "요즘 NoSQL이라는 말이 잘 안 들리네?" — 인기가 식은 게 아닙니다. 캐싱이 필요하면 자연스럽게 Redis를 띄우는 것처럼, 이미 개발자의 일상적인 도구로 완전히 정착했기 때문입니다.
AI 시대 주목할 DB — 벡터 DB · 분산형 SQL 2024~
생성형 AI와 RAG(Retrieval-Augmented Generation)가 일상화되면서 텍스트·이미지를 수학적 좌표(임베딩 벡터)로 저장하는 벡터 데이터베이스가 필수 인프라로 부상했습니다.
익숙한 RDBMS 환경에서 벡터 검색까지 — 별도 벡터 DB 없이 pgvector 확장 하나로 기존 데이터와 AI 기능을 동시에 처리. 현재 개발자들이 가장 선호.
Pinecone, Qdrant, Weaviate, Milvus 등. 수십억 벡터를 밀리초 단위로 검색해야 하는 대규모 AI 서비스에 최적화.
Google Spanner, CockroachDB, TiDB. RDBMS 무결성 + NoSQL 수평 확장성 동시 보장. 글로벌 스케일 서비스의 새 표준.
-- pgvector: PostgreSQL에서 AI 유사도 검색
CREATE EXTENSION vector;
-- 임베딩 벡터 컬럼 추가 (1536차원 = OpenAI ada-002)
ALTER TABLE documents
ADD COLUMN embedding vector(1536);
-- 가장 유사한 문서 5개 검색 (코사인 거리)
SELECT title, content
FROM documents
ORDER BY embedding <=> $1
LIMIT 5;
AI 기능을 추가해야 하는데 인프라 복잡도를 높이고 싶지 않다면, PostgreSQL + pgvector가 2026년 현재 가장 현실적인 첫 선택입니다. 새로운 DB를 운영하는 비용보다 익숙한 환경에서 확장하는 비용이 훨씬 저렴합니다.
어떤 DB를 선택할까? — 실전 비교표
폴리글랏 퍼시스턴스(Polyglot Persistence)가 이제 기본 소양입니다. 하나의 서비스에서 여러 DB를 목적에 맞게 혼용하는 것이 실무의 정답입니다.
| 상황 / 데이터 성격 | 추천 DB | 이유 |
|---|---|---|
| 💳 결제 · 금융 · 회원 정보 | PostgreSQL MySQL | ACID 트랜잭션 필수, 무결성이 모든 것 |
| ⚡ 세션 · 캐시 · 실시간 랭킹 | Redis | 인메모리 초고속 읽기/쓰기, TTL 지원 |
| 📄 콘텐츠 · 로그 · 비정형 | MongoDB | 스키마 유연성, 중첩 구조 저장에 최적 |
| 🤖 AI · 유사도 검색 · RAG | pgvector Qdrant | 임베딩 벡터 인덱싱 및 ANN 검색 필수 |
| 🌍 글로벌 · 분산 트랜잭션 | Spanner CockroachDB | 수평 확장 + 강한 일관성 동시 보장 |
| 📈 시계열 · IoT · 센서 로그 | TimescaleDB InfluxDB | 시간 기반 파티셔닝 · 집계 최적화 |
🧠 CoLife의 인사이트 — "기술은 유행이지만, 데이터는 본질"
20년 동안 수많은 DB의 흥망성쇠를 지켜보며 깨달은 것이 하나 있습니다. 가장 최신 DB가 반드시 정답은 아니다라는 사실입니다.
AI 검색을 위해서는 pgvector를 품은 PostgreSQL이 정답일 수 있지만, 사용자의 결제 정보라면 여전히 보수적이고 강력하게 세팅된 전통적인 RDBMS가 최고의 선택입니다.
어떤 DB를 쓰느냐보다 더 중요한 건, 우리가 다루는 데이터가 비즈니스에서 어떤 의미를 갖는지를 먼저 이해하는 것입니다. 기술의 화려함에 매몰되기보다, 데이터의 무결성과 서비스의 목적 사이에서 균형을 잡는 능력이 베테랑 개발자의 진짜 실력이라고 믿습니다.
여러분의 프로젝트에서는 어떤 DB가 효자 노릇을 하고 있나요? 새로운 트렌드 때문에 도입했다가 쓴맛을 본 경험이 있으신가요? 댓글로 여러분의 이야기를 들려주세요! 😊
'Tech > Insight' 카테고리의 다른 글
| AI 시대 개발자의 새로운 역할 — 프롬프트·컨텍스트·하네스 엔지니어 완전 정리 (0) | 2026.04.08 |
|---|---|
| 신입 개발자가 1년 만에 상위 20%가 되는 법 — 20년 차가 직접 겪은 6가지 습관 (0) | 2026.04.06 |
| AI 코딩 툴이 개발자를 대체할까? 20년 차가 직접 겪은 냉혹한 현실과 살아남는 법 (0) | 2026.04.02 |
| 주석 없는 코드가 좋은 코드일까? 20년 차 개발자가 말하는 클린 코드와 최악의 주석들 (0) | 2026.03.31 |
| [AI 시대의 새로운 장인 정신] 이미 머릿속에 답은 있는데, 우리는 왜 프롬프트를 깎고 있을까? (0) | 2026.03.30 |