오픈소스 인사이트
home
오픈소스 기술 동향
home
⚠️

엘라스틱서치 인덱스 설계 실전 기법 [2편: 인덱스 주요 설정]

6 more properties

“엘라스틱서치 인덱스, 실무에선 ‘설정’이 성능을 좌우한다!”

“인덱스 하나 만들고 데이터만 넣으면 끝 아닐까?”
그건 테스트 환경 이야기일 뿐!
실제 운영 환경에서는 인덱스의 세밀한 설정과 매핑이 검색 품질, 성능, 비용까지 결정합니다.
이번 영상에서는 에스코어 실무자가 인덱스 생성 시 반드시 알아야 할 핵심 설정과 매핑 노하우
실제 사례와 함께 쉽고 명확하게 설명합니다.

“인덱스 설정, 왜 이렇게 중요할까?”

테스트는 쉽다, 운영은 다르다!
엘라스틱서치는 스키마리스(schema-less) 구조라 아무 데이터나 바로 저장할 수 있지만,
실무에서는 반드시 “설정”과 “매핑”을 명확히 해야 데이터 품질, 검색 성능, 운영 효율을 지킬 수 있습니다.
설정(Setting)과 매핑(Mapping)의 역할
설정: 인덱스의 샤드(Shard) 수, 리프레시 주기, 분석기(Analyzer) 등 인덱스의 구조와 성능을 좌우하는 핵심 옵션
매핑: 각 필드의 데이터 타입, 분석 방식, 저장 옵션 등 데이터의 품질과 검색 정확도를 결정

실무에서 꼭 챙겨야 할 인덱스 설정 노하우

샤드(Shard) 수는 신중하게!
프라이머리 샤드 수는 인덱스 생성 시 반드시 지정
한 번 정하면 변경 불가, 운영 환경에 맞는 최적값 설계가 필수
리프레시 주기/세그먼트 관리
데이터 실시간성, 검색 빈도에 따라 리프레시 주기를 조정
세그먼트 관리로 불필요한 리소스 소모 방지
애널라이저(Analyzer) 설정
검색 품질을 좌우하는 형태소 분석기
캐릭터 필터, 토크나이저, 토큰 필터 등
서비스 특성에 맞는 분석기 설계가 필수
매핑(Mapping)은 명시적으로!
동적 매핑은 편리하지만, 실무에서는 반드시 명시적 매핑 권장
데이터 타입, 필드별 분석기, 멀티필드(텍스트+키워드) 등 필요한 필드와 타입을 미리 정의해 데이터 품질 보장
중요 옵션: 다이나믹, _source, norms
다이나믹: STRICT로 설정해 예기치 않은 데이터 저장 방지
_source: 원본 데이터 저장 여부, 필요 없으면 저장 공간 절약
norms: 점수 계산이 필요 없는 필드는 OFF로 성능·공간 최적화
객체/네스티드 필드, 멀티필드 활용
복잡한 데이터 구조, 다양한 검색 요구에 맞게 오브젝트/네스티드 타입과 멀티필드 설계 활용
인덱스 템플릿/컴포넌트 템플릿 적극 활용
반복되는 설정을 템플릿으로 표준화
일별 로그, 다양한 인덱스에도 일관된 품질 유지

실무자가 반드시 기억해야 할 포인트

“엘라스틱서치 인덱스, 설정과 매핑을 소홀히 하면 성능 저하와 관리 비용 폭탄이 따라온다!”
샤드·분석기·매핑 등 운영 환경에 맞는 설계와 표준화가 장기적으로 안정적이고 효율적인 시스템 운영의 핵심입니다.
에스코어의 실전 노하우로 검색 품질, 성능, 운영 효율까지 한 번에 잡으세요.