“엘라스틱서치 인덱스, 실무에선 ‘설정’이 성능을 좌우한다!”
“인덱스 하나 만들고 데이터만 넣으면 끝 아닐까?”
실제 운영 환경에서는 인덱스의 세밀한 설정과 매핑이 검색 품질, 성능, 비용까지 결정합니다.
실제 사례와 함께 쉽고 명확하게 설명합니다.
“인덱스 설정, 왜 이렇게 중요할까?”
•
테스트는 쉽다, 운영은 다르다!
엘라스틱서치는 스키마리스(schema-less) 구조라 아무 데이터나 바로 저장할 수 있지만,
실무에서는 반드시 “설정”과 “매핑”을 명확히 해야 데이터 품질, 검색 성능, 운영 효율을 지킬 수 있습니다.
•
설정(Setting)과 매핑(Mapping)의 역할
◦
설정: 인덱스의 샤드(Shard) 수, 리프레시 주기, 분석기(Analyzer) 등 인덱스의 구조와 성능을 좌우하는 핵심 옵션
◦
매핑: 각 필드의 데이터 타입, 분석 방식, 저장 옵션 등 데이터의 품질과 검색 정확도를 결정
실무에서 꼭 챙겨야 할 인덱스 설정 노하우
•
샤드(Shard) 수는 신중하게!
◦
프라이머리 샤드 수는 인덱스 생성 시 반드시 지정
◦
한 번 정하면 변경 불가, 운영 환경에 맞는 최적값 설계가 필수
•
리프레시 주기/세그먼트 관리
◦
데이터 실시간성, 검색 빈도에 따라 리프레시 주기를 조정
◦
세그먼트 관리로 불필요한 리소스 소모 방지
•
애널라이저(Analyzer) 설정
◦
검색 품질을 좌우하는 형태소 분석기
◦
캐릭터 필터, 토크나이저, 토큰 필터 등
서비스 특성에 맞는 분석기 설계가 필수
•
매핑(Mapping)은 명시적으로!
◦
동적 매핑은 편리하지만, 실무에서는 반드시 명시적 매핑 권장
◦
데이터 타입, 필드별 분석기, 멀티필드(텍스트+키워드) 등 필요한 필드와 타입을 미리 정의해 데이터 품질 보장
•
중요 옵션: 다이나믹, _source, norms
◦
다이나믹: STRICT로 설정해 예기치 않은 데이터 저장 방지
◦
_source: 원본 데이터 저장 여부, 필요 없으면 저장 공간 절약
◦
norms: 점수 계산이 필요 없는 필드는 OFF로 성능·공간 최적화
•
객체/네스티드 필드, 멀티필드 활용
◦
복잡한 데이터 구조, 다양한 검색 요구에 맞게 오브젝트/네스티드 타입과 멀티필드 설계 활용
•
인덱스 템플릿/컴포넌트 템플릿 적극 활용
◦
반복되는 설정을 템플릿으로 표준화
◦
일별 로그, 다양한 인덱스에도 일관된 품질 유지
실무자가 반드시 기억해야 할 포인트
“엘라스틱서치 인덱스, 설정과 매핑을 소홀히 하면 성능 저하와 관리 비용 폭탄이 따라온다!”
•
샤드·분석기·매핑 등 운영 환경에 맞는 설계와 표준화가 장기적으로 안정적이고 효율적인 시스템 운영의 핵심입니다.
에스코어의 실전 노하우로 검색 품질, 성능, 운영 효율까지 한 번에 잡으세요. 