사용자 도구

사이트 도구


wiki:3party:elasticsearch

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판 이전 판
다음 판
이전 판
wiki:3party:elasticsearch [2022/03/14 18:39]
127.0.0.1 바깥 편집
wiki:3party:elasticsearch [2023/01/13 18:44] (현재)
줄 11: 줄 11:
  
 데이터의 양과는 무관하게 1초 이내의 응답 속도 기대 데이터의 양과는 무관하게 1초 이내의 응답 속도 기대
 +
 +===== News =====
 +벡터 검색
 +  
 +  무차별 대입 벡터 유사성 지원(Brute force vector similarity) - 7.3 GA
 +    - 용량에 따른 복잡도 증가
 +  
 +  HNSW(Hierarchical Navigable Small Words) & KNN (K-Neighbor Nearest) - 8.0
 +    - 대용량 처리를 위해 약간의 정확도(accuracy) 희생
 +    - 대용량 인덱스에서 쿼리 지연 감소
 +  
 +  Lucene를 많이 사용함
 +  
 +
 +허깅 페이스 (파이토치 모델)
 +  Eland (엘란트) - 머신러닝 모델 관리
 +  
 +  웹 크롤러도 있음
 +  7.x와 8.x는 많은 변화가 있음
 +
 +
 +  머신 러닝 지원 내용
 +    허깅 페이스에서 모델 다운로드
 +    -> 도큐먼트 학습
 +    -> 질문 쿼리를 벡터로 변경
 +    -> _knn_search 벡터로 검색
  
 ===== Case Study ===== ===== Case Study =====
줄 84: 줄 110:
   NETFLIX, Uber, Slack(기업용 메시지 앱, 협업 툴), twilio(트윌리오, 고객 커뮤니케이션 API 기업), Microsoft,    NETFLIX, Uber, Slack(기업용 메시지 앱, 협업 툴), twilio(트윌리오, 고객 커뮤니케이션 API 기업), Microsoft, 
   구글 클라우드, AWS, Azure에서 사용 가능   구글 클라우드, AWS, Azure에서 사용 가능
 +
 +===== ElasticSearch AI(문서유사도) 관련 =====
 +[[https://www.elastic.co/kr/blog/text-similarity-search-with-vectors-in-elasticsearch|벡터 필드를 사용한 텍스트 유사도 검색(공식홈페이지)]] \\
 +[[https://velog.io/@jakeseo_me/%EB%AC%B8%EC%84%9C-%EC%9C%A0%EC%82%AC%EB%8F%84-%EC%B8%A1%EC%A0%95-%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0-3-with-elasticsearch|엘라스틱서치로 문서 유사도 검색 구현하기]] \\
 +[[https://andonekwon.tistory.com/16?category=413400|Elasticsearch를 이용한 문서 유사도 검색과 Springboot를 통한 구현]]
  
 ===== Install ===== ===== Install =====
/volume1/web/dokuwiki/data/attic/wiki/3party/elasticsearch.1647250778.txt.gz · 마지막으로 수정됨: 2022/03/14 18:39 저자 127.0.0.1