질문 카테고라이징 구현 논의 및 문서화

Description

구현 흐름

  1. 질문 문자열에 대해 LLM 임베딩값 요청

  2. 받아낸 임베딩값을 벡터 디비 구축 후 벡터 디비에 저장

  3. 클러스터링을 위한 테스트 데이터 준비 및 소요 시간 테스트 → 클러스터링 주기 결정

  4. 클러스터링 조건 (주기, 질문 개수)

  5. 백그라운드에서 벡터 값들을 클러스터링 → 질문 카테고리 리스트 업데이트 & 기존 질문들을 카테고리 별로 클러스터링 → 클러스터링 된 질문에서 랜덤으로 몇 개 추출 후 LLM 에게 카테고리명 및 대표 질문 추출 요청 → DB 카테고리 테이블 업데이트

  6. 새로운 질문이 등록되었을 때 → 임베딩 값 추출 후 기존 카테고리 기준으로 분류 → 질문 레코드의 카테고리 외래키 업데이트