텍스트 라벨링 데이터셋 구축 가이드본 가이드는 글쓴이의 텍스트 라벨링 데이터 10만 건 직접 구축 쌩노가다를 토대로 작성되었습니다. 라벨링 작업은 혼자 하면 품질 보장이 안됩니다. 무조건 2명 이상 쓰세요. 아니 제일 좋은건 그냥 업체 쓰시고 피드백 주는게 제일 편하고 빠릅니다 ㅜㅜ 1. 명확한 라벨링 기준 수립지침 문서 (Guideline) 작성 - 작업자 간 해석 차이를 줄이기 위한 명확한 라벨링 룰 정의예시 포함 - 각 라벨에 대해 긍정/부정/모호한 예시 제시경계 기준 명시 - 어떤 경우는 라벨링하지 말아야 하는지도 명확히 규정2. 라벨링 기준 예시1) 루브릭 기반 평가지표문맥 이해, 표현력, 논리성 등 평가 항목 구성주관적이지만 라벨러 간 일관성 훈련에 유용2) 현대적 기준 (예: Anthropi..