cleanUrl: "/judgebench"
floatFirstTOC: right
title: LLM 평가능력 측정 JudgeBench
description: LLM의 평가 능력을 측정할 수 있는 JudgeBench 제작 방법과 실험 결과를 소개합니다. LLM의 자동 평가 신뢰도는?

도입

개요

스크린샷 2024-10-25 오후 6.18.52.png

JudgeBench 제작