Add compare-based model eval #36

yujonglee · 2023-08-25T10:30:15Z

Rather than asking an LLM for a direct evaluation (via giving a score), try giving it a reference and asking for a comparison. This helps with reducing noise.

yujonglee · 2023-08-29T05:44:09Z

This will be BaseEvalWithReference

yujonglee · 2023-08-29T10:28:50Z

We can consider using ELO-Ranking, but we need enormous number of LLM Calls.

yujonglee mentioned this issue Aug 25, 2023

Better handle positional bias #37

Closed

yujonglee mentioned this issue Aug 29, 2023

Add Grader, similar to Classifier #53

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add compare-based model eval #36

Add compare-based model eval #36

yujonglee commented Aug 25, 2023

yujonglee commented Aug 29, 2023

yujonglee commented Aug 29, 2023

Add compare-based model eval #36

Add compare-based model eval #36

Comments

yujonglee commented Aug 25, 2023

yujonglee commented Aug 29, 2023

yujonglee commented Aug 29, 2023