AutoArena is an open-source tool for automated evaluations using LLM judges to rank GenAI systems.
Cách sử dụng AutoArena?
Use AutoArena by installing it locally and inputting user prompts to evaluate generative AI systems.
Trường hợp sử dụng của AutoArena
Tính năng chính của AutoArena
Automated head-to-head evaluations using LLM judges
Fine-tune custom judges
Generate leaderboards with Elo scores
Support for multiple judge models
Collaborate on evaluations in the cloud
Câu hỏi thường gặp về AutoArena
Is AutoArena free to use?
Can I run AutoArena locally?
What types of models can I use with AutoArena?