An Skóre spoľahlivosti odpovede bola tiež hodnotená v tejto automatizovanej fáze na základe Likertova stupnica psychometrická testovacia metóda. Tu bol sudca LLM rozšírený o dvoch ľudských anotátorov.
An Answer Confidence Score was also evaluated in this automated phase, based on the Likertova lestvica psychometric testing method. Here the LLM judge was augmented by two human annotators. A third ...