LLMEval3
LLMEval是由復(fù)旦大學(xué)NLP實(shí)驗(yàn)室推出的大模型評測基準(zhǔn),最新的LLMEval-3聚焦于專業(yè)知識能力評測,涵蓋哲學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)、教育學(xué)、文學(xué)、歷史學(xué)、理學(xué)、工學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、軍事學(xué)、管理學(xué)、藝術(shù)學(xué)等教育部劃定的13個學(xué)科門類、50余個二級學(xué)科,共計(jì)約20W道標(biāo)準(zhǔn)生成式問答題目。