NeurIPS 2025 E2LM Competition: Early Training Evaluation of Language Models Leaderboard

Show only best submission per team

{

"headers": [
- "Submission ID",
- "Team",
- "Submitter",
- "Signal Quality",
- "Ranking Consistency",
- "Scientific Compliance",
- "Global Score",
- "Submission Time",
- "Description"
],
"data": [
- [
  - "e1490cde32",
  - "morai",
  - "giovanivaldrighi",
  - 0.915,
  - 0.885,
  - 0.638,
  - 0.801,
  - "2025-10-21T21:13:30",
  - "mmlu_v15"
  ],
- [
  - "12345",
  - "morai",
  - "giovanivaldrighi",
  - 0.883,
  - 0.943,
  - 0.63,
  - 0.788,
  - "000",
  - "test"
  ],
- [
  - "8ca0fc4b56",
  - "Noor",
  - "mdahba",
  - 0.95,
  - 0.894,
  - 0.553,
  - 0.786,
  - "2025-11-02T00:50:43",
  - "submission 4"
  ],
- [
  - "dc6b27cb29",
  - "morai",
  - "giovanivaldrighi",
  - 0.935,
  - 0.928,
  - 0.554,
  - 0.782,
  - "2025-10-01T22:35:50",
  - "MMLU small with ll diff (v1)"
  ],
- [
  - "11b325bf4b",
  - "Noor",
  - "mdahba",
  - 0.976,
  - 0.879,
  - 0.514,
  - 0.781,
  - "2025-11-03T12:01:15",
  - "submission 15"
  ],
- [
  - "cd9b3b9524",
  - "morai",
  - "giovanivaldrighi",
  - 0.921,
  - 0.834,
  - 0.587,
  - 0.779,
  - "2025-10-22T11:57:41",
  - "mmlu_v16"
  ],
- [
  - "8d5e3c3934",
  - "morai",
  - "giovanivaldrighi",
  - 0.902,
  - 0.899,
  - 0.575,
  - 0.771,
  - "2025-10-03T01:42:42",
  - "MMLU small with ll diff (v2)"
  ],
- [
  - "984384485e",
  - "morai",
  - "giovanivaldrighi",
  - 0.919,
  - 0.957,
  - 0.534,
  - 0.769,
  - "2025-09-30T23:20:17",
  - "MMLU with ll diff (v1)"
  ],
- [
  - "ed491308f5",
  - "morai",
  - "giovanivaldrighi",
  - 0.893,
  - 0.91,
  - 0.574,
  - 0.767,
  - "2025-10-06T17:51:57",
  - "MMLU with ll diff norm"
  ],
- [
  - "e01740670c",
  - "morai",
  - "giovanivaldrighi",
  - 0.934,
  - 0.935,
  - 0.511,
  - 0.765,
  - "2025-10-21T20:57:24",
  - "mmlu_v14"
  ],
- [
  - "7ea9dd4b4f",
  - "morai",
  - "caiorhoden",
  - 0.946,
  - 0.786,
  - 0.533,
  - 0.765,
  - "2025-11-03T05:04:39",
  - "mmlu_v15_fs3"
  ],
- [
  - "6e373496a0",
  - "morai",
  - "giovanivaldrighi",
  - 0.889,
  - 0.773,
  - 0.605,
  - 0.764,
  - "2025-10-10T22:08:17",
  - "mmlu_v9"
  ],
- [
  - "832e2e8308",
  - "morai",
  - "giovanivaldrighi",
  - 0.932,
  - 0.83,
  - 0.528,
  - 0.76,
  - "2025-11-03T11:55:11",
  - "mmlu_v25"
  ],
- [
  - "04ce6c22c1",
  - "Noor",
  - "mdahba",
  - 0.988,
  - 0.908,
  - 0.434,
  - 0.759,
  - "2025-11-03T11:56:19",
  - "submission 14"
  ],
- [
  - "c5c3c50e3c",
  - "morai",
  - "caiorhoden",
  - 0.892,
  - 0.712,
  - 0.602,
  - 0.758,
  - "2025-10-29T02:07:06",
  - "mmlu_v19"
  ],
- [
  - "76e438a046",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.926,
  - 0.752,
  - 0.548,
  - 0.758,
  - "2025-10-13T20:53:23",
  - "0007"
  ],
- [
  - "a4395863a4",
  - "morai",
  - "giovanivaldrighi",
  - 0.902,
  - 0.776,
  - 0.572,
  - 0.758,
  - "2025-10-17T21:35:04",
  - "mmlu_v12"
  ],
- [
  - "ec1381b3f0",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.926,
  - 0.752,
  - 0.548,
  - 0.758,
  - "2025-10-28T08:42:41",
  - "0014"
  ],
- [
  - "2bbe5c8486",
  - "Scitix",
  - "Lie24",
  - 0.947,
  - 0.936,
  - 0.471,
  - 0.756,
  - "2025-10-20T09:30:22",
  - "1"
  ],
- [
  - "aff36100ca",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.928,
  - 0.73,
  - 0.542,
  - 0.754,
  - "2025-09-25T21:16:33",
  - "MMLU_var new"
  ],
- [
  - "3084e0af9d",
  - "morai",
  - "giovanivaldrighi",
  - 0.931,
  - 0.801,
  - 0.52,
  - 0.753,
  - "2025-10-31T22:06:43",
  - "mmlu_v20"
  ],
- [
  - "97d2d4893b",
  - "morai",
  - "giovanivaldrighi",
  - 0.941,
  - 0.823,
  - 0.5,
  - 0.753,
  - "2025-11-02T17:23:22",
  - "mmlu_v22"
  ],
- [
  - "78710f0a1c",
  - "Nobelist",
  - "pkuHaowei",
  - 0.95,
  - 0.858,
  - 0.476,
  - 0.751,
  - "2025-09-25T16:44:33",
  - ""
  ],
- [
  - "440612e173",
  - "Nobelist",
  - "pkuHaowei",
  - 0.95,
  - 0.858,
  - 0.476,
  - 0.751,
  - "2025-10-21T08:41:30",
  - ""
  ],
- [
  - "3e96b7b636",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.861,
  - 0.887,
  - 0.574,
  - 0.749,
  - "2025-09-28T22:07:45",
  - "0001"
  ],
- [
  - "9a535ed562",
  - "Noor",
  - "mdahba",
  - 0.978,
  - 0.929,
  - 0.418,
  - 0.749,
  - "2025-11-03T11:47:11",
  - "submission 13"
  ],
- [
  - "3e16f1d132",
  - "Noor",
  - "mdahba",
  - 0.982,
  - 0.95,
  - 0.4,
  - 0.746,
  - "2025-11-01T09:05:20",
  - "submission 3"
  ],
- [
  - "100a3b299e",
  - "Noor",
  - "mdahba",
  - 0.946,
  - 0.879,
  - 0.464,
  - 0.746,
  - "2025-11-02T23:01:29",
  - "submission 12"
  ],
- [
  - "a3deb9d739",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.916,
  - 0.83,
  - 0.509,
  - 0.744,
  - "2025-10-11T08:56:58",
  - "0005"
  ],
- [
  - "57a1db9bf2",
  - "Scitix",
  - "Lie24",
  - 0.954,
  - 0.972,
  - 0.423,
  - 0.743,
  - "2025-10-23T13:38:14",
  - "6"
  ],
- [
  - "5d9e22bec2",
  - "Nobelist",
  - "pkuHaowei",
  - 0.925,
  - 0.865,
  - 0.481,
  - 0.741,
  - "2025-10-27T10:06:19",
  - "revert-42-correct"
  ],
- [
  - "6567e2a41a",
  - "Scitix",
  - "Lie24",
  - 0.94,
  - 0.965,
  - 0.428,
  - 0.738,
  - "2025-10-28T13:21:22",
  - "new2"
  ],
- [
  - "65b2fc8291",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.965,
  - 0.928,
  - 0.402,
  - 0.736,
  - "2025-10-31T22:00:14",
  - "0019"
  ],
- [
  - "3bc899c991",
  - "morai",
  - "giovanivaldrighi",
  - 0.959,
  - 0.837,
  - 0.432,
  - 0.736,
  - "2025-11-02T17:38:58",
  - "mmlu_v23"
  ],
- [
  - "eeab1413e7",
  - "morai",
  - "giovanivaldrighi",
  - 0.849,
  - 0.748,
  - 0.582,
  - 0.732,
  - "2025-10-15T12:24:27",
  - "mmlu_v10"
  ],
- [
  - "60d985bc28",
  - "Scitix",
  - "Lie24",
  - 0.979,
  - 0.986,
  - 0.357,
  - 0.731,
  - "2025-10-20T11:14:45",
  - "5"
  ],
- [
  - "c1baf2ca4e",
  - "morai",
  - "giovanivaldrighi",
  - 0.959,
  - 0.837,
  - 0.419,
  - 0.731,
  - "2025-09-11T21:36:13",
  - "MMLU with fixed perplexity (v2)"
  ],
- [
  - "95de27dbcb",
  - "morai",
  - "giovanivaldrighi",
  - 0.959,
  - 0.837,
  - 0.419,
  - 0.731,
  - "2025-09-12T21:00:14",
  - "MMLU with fixed perplexity (v3)"
  ],
- [
  - "c7654b1abc",
  - "ShAIkespear",
  - "ESmike",
  - 0.959,
  - 0.837,
  - 0.419,
  - 0.731,
  - "2025-09-16T20:39:51",
  - "MMLU_var"
  ],
- [
  - "fb1bc9bdad",
  - "ShAIkespear",
  - "ESmike",
  - 0.958,
  - 0.823,
  - 0.42,
  - 0.729,
  - "2025-09-17T21:02:04",
  - "MMLU_var 2.0"
  ],
- [
  - "5467ac8323",
  - "morai",
  - "giovanivaldrighi",
  - 0.971,
  - 0.901,
  - 0.384,
  - 0.729,
  - "2025-10-31T22:12:02",
  - "mmlu_v21"
  ],
- [
  - "18ce18709a",
  - "Nobelist",
  - "pkuHaowei",
  - 0.956,
  - 0.841,
  - 0.419,
  - 0.729,
  - "2025-08-19T06:05:53",
  - "Another MMLU-Var test with updated hf_token"
  ],
- [
  - "97ec6e9999",
  - "test_ssn",
  - "sunshaoning",
  - 0.893,
  - 0.915,
  - 0.478,
  - 0.729,
  - "2025-10-30T15:48:17",
  - "v0.4"
  ],
- [
  - "dbf7b860ee",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.916,
  - 0.864,
  - 0.456,
  - 0.727,
  - "2025-10-30T00:00:13",
  - "0016"
  ],
- [
  - "b1c8bceccc",
  - "test_ssn",
  - "sunshaoning",
  - 0.887,
  - 0.837,
  - 0.494,
  - 0.725,
  - "2025-11-02T15:34:49",
  - "v0.14"
  ],
- [
  - "56ee9534e6",
  - "morai",
  - "giovanivaldrighi",
  - 0.888,
  - 0.919,
  - 0.474,
  - 0.725,
  - "2025-10-07T00:57:47",
  - "MMLU full with ll diff norm"
  ],
- [
  - "7c4156c0b4",
  - "Nobelist",
  - "pkuHaowei",
  - 0.955,
  - 0.872,
  - 0.4,
  - 0.724,
  - "2025-09-23T16:20:43",
  - "mmlu-var new v2.0"
  ],
- [
  - "6fafe06861",
  - "Nobelist",
  - "pkuHaowei",
  - 0.937,
  - 0.83,
  - 0.428,
  - 0.722,
  - "2025-08-27T13:51:43",
  - "Reduce dataset size + focusing on STEM"
  ],
- [
  - "8fe150c749",
  - "Scitix",
  - "Lie24",
  - 0.971,
  - 0.979,
  - 0.347,
  - 0.722,
  - "2025-10-20T11:14:20",
  - "4"
  ],
- [
  - "71be160599",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.964,
  - 0.8,
  - 0.401,
  - 0.722,
  - "2025-10-08T20:39:59",
  - "0004"
  ],
- [
  - "054dbb0d1a",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.901,
  - 0.808,
  - 0.475,
  - 0.721,
  - "2025-10-31T21:41:37",
  - "0018"
  ],
- [
  - "3210160e10",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.901,
  - 0.808,
  - 0.475,
  - 0.721,
  - "2025-10-28T21:22:46",
  - "0008"
  ],
- [
  - "ccbf3bf7b4",
  - "morai",
  - "giovanivaldrighi",
  - 0.947,
  - 0.886,
  - 0.394,
  - 0.72,
  - "2025-10-24T19:57:04",
  - "mmlu_v17"
  ],
- [
  - "1bc07adbed",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.905,
  - 0.851,
  - 0.452,
  - 0.718,
  - "2025-10-08T20:33:25",
  - "0003"
  ],
- [
  - "e3c8ba2e0b",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.933,
  - 0.735,
  - 0.44,
  - 0.716,
  - "2025-10-18T20:47:17",
  - "0010"
  ],
- [
  - "25fea29fad",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.924,
  - 0.928,
  - 0.403,
  - 0.716,
  - "2025-10-23T20:15:05",
  - "0013"
  ],
- [
  - "d4bb266f7e",
  - "Scitix",
  - "Lie24",
  - 0.971,
  - 0.986,
  - 0.33,
  - 0.716,
  - "2025-10-15T12:04:38",
  - "test"
  ],
- [
  - "c31400f3ef",
  - "morai",
  - "giovanivaldrighi",
  - 0.912,
  - 0.744,
  - 0.459,
  - 0.714,
  - "2025-10-24T20:25:15",
  - "mmlu_v18"
  ],
- [
  - "a38c1f4173",
  - "thu-let_it_be",
  - "jiangyi233",
  - 0.944,
  - 0.841,
  - 0.395,
  - 0.714,
  - "2025-11-02T05:18:01",
  - "1102-001"
  ],
- [
  - "9adf239175",
  - "Nobelist",
  - "pkuHaowei",
  - 0.87,
  - 0.801,
  - 0.494,
  - 0.713,
  - "2025-09-19T17:04:06",
  - "MMLU-var new"
  ],
- [
  - "1a408b0ffb",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.914,
  - 0.856,
  - 0.42,
  - 0.711,
  - "000",
  - "0017"
  ],
- [
  - "cd86d28256",
  - "ShAIkespear",
  - "ESmike",
  - 0.956,
  - 0.737,
  - 0.396,
  - 0.71,
  - "2025-09-25T13:37:29",
  - "MMLU_var 3.0"
  ],
- [
  - "3739eaa857",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.88,
  - 0.759,
  - 0.479,
  - 0.708,
  - "2025-11-01T16:41:03",
  - "0024"
  ],
- [
  - "1aed33b949",
  - "test_ssn",
  - "sunshaoning",
  - 0.832,
  - 0.822,
  - 0.521,
  - 0.706,
  - "2025-10-30T15:37:04",
  - "v0.3"
  ],
- [
  - "854c59374d",
  - "test_ssn",
  - "sunshaoning",
  - 0.862,
  - 0.786,
  - 0.49,
  - 0.705,
  - "2025-11-02T17:28:46",
  - "v0.17"
  ],
- [
  - "a768d0c3ac",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.925,
  - 0.834,
  - 0.392,
  - 0.703,
  - "2025-11-01T16:15:24",
  - "0022"
  ],
- [
  - "ed217137fd",
  - "DARG",
  - "imberator",
  - 0.915,
  - 0.855,
  - 0.396,
  - 0.701,
  - "2025-11-02T15:05:01",
  - "MMLU mixed"
  ],
- [
  - "29c501c195",
  - "Episteme",
  - "1OOl",
  - 0.938,
  - 0.842,
  - 0.365,
  - 0.699,
  - "2025-10-20T21:25:06",
  - "exp004"
  ],
- [
  - "2d3accf443",
  - "test_ssn",
  - "sunshaoning",
  - 0.842,
  - 0.793,
  - 0.493,
  - 0.697,
  - "2025-11-01T12:55:31",
  - "v0.7"
  ],
- [
  - "815cca37c4",
  - "Scitix",
  - "Lie24",
  - 0.922,
  - 0.906,
  - 0.364,
  - 0.697,
  - "2025-10-27T09:03:08",
  - "V2.1"
  ],
- [
  - "1c3036c0bb",
  - "morai",
  - "giovanivaldrighi",
  - 0.974,
  - 0.815,
  - 0.319,
  - 0.696,
  - "2025-10-16T18:12:54",
  - "mmlu_v11"
  ],
- [
  - "3fe8f215a9",
  - "test_ssn",
  - "sunshaoning",
  - 0.832,
  - 0.793,
  - 0.489,
  - 0.691,
  - "2025-11-02T16:48:00",
  - "v0.15"
  ],
- [
  - "aae73d095e",
  - "DARG",
  - "imberator",
  - 0.939,
  - 0.85,
  - 0.342,
  - 0.691,
  - "2025-10-13T16:40:52",
  - "MMLU var subset"
  ],
- [
  - "ae45deb63f",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.891,
  - 0.741,
  - 0.423,
  - 0.689,
  - "2025-11-01T16:45:01",
  - "0025"
  ],
- [
  - "69bc3c57ff",
  - "test_ssn",
  - "sunshaoning",
  - 0.833,
  - 0.765,
  - 0.466,
  - 0.68,
  - "2025-11-01T14:35:08",
  - "v0.9"
  ],
- [
  - "d5b347e711",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.846,
  - 0.737,
  - 0.447,
  - 0.676,
  - "2025-10-02T18:18:52",
  - "0002"
  ],
- [
  - "c3dd319ea6",
  - "DARG",
  - "imberator",
  - 0.849,
  - 0.822,
  - 0.413,
  - 0.672,
  - "2025-11-02T14:48:20",
  - "MMLU focused"
  ],
- [
  - "79ff9c16ed",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.792,
  - 0.761,
  - 0.482,
  - 0.665,
  - "2025-10-27T19:24:41",
  - "0015"
  ],
- [
  - "9f15e277ed",
  - "test_ssn",
  - "sunshaoning",
  - 0.804,
  - 0.801,
  - 0.454,
  - 0.664,
  - "2025-11-02T17:38:12",
  - "v0.18"
  ],
- [
  - "2eb78a7263",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.874,
  - 0.847,
  - 0.348,
  - 0.661,
  - "2025-10-19T09:37:08",
  - "0011"
  ],
- [
  - "5cbcbd3b88",
  - "test_ssn",
  - "sunshaoning",
  - 0.776,
  - 0.771,
  - 0.472,
  - 0.654,
  - "2025-11-02T16:58:30",
  - "v0.16"
  ],
- [
  - "18e2f72ab7",
  - "Episteme",
  - "1OOl",
  - 0.891,
  - 0.817,
  - 0.311,
  - 0.652,
  - "2025-11-03T11:27:44",
  - "exp_012"
  ],
- [
  - "8b2821e989",
  - "ShAIkespear",
  - "ESmike",
  - 0.817,
  - 0.742,
  - 0.369,
  - 0.63,
  - "2025-10-20T22:57:25",
  - "0009"
  ],
- [
  - "428b4470db",
  - "Episteme",
  - "1OOl",
  - 0.849,
  - 0.746,
  - 0.292,
  - 0.616,
  - "2025-11-02T02:02:40",
  - "exp010"
  ],
- [
  - "b695ee644e",
  - "morai",
  - "giovanivaldrighi",
  - 0.741,
  - 0.929,
  - 0.376,
  - 0.614,
  - "2025-09-26T14:06:20",
  - "MMLU Var with constrained prompt"
  ],
- [
  - "6ee7646bce",
  - "morai",
  - "giovanivaldrighi",
  - 0.845,
  - 0.843,
  - 0.264,
  - 0.612,
  - "2025-10-09T17:39:51",
  - "mmlu_v8"
  ],
- [
  - "4616bc30c4",
  - "Nobelist",
  - "pkuHaowei",
  - 0.63,
  - 0.63,
  - 0.534,
  - 0.592,
  - "2025-10-23T18:34:54",
  - ""
  ],
- [
  - "aee71f4726",
  - "Episteme",
  - "1OOl",
  - 0.823,
  - 0.807,
  - 0.222,
  - 0.581,
  - "2025-11-02T01:29:06",
  - "exp_009"
  ],
- [
  - "8acf947fc7",
  - "Episteme",
  - "1OOl",
  - 0.823,
  - 0.807,
  - 0.222,
  - 0.581,
  - "2025-11-03T11:51:32",
  - "exp_015"
  ],
- [
  - "474ee4ea74",
  - "test_ssn",
  - "sunshaoning",
  - 0.543,
  - 0.865,
  - 0.556,
  - 0.58,
  - "2025-11-01T13:03:27",
  - "v0.8"
  ],
- [
  - "4d37e4aeeb",
  - "Cruise",
  - "wmere",
  - 0.614,
  - 0.704,
  - 0.454,
  - 0.559,
  - "2025-09-29T08:06:59",
  - ""
  ],
- [
  - "858c964f59",
  - "Nobelist",
  - "pkuHaowei",
  - 0.592,
  - 0.32,
  - 0.511,
  - 0.533,
  - "2025-10-27T10:03:55",
  - "revert-birth"
  ],
- [
  - "376e97c0a0",
  - "Nobelist",
  - "pkuHaowei",
  - 0.592,
  - 0.32,
  - 0.511,
  - 0.533,
  - "2025-10-23T18:57:01",
  - "strategy balance"
  ],
- [
  - "ceffc01ac9",
  - "Nobelist",
  - "pkuHaowei",
  - 0.534,
  - 0.652,
  - 0.497,
  - 0.531,
  - "2025-10-23T18:36:45",
  - ""
  ],
- [
  - "a5f06ca4b2",
  - "Episteme",
  - "1OOl",
  - 0.77,
  - 0.781,
  - 0.155,
  - 0.525,
  - "2025-11-03T11:44:07",
  - "exp_013"
  ],
- [
  - "9f9b33f7c8",
  - "Episteme",
  - "1OOl",
  - 0.567,
  - 0.781,
  - 0.342,
  - 0.498,
  - "2025-10-20T22:20:17",
  - "exp008"
  ],
- [
  - "a45b7fcdc9",
  - "Episteme",
  - "1OOl",
  - 0.567,
  - 0.781,
  - 0.342,
  - 0.498,
  - "2025-10-20T21:59:36",
  - "exp007"
  ],
- [
  - "fc5dfbf369",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.52,
  - 0.709,
  - 0.302,
  - 0.452,
  - "2025-10-31T22:03:51",
  - "0021"
  ],
- [
  - "63211db778",
  - "turingwaltz",
  - "yuntaoyulong",
  - 0.405,
  - 0.632,
  - 0.365,
  - 0.411,
  - "2025-11-02T04:30:51",
  - "mmlu_minimal_improved"
  ],
- [
  - "129b14e635",
  - "Scitix",
  - "Lie24",
  - 0.482,
  - 0.449,
  - 0.185,
  - 0.36,
  - "2025-11-03T07:39:13",
  - "2v"
  ],
- [
  - "63bf359ae7",
  - "Episteme",
  - "1OOl",
  - 0.528,
  - 0.76,
  - 0.048,
  - 0.359,
  - "2025-10-27T00:01:21",
  - "exp005_2"
  ],
- [
  - "7fd6d50229",
  - "Scitix",
  - "Lie24",
  - 0.473,
  - 0.477,
  - 0.181,
  - 0.356,
  - "2025-11-03T07:40:10",
  - "5v"
  ],
- [
  - "60c6942c7b",
  - "Scitix",
  - "Lie24",
  - 0.471,
  - 0.471,
  - 0.165,
  - 0.349,
  - "2025-10-20T11:13:55",
  - "3"
  ],
- [
  - "b74f0486fd",
  - "Scitix",
  - "Lie24",
  - 0.471,
  - 0.471,
  - 0.165,
  - 0.349,
  - "2025-10-20T11:13:25",
  - "2"
  ],
- [
  - "acce8d8af8",
  - "ShAIkespear",
  - "ESmike",
  - 0.399,
  - 0.715,
  - 0.194,
  - 0.348,
  - "2025-10-16T17:24:28",
  - "0006"
  ],
- [
  - "7ad850b801",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.205,
  - 0.733,
  - 0.428,
  - 0.347,
  - "2025-11-02T19:51:12",
  - "0020"
  ],
- [
  - "9f16d1815e",
  - "Scitix",
  - "Lie24",
  - 0.466,
  - 0.493,
  - 0.161,
  - 0.347,
  - "2025-11-03T07:41:38",
  - "7v"
  ],
- [
  - "fa560b5067",
  - "Scitix",
  - "Lie24",
  - 0.473,
  - 0.456,
  - 0.16,
  - 0.346,
  - "2025-11-03T07:39:31",
  - "3v"
  ],
- [
  - "807d15f322",
  - "Scitix",
  - "Lie24",
  - 0.469,
  - 0.47,
  - 0.161,
  - 0.346,
  - "2025-11-03T07:41:57",
  - "8v"
  ],
- [
  - "f9a215d8bd",
  - "Scitix",
  - "Lie24",
  - 0.456,
  - 0.464,
  - 0.171,
  - 0.343,
  - "2025-11-03T07:39:53",
  - "4v"
  ],
- [
  - "373f58a858",
  - "Scitix",
  - "Lie24",
  - 0.453,
  - 0.455,
  - 0.138,
  - 0.327,
  - "2025-11-03T07:42:52",
  - "6v."
  ],
- [
  - "bff4cf1ff9",
  - "Scitix",
  - "Lie24",
  - 0.29,
  - 0.622,
  - 0.271,
  - 0.316,
  - "2025-10-16T12:08:59",
  - "3"
  ],
- [
  - "3aa0479431",
  - "Episteme",
  - "1OOl",
  - 0.414,
  - 0.821,
  - 0.041,
  - 0.305,
  - "2025-11-02T14:33:50",
  - "exp_011"
  ],
- [
  - "e89bebb3e8",
  - "Episteme",
  - "1OOl",
  - 0.414,
  - 0.821,
  - 0.041,
  - 0.305,
  - "2025-11-03T11:54:51",
  - "exp_016"
  ],
- [
  - "5845c5c8be",
  - "morai",
  - "giovanivaldrighi",
  - 0.265,
  - 0.722,
  - 0.236,
  - 0.299,
  - "2025-08-22T11:53:41",
  - "Task focused in STEM topics for MMLU using prompt engineering."
  ],
- [
  - "8466489472",
  - "morai",
  - "giovanivaldrighi",
  - 0.428,
  - 0.681,
  - 0,
  - 0.282,
  - "2025-11-03T11:52:49",
  - "mmlu_v24"
  ],
- [
  - "c3017d1ddf",
  - "thu-let_it_be",
  - "jiangyi233",
  - 0.182,
  - 0.555,
  - 0.286,
  - 0.261,
  - "2025-10-24T03:26:23",
  - "100(2)"
  ],
- [
  - "12bb4d3648",
  - "thu-let_it_be",
  - "jiangyi233",
  - 0.182,
  - 0.555,
  - 0.286,
  - 0.261,
  - "2025-10-24T03:24:44",
  - "100(1)"
  ],
- [
  - "319b1a3a3a",
  - "thu-let_it_be",
  - "jiangyi233",
  - 0.182,
  - 0.555,
  - 0.286,
  - 0.261,
  - "2025-10-24T03:26:30",
  - "100(2)"
  ],
- [
  - "0043c067ca",
  - "Episteme",
  - "1OOl",
  - 0.372,
  - 0.615,
  - 0,
  - 0.247,
  - "2025-11-03T11:47:19",
  - "exp_014"
  ],
- [
  - "3c4c5eac04",
  - "thu-let_it_be",
  - "jiangyi233",
  - 0.173,
  - 0.546,
  - 0.262,
  - 0.246,
  - "2025-10-26T15:53:34",
  - "1026-1400"
  ],
- [
  - "de42eead33",
  - "test_ssn",
  - "sunshaoning",
  - 0.297,
  - 0.475,
  - 0.121,
  - 0.244,
  - "2025-10-30T14:43:55",
  - "v0.2"
  ],
- [
  - "6ea21350e8",
  - "Episteme",
  - "1OOl",
  - 0.305,
  - 0.667,
  - 0.057,
  - 0.242,
  - "2025-10-19T20:15:04",
  - "exp002"
  ],
- [
  - "11619a9444",
  - "ShAIkespear",
  - "DaGrapix",
  - 0.386,
  - 0.477,
  - 0,
  - 0.241,
  - "2025-09-19T15:12:13",
  - "MMLU_var new"
  ],
- [
  - "ac626583f5",
  - "test_ssn",
  - "sunshaoning",
  - 0.309,
  - 0.368,
  - 0.107,
  - 0.234,
  - "2025-10-30T14:34:58",
  - "v0.1"
  ],
- [
  - "1f958a06fd",
  - "Scitix",
  - "Lie24",
  - 0.308,
  - 0.409,
  - 0.066,
  - 0.221,
  - "2025-10-27T09:20:01",
  - "v3"
  ],
- [
  - "c619560da1",
  - "Episteme",
  - "1OOl",
  - 0.321,
  - 0.552,
  - 0,
  - 0.215,
  - "2025-10-20T21:55:19",
  - "exp006"
  ],
- [
  - "204f0e6933",
  - "Scitix",
  - "Lie24",
  - 0.192,
  - 0.554,
  - 0.137,
  - 0.206,
  - "2025-10-29T07:10:00",
  - "new3"
  ],
- [
  - "75fd1f2685",
  - "42",
  - "0x-YuAN",
  - 0.275,
  - 0.591,
  - 0,
  - 0.197,
  - "2025-11-02T16:00:02",
  - "Science Exam"
  ],
- [
  - "6704ad55de",
  - "test_ssn",
  - "sunshaoning",
  - 0.247,
  - 0.421,
  - 0.005,
  - 0.167,
  - "2025-11-01T18:00:05",
  - "v0.13"
  ],
- [
  - "dbea44406e",
  - "test_ssn",
  - "sunshaoning",
  - 0.247,
  - 0.421,
  - 0.005,
  - 0.167,
  - "2025-11-01T14:51:03",
  - "v0.10"
  ],
- [
  - "62340a0770",
  - "test_ssn",
  - "sunshaoning",
  - 0.247,
  - 0.421,
  - 0.005,
  - 0.167,
  - "2025-11-01T09:23:01",
  - "v0.5"
  ],
- [
  - "22fb4b9aa6",
  - "ShAIkespear",
  - "ESmike",
  - 0.162,
  - 0.488,
  - 0.071,
  - 0.158,
  - "2025-09-10T19:25:19",
  - "Second Test"
  ],
- [
  - "a4e2aeec5d",
  - "ShAIkespear",
  - "ESmike",
  - 0.15,
  - 0.459,
  - 0.055,
  - 0.143,
  - "2025-10-23T09:40:03",
  - "0012"
  ],
- [
  - "f5fc077255",
  - "test_ssn",
  - "sunshaoning",
  - 0.159,
  - 0.372,
  - 0.005,
  - 0.119,
  - "2025-11-02T09:52:06",
  - "v0.6.2"
  ],
- [
  - "848dd474e6",
  - "test_ssn",
  - "sunshaoning",
  - 0.097,
  - 0.554,
  - 0,
  - 0.104,
  - "2025-11-01T17:47:12",
  - "v0.11"
  ]
],
"metadata": null

}