Muennighoff commited on Sep 18, 2022

Commit

aa91968

1 Parent(s): 41063e3

Add MTEB eval

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

{eval → evaluation/beir}/beir.json +0 -0
evaluation/mteb/AmazonCounterfactualClassification.json +16 -0
evaluation/mteb/AmazonPolarityClassification.json +14 -0
evaluation/mteb/AmazonReviewsClassification.json +14 -0
evaluation/mteb/ArguAna.json +37 -0
evaluation/mteb/ArxivClusteringP2P.json +9 -0
evaluation/mteb/ArxivClusteringS2S.json +9 -0
evaluation/mteb/AskUbuntuDupQuestions.json +9 -0
evaluation/mteb/BIOSSES.json +19 -0
evaluation/mteb/Banking77Classification.json +12 -0
evaluation/mteb/BiorxivClusteringP2P.json +9 -0
evaluation/mteb/BiorxivClusteringS2S.json +9 -0
evaluation/mteb/CQADupstackAndroidRetrieval.json +37 -0
evaluation/mteb/CQADupstackEnglishRetrieval.json +37 -0
evaluation/mteb/CQADupstackGamingRetrieval.json +37 -0
evaluation/mteb/CQADupstackGisRetrieval.json +37 -0
evaluation/mteb/CQADupstackMathematicaRetrieval.json +37 -0
evaluation/mteb/CQADupstackPhysicsRetrieval.json +37 -0
evaluation/mteb/CQADupstackProgrammersRetrieval.json +37 -0
evaluation/mteb/CQADupstackRetrieval.json +1 -0
evaluation/mteb/CQADupstackStatsRetrieval.json +37 -0
evaluation/mteb/CQADupstackTexRetrieval.json +37 -0
evaluation/mteb/CQADupstackUnixRetrieval.json +37 -0
evaluation/mteb/CQADupstackWebmastersRetrieval.json +37 -0
evaluation/mteb/CQADupstackWordpressRetrieval.json +37 -0
evaluation/mteb/ClimateFEVER.json +37 -0
evaluation/mteb/DBPedia.json +37 -0
evaluation/mteb/EmotionClassification.json +12 -0
evaluation/mteb/FEVER.json +37 -0
evaluation/mteb/FiQA2018.json +37 -0
evaluation/mteb/HotpotQA.json +37 -0
evaluation/mteb/ImdbClassification.json +14 -0
evaluation/mteb/MSMARCO.json +37 -0
evaluation/mteb/MTOPDomainClassification.json +14 -0
evaluation/mteb/MTOPIntentClassification.json +14 -0
evaluation/mteb/MassiveIntentClassification.json +14 -0
evaluation/mteb/MassiveScenarioClassification.json +14 -0
evaluation/mteb/MedrxivClusteringP2P.json +9 -0
evaluation/mteb/MedrxivClusteringS2S.json +9 -0
evaluation/mteb/NFCorpus.json +37 -0
evaluation/mteb/NQ.json +37 -0
evaluation/mteb/QuoraRetrieval.json +37 -0
evaluation/mteb/RedditClustering.json +9 -0
evaluation/mteb/RedditClusteringP2P.json +9 -0
evaluation/mteb/SCIDOCS.json +37 -0
evaluation/mteb/SGPT-2.7B-weightedmean-msmarco-specb-bitfit_results.csv +354 -0
evaluation/mteb/SICK-R.json +19 -0
evaluation/mteb/STS12.json +19 -0
evaluation/mteb/STS13.json +19 -0
evaluation/mteb/STS14.json +19 -0

{eval → evaluation/beir}/beir.json RENAMED Viewed

File without changes

evaluation/mteb/AmazonCounterfactualClassification.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.6756716417910448,
+      "accuracy_stderr": 0.035149491395717075,
+      "ap": 0.3075574629595259,
+      "ap_stderr": 0.022378514563472136,
+      "f1": 0.6180512130185866,
+      "f1_stderr": 0.027752667739340424,
+      "main_score": 0.6756716417910448
+    },
+    "evaluation_time": 33.75
+  }
+}

evaluation/mteb/AmazonPolarityClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.71439575,
+    "accuracy_stderr": 0.04118535930779893,
+    "ap": 0.6591341330532453,
+    "ap_stderr": 0.039567766080541335,
+    "evaluation_time": 15193.17,
+    "f1": 0.7090561852619555,
+    "f1_stderr": 0.04610604328985526,
+    "main_score": 0.71439575
+  }
+}

evaluation/mteb/AmazonReviewsClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.35748,
+      "accuracy_stderr": 0.017313624692709504,
+      "f1": 0.35485762871863474,
+      "f1_stderr": 0.016676501915976406,
+      "main_score": 0.35748
+    },
+    "evaluation_time": 125.24
+  }
+}

evaluation/mteb/ArguAna.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 254.16,
+    "map_at_1": 0.2596,
+    "map_at_10": 0.41619,
+    "map_at_100": 0.42673,
+    "map_at_1000": 0.42684,
+    "map_at_3": 0.36569,
+    "map_at_5": 0.39397,
+    "mrr_at_1": 0.26316,
+    "mrr_at_10": 0.41772,
+    "mrr_at_100": 0.4282,
+    "mrr_at_1000": 0.4283,
+    "mrr_at_3": 0.36724,
+    "mrr_at_5": 0.39529,
+    "ndcg_at_1": 0.2596,
+    "ndcg_at_10": 0.50491,
+    "ndcg_at_100": 0.54865,
+    "ndcg_at_1000": 0.55107,
+    "ndcg_at_3": 0.40053,
+    "ndcg_at_5": 0.45134,
+    "precision_at_1": 0.2596,
+    "precision_at_10": 0.07895,
+    "precision_at_100": 0.00978,
+    "precision_at_1000": 0.001,
+    "precision_at_3": 0.16714,
+    "precision_at_5": 0.12489,
+    "recall_at_1": 0.2596,
+    "recall_at_10": 0.78947,
+    "recall_at_100": 0.97795,
+    "recall_at_1000": 0.99644,
+    "recall_at_3": 0.50142,
+    "recall_at_5": 0.62447
+  }
+}

evaluation/mteb/ArxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 57365.88,
+    "v_measure": 0.44721257146422017,
+    "v_measure_std": 0.135218958073186
+  }
+}

evaluation/mteb/ArxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 6983.79,
+    "v_measure": 0.35081451519142065,
+    "v_measure_std": 0.14064701566219873
+  }
+}

evaluation/mteb/AskUbuntuDupQuestions.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 56.03,
+    "map": 0.5963466199039206,
+    "mrr": 0.736813525040672
+  }
+}

evaluation/mteb/BIOSSES.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.8742754550496836,
+      "spearman": 0.8484289705838665
+    },
+    "euclidean": {
+      "pearson": 0.8559331970450859,
+      "spearman": 0.858525586184271
+    },
+    "evaluation_time": 6.0,
+    "manhattan": {
+      "pearson": 0.8541233134466698,
+      "spearman": 0.8552303303767403
+    }
+  }
+}

evaluation/mteb/Banking77Classification.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.8321753246753246,
+    "accuracy_stderr": 0.008047037149251285,
+    "evaluation_time": 109.45,
+    "f1": 0.8315394543120915,
+    "f1_stderr": 0.008443343664861741,
+    "main_score": 0.8321753246753246
+  }
+}

evaluation/mteb/BiorxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 6657.01,
+    "v_measure": 0.3441414219680629,
+    "v_measure_std": 0.010243021348181702
+  }
+}

evaluation/mteb/BiorxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 843.62,
+    "v_measure": 0.30533275862270026,
+    "v_measure_std": 0.011135486000086606
+  }
+}

evaluation/mteb/CQADupstackAndroidRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1118.91,
+    "map_at_1": 0.30809,
+    "map_at_10": 0.40617,
+    "map_at_100": 0.41895,
+    "map_at_1000": 0.42025,
+    "map_at_3": 0.37,
+    "map_at_5": 0.38993,
+    "mrr_at_1": 0.37482,
+    "mrr_at_10": 0.46497,
+    "mrr_at_100": 0.47144,
+    "mrr_at_1000": 0.47189,
+    "mrr_at_3": 0.43705,
+    "mrr_at_5": 0.45193,
+    "ndcg_at_1": 0.37482,
+    "ndcg_at_10": 0.46688,
+    "ndcg_at_100": 0.51726,
+    "ndcg_at_1000": 0.53825,
+    "ndcg_at_3": 0.41242,
+    "ndcg_at_5": 0.43657,
+    "precision_at_1": 0.37482,
+    "precision_at_10": 0.08827,
+    "precision_at_100": 0.01393,
+    "precision_at_1000": 0.00186,
+    "precision_at_3": 0.19361,
+    "precision_at_5": 0.14106,
+    "recall_at_1": 0.30809,
+    "recall_at_10": 0.5847,
+    "recall_at_100": 0.80519,
+    "recall_at_1000": 0.93809,
+    "recall_at_3": 0.42462,
+    "recall_at_5": 0.49385
+  }
+}

evaluation/mteb/CQADupstackEnglishRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1732.23,
+    "map_at_1": 0.26962,
+    "map_at_10": 0.3693,
+    "map_at_100": 0.38102,
+    "map_at_1000": 0.3822,
+    "map_at_3": 0.34065,
+    "map_at_5": 0.3572,
+    "mrr_at_1": 0.33567,
+    "mrr_at_10": 0.42269,
+    "mrr_at_100": 0.4299,
+    "mrr_at_1000": 0.43033,
+    "mrr_at_3": 0.40064,
+    "mrr_at_5": 0.41258,
+    "ndcg_at_1": 0.33567,
+    "ndcg_at_10": 0.42405,
+    "ndcg_at_100": 0.46847,
+    "ndcg_at_1000": 0.48951,
+    "ndcg_at_3": 0.38312,
+    "ndcg_at_5": 0.40242,
+    "precision_at_1": 0.33567,
+    "precision_at_10": 0.08032,
+    "precision_at_100": 0.01295,
+    "precision_at_1000": 0.00176,
+    "precision_at_3": 0.18662,
+    "precision_at_5": 0.13299,
+    "recall_at_1": 0.26962,
+    "recall_at_10": 0.52489,
+    "recall_at_100": 0.71635,
+    "recall_at_1000": 0.85141,
+    "recall_at_3": 0.4028,
+    "recall_at_5": 0.45757
+  }
+}

evaluation/mteb/CQADupstackGamingRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1830.25,
+    "map_at_1": 0.36318,
+    "map_at_10": 0.4797,
+    "map_at_100": 0.49003,
+    "map_at_1000": 0.49066,
+    "map_at_3": 0.45031,
+    "map_at_5": 0.46633,
+    "mrr_at_1": 0.41505,
+    "mrr_at_10": 0.51431,
+    "mrr_at_100": 0.52129,
+    "mrr_at_1000": 0.52161,
+    "mrr_at_3": 0.48934,
+    "mrr_at_5": 0.5042,
+    "ndcg_at_1": 0.41505,
+    "ndcg_at_10": 0.53676,
+    "ndcg_at_100": 0.57867,
+    "ndcg_at_1000": 0.59166,
+    "ndcg_at_3": 0.48516,
+    "ndcg_at_5": 0.50984,
+    "precision_at_1": 0.41505,
+    "precision_at_10": 0.08608,
+    "precision_at_100": 0.01156,
+    "precision_at_1000": 0.00133,
+    "precision_at_3": 0.21463,
+    "precision_at_5": 0.14721,
+    "recall_at_1": 0.36318,
+    "recall_at_10": 0.67066,
+    "recall_at_100": 0.8534,
+    "recall_at_1000": 0.94491,
+    "recall_at_3": 0.53216,
+    "recall_at_5": 0.59214
+  }
+}

evaluation/mteb/CQADupstackGisRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 2522.93,
+    "map_at_1": 0.22167,
+    "map_at_10": 0.29544,
+    "map_at_100": 0.30579,
+    "map_at_1000": 0.3067,
+    "map_at_3": 0.26982,
+    "map_at_5": 0.28474,
+    "mrr_at_1": 0.24068,
+    "mrr_at_10": 0.31237,
+    "mrr_at_100": 0.32222,
+    "mrr_at_1000": 0.32292,
+    "mrr_at_3": 0.28776,
+    "mrr_at_5": 0.30234,
+    "ndcg_at_1": 0.24068,
+    "ndcg_at_10": 0.33973,
+    "ndcg_at_100": 0.39135,
+    "ndcg_at_1000": 0.41444,
+    "ndcg_at_3": 0.29018,
+    "ndcg_at_5": 0.31559,
+    "precision_at_1": 0.24068,
+    "precision_at_10": 0.05299,
+    "precision_at_100": 0.00823,
+    "precision_at_1000": 0.00106,
+    "precision_at_3": 0.12166,
+    "precision_at_5": 0.08768,
+    "recall_at_1": 0.22167,
+    "recall_at_10": 0.46115,
+    "recall_at_100": 0.69867,
+    "recall_at_1000": 0.87234,
+    "recall_at_3": 0.32798,
+    "recall_at_5": 0.38951
+  }
+}

evaluation/mteb/CQADupstackMathematicaRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1350.85,
+    "map_at_1": 0.12033,
+    "map_at_10": 0.19314,
+    "map_at_100": 0.20562,
+    "map_at_1000": 0.20695,
+    "map_at_3": 0.16946,
+    "map_at_5": 0.18077,
+    "mrr_at_1": 0.14801,
+    "mrr_at_10": 0.2274,
+    "mrr_at_100": 0.23876,
+    "mrr_at_1000": 0.23949,
+    "mrr_at_3": 0.20211,
+    "mrr_at_5": 0.21573,
+    "ndcg_at_1": 0.14801,
+    "ndcg_at_10": 0.24038,
+    "ndcg_at_100": 0.30186,
+    "ndcg_at_1000": 0.33321,
+    "ndcg_at_3": 0.19431,
+    "ndcg_at_5": 0.2134,
+    "precision_at_1": 0.14801,
+    "precision_at_10": 0.04776,
+    "precision_at_100": 0.00897,
+    "precision_at_1000": 0.00133,
+    "precision_at_3": 0.0966,
+    "precision_at_5": 0.07239,
+    "recall_at_1": 0.12033,
+    "recall_at_10": 0.35098,
+    "recall_at_100": 0.62175,
+    "recall_at_1000": 0.84171,
+    "recall_at_3": 0.2261,
+    "recall_at_5": 0.27279
+  }
+}

evaluation/mteb/CQADupstackPhysicsRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 2467.52,
+    "map_at_1": 0.26651,
+    "map_at_10": 0.36901,
+    "map_at_100": 0.38249,
+    "map_at_1000": 0.38361,
+    "map_at_3": 0.33891,
+    "map_at_5": 0.35439,
+    "mrr_at_1": 0.32724,
+    "mrr_at_10": 0.42504,
+    "mrr_at_100": 0.43392,
+    "mrr_at_1000": 0.43436,
+    "mrr_at_3": 0.3999,
+    "mrr_at_5": 0.41347,
+    "ndcg_at_1": 0.32724,
+    "ndcg_at_10": 0.43007,
+    "ndcg_at_100": 0.48601,
+    "ndcg_at_1000": 0.50697,
+    "ndcg_at_3": 0.3799,
+    "ndcg_at_5": 0.40084,
+    "precision_at_1": 0.32724,
+    "precision_at_10": 0.07873,
+    "precision_at_100": 0.01247,
+    "precision_at_1000": 0.00162,
+    "precision_at_3": 0.18062,
+    "precision_at_5": 0.12666,
+    "recall_at_1": 0.26651,
+    "recall_at_10": 0.55674,
+    "recall_at_100": 0.78904,
+    "recall_at_1000": 0.92558,
+    "recall_at_3": 0.4136,
+    "recall_at_5": 0.46984
+  }
+}

evaluation/mteb/CQADupstackProgrammersRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 2301.71,
+    "map_at_1": 0.22589,
+    "map_at_10": 0.32244,
+    "map_at_100": 0.3346,
+    "map_at_1000": 0.33593,
+    "map_at_3": 0.2921,
+    "map_at_5": 0.3102,
+    "mrr_at_1": 0.28425,
+    "mrr_at_10": 0.37282,
+    "mrr_at_100": 0.38187,
+    "mrr_at_1000": 0.38248,
+    "mrr_at_3": 0.34684,
+    "mrr_at_5": 0.36123,
+    "ndcg_at_1": 0.28425,
+    "ndcg_at_10": 0.37942,
+    "ndcg_at_100": 0.43443,
+    "ndcg_at_1000": 0.45996,
+    "ndcg_at_3": 0.32874,
+    "ndcg_at_5": 0.35325,
+    "precision_at_1": 0.28425,
+    "precision_at_10": 0.071,
+    "precision_at_100": 0.01166,
+    "precision_at_1000": 0.00158,
+    "precision_at_3": 0.1602,
+    "precision_at_5": 0.11644,
+    "recall_at_1": 0.22589,
+    "recall_at_10": 0.5004,
+    "recall_at_100": 0.73973,
+    "recall_at_1000": 0.91128,
+    "recall_at_3": 0.35883,
+    "recall_at_5": 0.42188
+  }
+}

evaluation/mteb/CQADupstackRetrieval.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"dataset_version": null, "mteb_version": "0.0.2", "test": {"evaluation_time": 3522.66, "map_at_1": 0.23190833333333336, "map_at_10": 0.31504916666666666, "map_at_100": 0.32649083333333334, "map_at_1000": 0.3277075, "map_at_3": 0.2882575, "map_at_5": 0.302755, "mrr_at_1": 0.27427499999999994, "mrr_at_10": 0.35364833333333334, "mrr_at_100": 0.36234416666666663, "mrr_at_1000": 0.36297583333333333, "mrr_at_3": 0.3297966666666667, "mrr_at_5": 0.34294583333333334, "ndcg_at_1": 0.27427499999999994, "ndcg_at_10": 0.3653358333333333, "ndcg_at_100": 0.4164508333333333, "ndcg_at_1000": 0.4414499999999999, "ndcg_at_3": 0.3188908333333333, "ndcg_at_5": 0.33984333333333333, "precision_at_1": 0.27427499999999994, "precision_at_10": 0.06481083333333333, "precision_at_100": 0.010610833333333333, "precision_at_1000": 0.0014691666666666666, "precision_at_3": 0.1465675, "precision_at_5": 0.10493583333333333, "recall_at_1": 0.23190833333333336, "recall_at_10": 0.4765175, "recall_at_100": 0.7041016666666666, "recall_at_1000": 0.8782708333333332, "recall_at_3": 0.34637583333333327, "recall_at_5": 0.4005008333333333}}

evaluation/mteb/CQADupstackStatsRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3154.61,
+    "map_at_1": 0.20409,
+    "map_at_10": 0.26794,
+    "map_at_100": 0.27682,
+    "map_at_1000": 0.27783,
+    "map_at_3": 0.24461,
+    "map_at_5": 0.25668,
+    "mrr_at_1": 0.22853,
+    "mrr_at_10": 0.29296,
+    "mrr_at_100": 0.30103,
+    "mrr_at_1000": 0.30179,
+    "mrr_at_3": 0.27173,
+    "mrr_at_5": 0.28223,
+    "ndcg_at_1": 0.22853,
+    "ndcg_at_10": 0.31007,
+    "ndcg_at_100": 0.35581,
+    "ndcg_at_1000": 0.38147,
+    "ndcg_at_3": 0.26591,
+    "ndcg_at_5": 0.2843,
+    "precision_at_1": 0.22853,
+    "precision_at_10": 0.05031,
+    "precision_at_100": 0.00794,
+    "precision_at_1000": 0.0011,
+    "precision_at_3": 0.11401,
+    "precision_at_5": 0.0816,
+    "recall_at_1": 0.20409,
+    "recall_at_10": 0.41766,
+    "recall_at_100": 0.62964,
+    "recall_at_1000": 0.81682,
+    "recall_at_3": 0.29281,
+    "recall_at_5": 0.3383
+  }
+}

evaluation/mteb/CQADupstackTexRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 5341.04,
+    "map_at_1": 0.14549,
+    "map_at_10": 0.20315,
+    "map_at_100": 0.21301,
+    "map_at_1000": 0.21425,
+    "map_at_3": 0.18132,
+    "map_at_5": 0.19429,
+    "mrr_at_1": 0.1786,
+    "mrr_at_10": 0.23861,
+    "mrr_at_100": 0.24737,
+    "mrr_at_1000": 0.2482,
+    "mrr_at_3": 0.21685,
+    "mrr_at_5": 0.23008,
+    "ndcg_at_1": 0.1786,
+    "ndcg_at_10": 0.24396,
+    "ndcg_at_100": 0.29328,
+    "ndcg_at_1000": 0.32486,
+    "ndcg_at_3": 0.20375,
+    "ndcg_at_5": 0.22411,
+    "precision_at_1": 0.1786,
+    "precision_at_10": 0.0447,
+    "precision_at_100": 0.0081,
+    "precision_at_1000": 0.00125,
+    "precision_at_3": 0.09475,
+    "precision_at_5": 0.07171,
+    "recall_at_1": 0.14549,
+    "recall_at_10": 0.33365,
+    "recall_at_100": 0.55797,
+    "recall_at_1000": 0.78632,
+    "recall_at_3": 0.22229,
+    "recall_at_5": 0.27339
+  }
+}

evaluation/mteb/CQADupstackUnixRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3320.59,
+    "map_at_1": 0.23286,
+    "map_at_10": 0.30728,
+    "map_at_100": 0.3184,
+    "map_at_1000": 0.31953,
+    "map_at_3": 0.28302,
+    "map_at_5": 0.29615,
+    "mrr_at_1": 0.27239,
+    "mrr_at_10": 0.34408,
+    "mrr_at_100": 0.35335,
+    "mrr_at_1000": 0.35405,
+    "mrr_at_3": 0.32152,
+    "mrr_at_5": 0.33355,
+    "ndcg_at_1": 0.27239,
+    "ndcg_at_10": 0.35324,
+    "ndcg_at_100": 0.40866,
+    "ndcg_at_1000": 0.43584,
+    "ndcg_at_3": 0.30899,
+    "ndcg_at_5": 0.32813,
+    "precision_at_1": 0.27239,
+    "precision_at_10": 0.05896,
+    "precision_at_100": 0.00979,
+    "precision_at_1000": 0.00133,
+    "precision_at_3": 0.13713,
+    "precision_at_5": 0.09683,
+    "recall_at_1": 0.23286,
+    "recall_at_10": 0.45711,
+    "recall_at_100": 0.70611,
+    "recall_at_1000": 0.90029,
+    "recall_at_3": 0.33615,
+    "recall_at_5": 0.3841
+  }
+}

evaluation/mteb/CQADupstackWebmastersRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1047.0,
+    "map_at_1": 0.23962,
+    "map_at_10": 0.31943,
+    "map_at_100": 0.33384,
+    "map_at_1000": 0.33611,
+    "map_at_3": 0.29243,
+    "map_at_5": 0.30446,
+    "mrr_at_1": 0.28458,
+    "mrr_at_10": 0.36157,
+    "mrr_at_100": 0.37093,
+    "mrr_at_1000": 0.37163,
+    "mrr_at_3": 0.3386,
+    "mrr_at_5": 0.35086,
+    "ndcg_at_1": 0.28458,
+    "ndcg_at_10": 0.37201,
+    "ndcg_at_100": 0.42591,
+    "ndcg_at_1000": 0.45539,
+    "ndcg_at_3": 0.32889,
+    "ndcg_at_5": 0.34483,
+    "precision_at_1": 0.28458,
+    "precision_at_10": 0.07332,
+    "precision_at_100": 0.01437,
+    "precision_at_1000": 0.00233,
+    "precision_at_3": 0.15547,
+    "precision_at_5": 0.11146,
+    "recall_at_1": 0.23962,
+    "recall_at_10": 0.46751,
+    "recall_at_100": 0.71626,
+    "recall_at_1000": 0.90939,
+    "recall_at_3": 0.34138,
+    "recall_at_5": 0.38673
+  }
+}

evaluation/mteb/CQADupstackWordpressRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3522.66,
+    "map_at_1": 0.18555,
+    "map_at_10": 0.24759,
+    "map_at_100": 0.25732,
+    "map_at_1000": 0.25847,
+    "map_at_3": 0.22646,
+    "map_at_5": 0.23792,
+    "mrr_at_1": 0.20148,
+    "mrr_at_10": 0.26696,
+    "mrr_at_100": 0.27605,
+    "mrr_at_1000": 0.27696,
+    "mrr_at_3": 0.24522,
+    "mrr_at_5": 0.25715,
+    "ndcg_at_1": 0.20148,
+    "ndcg_at_10": 0.28746,
+    "ndcg_at_100": 0.3357,
+    "ndcg_at_1000": 0.36584,
+    "ndcg_at_3": 0.24532,
+    "ndcg_at_5": 0.26484,
+    "precision_at_1": 0.20148,
+    "precision_at_10": 0.04529,
+    "precision_at_100": 0.00736,
+    "precision_at_1000": 0.00108,
+    "precision_at_3": 0.10351,
+    "precision_at_5": 0.0732,
+    "recall_at_1": 0.18555,
+    "recall_at_10": 0.39276,
+    "recall_at_100": 0.61511,
+    "recall_at_1000": 0.84111,
+    "recall_at_3": 0.27779,
+    "recall_at_5": 0.32591
+  }
+}

evaluation/mteb/ClimateFEVER.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 30738.76,
+    "map_at_1": 0.10367,
+    "map_at_10": 0.18954,
+    "map_at_100": 0.20675,
+    "map_at_1000": 0.20868,
+    "map_at_3": 0.15486,
+    "map_at_5": 0.17347,
+    "mrr_at_1": 0.23257,
+    "mrr_at_10": 0.35419,
+    "mrr_at_100": 0.36361,
+    "mrr_at_1000": 0.36403,
+    "mrr_at_3": 0.31748,
+    "mrr_at_5": 0.34077,
+    "ndcg_at_1": 0.23257,
+    "ndcg_at_10": 0.2711,
+    "ndcg_at_100": 0.33981,
+    "ndcg_at_1000": 0.37444,
+    "ndcg_at_3": 0.21472,
+    "ndcg_at_5": 0.23769,
+    "precision_at_1": 0.23257,
+    "precision_at_10": 0.08704,
+    "precision_at_100": 0.01606,
+    "precision_at_1000": 0.00225,
+    "precision_at_3": 0.16287,
+    "precision_at_5": 0.13068,
+    "recall_at_1": 0.10367,
+    "recall_at_10": 0.33706,
+    "recall_at_100": 0.57375,
+    "recall_at_1000": 0.7679,
+    "recall_at_3": 0.2018,
+    "recall_at_5": 0.26215
+  }
+}

evaluation/mteb/DBPedia.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 21716.72,
+    "map_at_1": 0.08246,
+    "map_at_10": 0.15979,
+    "map_at_100": 0.21025,
+    "map_at_1000": 0.2219,
+    "map_at_3": 0.11997,
+    "map_at_5": 0.13697,
+    "mrr_at_1": 0.6075,
+    "mrr_at_10": 0.68701,
+    "mrr_at_100": 0.691,
+    "mrr_at_1000": 0.69111,
+    "mrr_at_3": 0.66583,
+    "mrr_at_5": 0.67871,
+    "ndcg_at_1": 0.4975,
+    "ndcg_at_10": 0.34702,
+    "ndcg_at_100": 0.37607,
+    "ndcg_at_1000": 0.44322,
+    "ndcg_at_3": 0.39555,
+    "ndcg_at_5": 0.36684,
+    "precision_at_1": 0.6075,
+    "precision_at_10": 0.26625,
+    "precision_at_100": 0.0797,
+    "precision_at_1000": 0.01678,
+    "precision_at_3": 0.41833,
+    "precision_at_5": 0.345,
+    "recall_at_1": 0.08246,
+    "recall_at_10": 0.20968,
+    "recall_at_100": 0.42065,
+    "recall_at_1000": 0.63671,
+    "recall_at_3": 0.13039,
+    "recall_at_5": 0.16042
+  }
+}

evaluation/mteb/EmotionClassification.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.49215,
+    "accuracy_stderr": 0.0188680285138644,
+    "evaluation_time": 46.17,
+    "f1": 0.44859524511637555,
+    "f1_stderr": 0.012754862698341127,
+    "main_score": 0.49215
+  }
+}

evaluation/mteb/FEVER.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 32873.8,
+    "map_at_1": 0.56769,
+    "map_at_10": 0.67302,
+    "map_at_100": 0.67692,
+    "map_at_1000": 0.67712,
+    "map_at_3": 0.65346,
+    "map_at_5": 0.66574,
+    "mrr_at_1": 0.61371,
+    "mrr_at_10": 0.71875,
+    "mrr_at_100": 0.72195,
+    "mrr_at_1000": 0.72206,
+    "mrr_at_3": 0.7004,
+    "mrr_at_5": 0.71224,
+    "ndcg_at_1": 0.61371,
+    "ndcg_at_10": 0.72731,
+    "ndcg_at_100": 0.74468,
+    "ndcg_at_1000": 0.74916,
+    "ndcg_at_3": 0.69077,
+    "ndcg_at_5": 0.71111,
+    "precision_at_1": 0.61371,
+    "precision_at_10": 0.09326,
+    "precision_at_100": 0.0103,
+    "precision_at_1000": 0.00108,
+    "precision_at_3": 0.27303,
+    "precision_at_5": 0.17525,
+    "recall_at_1": 0.56769,
+    "recall_at_10": 0.8506,
+    "recall_at_100": 0.92767,
+    "recall_at_1000": 0.95933,
+    "recall_at_3": 0.75131,
+    "recall_at_5": 0.8017
+  }
+}

evaluation/mteb/FiQA2018.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 506.29,
+    "map_at_1": 0.15753,
+    "map_at_10": 0.25876,
+    "map_at_100": 0.27415,
+    "map_at_1000": 0.27591,
+    "map_at_3": 0.2217,
+    "map_at_5": 0.24236,
+    "mrr_at_1": 0.31019,
+    "mrr_at_10": 0.39977,
+    "mrr_at_100": 0.40789,
+    "mrr_at_1000": 0.40832,
+    "mrr_at_3": 0.37088,
+    "mrr_at_5": 0.38655,
+    "ndcg_at_1": 0.31019,
+    "ndcg_at_10": 0.33286,
+    "ndcg_at_100": 0.39529,
+    "ndcg_at_1000": 0.42934,
+    "ndcg_at_3": 0.2929,
+    "ndcg_at_5": 0.30615,
+    "precision_at_1": 0.31019,
+    "precision_at_10": 0.09383,
+    "precision_at_100": 0.01602,
+    "precision_at_1000": 0.00222,
+    "precision_at_3": 0.19753,
+    "precision_at_5": 0.14815,
+    "recall_at_1": 0.15753,
+    "recall_at_10": 0.40896,
+    "recall_at_100": 0.64443,
+    "recall_at_1000": 0.85218,
+    "recall_at_3": 0.26526,
+    "recall_at_5": 0.32453
+  }
+}

evaluation/mteb/HotpotQA.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 24496.84,
+    "map_at_1": 0.32154,
+    "map_at_10": 0.43651,
+    "map_at_100": 0.4441,
+    "map_at_1000": 0.44487,
+    "map_at_3": 0.41239,
+    "map_at_5": 0.42659,
+    "mrr_at_1": 0.64308,
+    "mrr_at_10": 0.71225,
+    "mrr_at_100": 0.7157,
+    "mrr_at_1000": 0.71591,
+    "mrr_at_3": 0.6995,
+    "mrr_at_5": 0.70738,
+    "ndcg_at_1": 0.64308,
+    "ndcg_at_10": 0.52835,
+    "ndcg_at_100": 0.55841,
+    "ndcg_at_1000": 0.57484,
+    "ndcg_at_3": 0.49014,
+    "ndcg_at_5": 0.51016,
+    "precision_at_1": 0.64308,
+    "precision_at_10": 0.1077,
+    "precision_at_100": 0.01315,
+    "precision_at_1000": 0.00153,
+    "precision_at_3": 0.30223,
+    "precision_at_5": 0.19716,
+    "recall_at_1": 0.32154,
+    "recall_at_10": 0.53849,
+    "recall_at_100": 0.6576,
+    "recall_at_1000": 0.76705,
+    "recall_at_3": 0.45334,
+    "recall_at_5": 0.49291
+  }
+}

evaluation/mteb/ImdbClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "accuracy": 0.635316,
+    "accuracy_stderr": 0.04211004041793359,
+    "ap": 0.5890084300359825,
+    "ap_stderr": 0.03111656030669087,
+    "evaluation_time": 1823.15,
+    "f1": 0.6335727889030892,
+    "f1_stderr": 0.04298181731027657,
+    "main_score": 0.635316
+  }
+}

evaluation/mteb/MSMARCO.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "validation": {
+    "evaluation_time": 43129.71,
+    "map_at_1": 0.20566,
+    "map_at_10": 0.32229,
+    "map_at_100": 0.33445,
+    "map_at_1000": 0.33501,
+    "map_at_3": 0.28504,
+    "map_at_5": 0.30681,
+    "mrr_at_1": 0.21218,
+    "mrr_at_10": 0.32816,
+    "mrr_at_100": 0.33986,
+    "mrr_at_1000": 0.34035,
+    "mrr_at_3": 0.2915,
+    "mrr_at_5": 0.3129,
+    "ndcg_at_1": 0.21218,
+    "ndcg_at_10": 0.38832,
+    "ndcg_at_100": 0.44743,
+    "ndcg_at_1000": 0.46138,
+    "ndcg_at_3": 0.31232,
+    "ndcg_at_5": 0.351,
+    "precision_at_1": 0.21218,
+    "precision_at_10": 0.06186,
+    "precision_at_100": 0.00914,
+    "precision_at_1000": 0.00103,
+    "precision_at_3": 0.13314,
+    "precision_at_5": 0.09943,
+    "recall_at_1": 0.20566,
+    "recall_at_10": 0.59192,
+    "recall_at_100": 0.86626,
+    "recall_at_1000": 0.97283,
+    "recall_at_3": 0.38492,
+    "recall_at_5": 0.4776
+  }
+}

evaluation/mteb/MTOPDomainClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.9256269949840401,
+      "accuracy_stderr": 0.0038850782151341893,
+      "f1": 0.921020975473988,
+      "f1_stderr": 0.0044060167819252195,
+      "main_score": 0.9256269949840401
+    },
+    "evaluation_time": 45.61
+  }
+}

evaluation/mteb/MTOPIntentClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.7184678522571819,
+      "accuracy_stderr": 0.01111163093063421,
+      "f1": 0.5365271934859202,
+      "f1_stderr": 0.010588821247395342,
+      "main_score": 0.7184678522571819
+    },
+    "evaluation_time": 122.63
+  }
+}

evaluation/mteb/MassiveIntentClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.6900806993947546,
+      "accuracy_stderr": 0.012602822825246073,
+      "f1": 0.6741429618885515,
+      "f1_stderr": 0.011707310656187842,
+      "main_score": 0.6900806993947546
+    },
+    "evaluation_time": 72.53
+  }
+}

evaluation/mteb/MassiveScenarioClassification.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "en": {
+      "accuracy": 0.7590114324142568,
+      "accuracy_stderr": 0.010656499030857346,
+      "f1": 0.7625183590651454,
+      "f1_stderr": 0.010649247943952904,
+      "main_score": 0.7590114324142568
+    },
+    "evaluation_time": 41.51
+  }
+}

evaluation/mteb/MedrxivClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 3336.04,
+    "v_measure": 0.31350109978273394,
+    "v_measure_std": 0.015425381126297112
+  }
+}

evaluation/mteb/MedrxivClusteringS2S.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 492.85,
+    "v_measure": 0.2876892369576733,
+    "v_measure_std": 0.01586647571955603
+  }
+}

evaluation/mteb/NFCorpus.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 168.77,
+    "map_at_1": 0.05604,
+    "map_at_10": 0.1238,
+    "map_at_100": 0.15791,
+    "map_at_1000": 0.17327,
+    "map_at_3": 0.0915,
+    "map_at_5": 0.10599,
+    "mrr_at_1": 0.45201,
+    "mrr_at_10": 0.53374,
+    "mrr_at_100": 0.54089,
+    "mrr_at_1000": 0.54123,
+    "mrr_at_3": 0.51445,
+    "mrr_at_5": 0.5259,
+    "ndcg_at_1": 0.42879,
+    "ndcg_at_10": 0.33891,
+    "ndcg_at_100": 0.31392,
+    "ndcg_at_1000": 0.4036,
+    "ndcg_at_3": 0.39076,
+    "ndcg_at_5": 0.37047,
+    "precision_at_1": 0.44582,
+    "precision_at_10": 0.25294,
+    "precision_at_100": 0.08285,
+    "precision_at_1000": 0.02148,
+    "precision_at_3": 0.3612,
+    "precision_at_5": 0.3195,
+    "recall_at_1": 0.05604,
+    "recall_at_10": 0.16239,
+    "recall_at_100": 0.3216,
+    "recall_at_1000": 0.64513,
+    "recall_at_3": 0.10406,
+    "recall_at_5": 0.12685
+  }
+}

evaluation/mteb/NQ.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 15471.98,
+    "map_at_1": 0.25881,
+    "map_at_10": 0.39501,
+    "map_at_100": 0.40615,
+    "map_at_1000": 0.40661,
+    "map_at_3": 0.35559,
+    "map_at_5": 0.37773,
+    "mrr_at_1": 0.29229,
+    "mrr_at_10": 0.41956,
+    "mrr_at_100": 0.4286,
+    "mrr_at_1000": 0.42893,
+    "mrr_at_3": 0.38562,
+    "mrr_at_5": 0.40542,
+    "ndcg_at_1": 0.292,
+    "ndcg_at_10": 0.46703,
+    "ndcg_at_100": 0.51644,
+    "ndcg_at_1000": 0.52771,
+    "ndcg_at_3": 0.39142,
+    "ndcg_at_5": 0.42892,
+    "precision_at_1": 0.292,
+    "precision_at_10": 0.0792,
+    "precision_at_100": 0.01066,
+    "precision_at_1000": 0.00117,
+    "precision_at_3": 0.18105,
+    "precision_at_5": 0.13036,
+    "recall_at_1": 0.25881,
+    "recall_at_10": 0.66266,
+    "recall_at_100": 0.88116,
+    "recall_at_1000": 0.96582,
+    "recall_at_3": 0.46526,
+    "recall_at_5": 0.55154
+  }
+}

evaluation/mteb/QuoraRetrieval.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 1285.77,
+    "map_at_1": 0.67553,
+    "map_at_10": 0.8134,
+    "map_at_100": 0.82002,
+    "map_at_1000": 0.82027,
+    "map_at_3": 0.78281,
+    "map_at_5": 0.80149,
+    "mrr_at_1": 0.7772,
+    "mrr_at_10": 0.84733,
+    "mrr_at_100": 0.84878,
+    "mrr_at_1000": 0.84879,
+    "mrr_at_3": 0.83587,
+    "mrr_at_5": 0.84326,
+    "ndcg_at_1": 0.7775,
+    "ndcg_at_10": 0.85603,
+    "ndcg_at_100": 0.87069,
+    "ndcg_at_1000": 0.8725,
+    "ndcg_at_3": 0.82303,
+    "ndcg_at_5": 0.84037,
+    "precision_at_1": 0.7775,
+    "precision_at_10": 0.1304,
+    "precision_at_100": 0.01507,
+    "precision_at_1000": 0.00156,
+    "precision_at_3": 0.35903,
+    "precision_at_5": 0.23738,
+    "recall_at_1": 0.67553,
+    "recall_at_10": 0.93903,
+    "recall_at_100": 0.99062,
+    "recall_at_1000": 0.99935,
+    "recall_at_3": 0.84581,
+    "recall_at_5": 0.89316
+  }
+}

evaluation/mteb/RedditClustering.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 6540.34,
+    "v_measure": 0.46468877112302354,
+    "v_measure_std": 0.059743532887098036
+  }
+}

evaluation/mteb/RedditClusteringP2P.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 26567.79,
+    "v_measure": 0.5416687629824692,
+    "v_measure_std": 0.11955619105267504
+  }
+}

evaluation/mteb/SCIDOCS.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "evaluation_time": 338.56,
+    "map_at_1": 0.04053,
+    "map_at_10": 0.09694,
+    "map_at_100": 0.11387,
+    "map_at_1000": 0.11654,
+    "map_at_3": 0.07053,
+    "map_at_5": 0.08439,
+    "mrr_at_1": 0.199,
+    "mrr_at_10": 0.29359,
+    "mrr_at_100": 0.30484,
+    "mrr_at_1000": 0.30553,
+    "mrr_at_3": 0.262,
+    "mrr_at_5": 0.28115,
+    "ndcg_at_1": 0.199,
+    "ndcg_at_10": 0.16575,
+    "ndcg_at_100": 0.23655,
+    "ndcg_at_1000": 0.28853,
+    "ndcg_at_3": 0.15848,
+    "ndcg_at_5": 0.14026,
+    "precision_at_1": 0.199,
+    "precision_at_10": 0.0845,
+    "precision_at_100": 0.01872,
+    "precision_at_1000": 0.00313,
+    "precision_at_3": 0.14667,
+    "precision_at_5": 0.1232,
+    "recall_at_1": 0.04053,
+    "recall_at_10": 0.1717,
+    "recall_at_100": 0.38025,
+    "recall_at_1000": 0.63572,
+    "recall_at_3": 0.08903,
+    "recall_at_5": 0.12477
+  }
+}

evaluation/mteb/SGPT-2.7B-weightedmean-msmarco-specb-bitfit_results.csv ADDED Viewed

	@@ -0,0 +1,354 @@

+model,task,dataset,language,metric,value
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,BitextMining,BUCC,,f1,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,BitextMining,Tatoeba,,f1,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en,accuracy,0.6756716417910448
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en-ext,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,en-ext,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonCounterfactualClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonPolarityClassification,en,accuracy,0.71439575
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,en,accuracy,0.35748
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,zh,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,AmazonReviewsClassification,zh,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,Banking77Classification,en,accuracy,0.8321753246753246
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,EmotionClassification,en,accuracy,0.49215
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,ImdbClassification,en,accuracy,0.635316
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,af,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,af,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,am,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,am,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ar,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ar,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,az,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,az,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,bn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,bn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,cy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,cy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,da,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,da,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,el,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,el,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,en,accuracy,0.6900806993947546
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fa,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fa,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,he,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,he,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hu,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hu,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,hy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,id,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,id,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,is,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,is,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,it,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,it,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,jv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,jv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ka,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ka,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,km,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,km,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,kn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,kn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ko,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ko,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,lv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,lv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ml,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ml,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,mn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,mn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ms,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ms,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,my,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,my,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nb,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nb,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,nl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pt,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,pt,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ro,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ro,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ru,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ru,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sq,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sq,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sw,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,sw,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ta,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ta,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,te,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,te,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,tr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ur,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,ur,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,vi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,vi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-CN,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-CN,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-TW,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveIntentClassification,zh-TW,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,af,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,af,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,am,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,am,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ar,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ar,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,az,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,az,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,bn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,bn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,cy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,cy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,da,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,da,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,el,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,el,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,en,accuracy,0.7590114324142568
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fa,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fa,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,he,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,he,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hu,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hu,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,hy,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,id,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,id,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,is,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,is,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,it,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,it,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ja,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,jv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,jv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ka,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ka,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,km,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,km,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,kn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,kn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ko,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ko,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,lv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,lv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ml,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ml,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,mn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,mn,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ms,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ms,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,my,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,my,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nb,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nb,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,nl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pt,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,pt,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ro,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ro,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ru,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ru,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sq,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sq,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sv,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sw,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,sw,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ta,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ta,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,te,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,te,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tl,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,tr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ur,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,ur,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,vi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,vi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-CN,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-CN,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-TW,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MassiveScenarioClassification,zh-TW,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,en,accuracy,0.9256269949840401
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPDomainClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,en,accuracy,0.7184678522571819
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,de,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,es,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,fr,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,hi,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,MTOPIntentClassification,th,accuracy,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,ToxicConversationsClassification,en,accuracy,0.6884080000000001
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,TweetSentimentExtractionClassification,en,accuracy,0.5668647425014148
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,ArxivClusteringP2P,en,v_measure,0.44721257146422017
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,ArxivClusteringS2S,en,v_measure,0.35081451519142065
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,BiorxivClusteringP2P,en,v_measure,0.3441414219680629
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,BiorxivClusteringS2S,en,v_measure,0.30533275862270026
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,MedrxivClusteringP2P,en,v_measure,0.31350109978273394
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,MedrxivClusteringS2S,en,v_measure,0.2876892369576733
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,RedditClustering,en,v_measure,0.46468877112302354
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,RedditClusteringP2P,en,v_measure,0.5416687629824692
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,StackExchangeClustering,en,v_measure,0.5919409867397648
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,StackExchangeClusteringP2P,en,v_measure,0.32574403257811496
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,TwentyNewsgroupsClustering,en,v_measure,0.408911707239219
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,PairClassification,SprintDuplicateQuestions,en,ap,0.9347124923047998
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,PairClassification,TwitterSemEval2015,en,ap,0.6368133990830133
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,PairClassification,TwitterURLCorpus,en,ap,0.8480240716354543
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Reranking,AskUbuntuDupQuestions,en,map,0.5963466199039206
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Reranking,MindSmallReranking,,map,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Reranking,SciDocsRR,en,map,0.7771580844366375
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Reranking,StackOverflowDupQuestions,en,map,0.4961186384154483
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,ArguAna,en,ndcg_at_10,0.50491
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,ClimateFEVER,en,ndcg_at_10,0.2711
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,CQADupstackRetrieval,en,ndcg_at_10,0.3653358333333333
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,DBPedia,en,ndcg_at_10,0.34702
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,FEVER,en,ndcg_at_10,0.72731
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,FiQA2018,en,ndcg_at_10,0.33286
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,HotpotQA,en,ndcg_at_10,0.52835
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,MSMARCO,en,ndcg_at_10,0.38832
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,NFCorpus,en,ndcg_at_10,0.33891
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,NQ,en,ndcg_at_10,0.46703
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,QuoraRetrieval,en,ndcg_at_10,0.85603
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,SCIDOCS,en,ndcg_at_10,0.16575
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,SciFact,en,ndcg_at_10,0.70165
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,Touche2020,en,ndcg_at_10,0.2344
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,TRECCOVID,en,ndcg_at_10,0.7517
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,BIOSSES,en,cosine_spearman,0.8484289705838665
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,SICK-R,en,cosine_spearman,0.6819926431966059
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS12,en,cosine_spearman,0.6699390786191646
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS13,en,cosine_spearman,0.7757623085766706
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS14,en,cosine_spearman,0.7278258293483495
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS15,en,cosine_spearman,0.8261707296911949
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS16,en,cosine_spearman,0.8009839524406284
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,ko-ko,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,ko-ko,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,ar-ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,ar-ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-de,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-de,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-en,cosine_spearman,0.8725017540413703
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-tr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,en-tr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-es,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,es-es,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,fr-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,fr-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,it-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,it-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,nl-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS17,nl-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,en,cosine_spearman,0.687486910762485
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,tr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,tr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,ar,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,ru,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,ru,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,it,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,it,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,pl-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,zh-en,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-it,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,es-it,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-fr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-fr,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,de-pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr-pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STS22,fr-pl,cosine_spearman,
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,STSBenchmark,en,cosine_spearman,0.7920585637461047
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Summarization,SummEval,en,cosine_spearman,0.27870478281195465
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Classification,average,en,accuracy,0.6713040365015015
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Clustering,average,en,v_measure,0.39833144224085476
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,PairClassification,average,en,ap,0.8065166543410891
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,Retrieval,average,en,ndcg_at_10,0.4653783888888888
+SGPT-2.7B-weightedmean-msmarco-specb-bitfit,STS,average,en,cosine_spearman,0.768315074100644

evaluation/mteb/SICK-R.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7775487485196769,
+      "spearman": 0.6819926431966059
+    },
+    "euclidean": {
+      "pearson": 0.7169016204991725,
+      "spearman": 0.6698099673026834
+    },
+    "evaluation_time": 106.65,
+    "manhattan": {
+      "pearson": 0.7162994072488664,
+      "spearman": 0.6703435950744577
+    }
+  }
+}

evaluation/mteb/STS12.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7591051402657887,
+      "spearman": 0.6699390786191646
+    },
+    "euclidean": {
+      "pearson": 0.7154128036454578,
+      "spearman": 0.6925605675649068
+    },
+    "evaluation_time": 49.4,
+    "manhattan": {
+      "pearson": 0.7160981030780171,
+      "spearman": 0.6927513670128046
+    }
+  }
+}

evaluation/mteb/STS13.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7723835466417793,
+      "spearman": 0.7757623085766706
+    },
+    "euclidean": {
+      "pearson": 0.775090992200725,
+      "spearman": 0.7788601688144924
+    },
+    "evaluation_time": 21.2,
+    "manhattan": {
+      "pearson": 0.7739045060647423,
+      "spearman": 0.7777552718279098
+    }
+  }
+}

evaluation/mteb/STS14.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "dataset_version": null,
+  "mteb_version": "0.0.2",
+  "test": {
+    "cos_sim": {
+      "pearson": 0.7791692485139602,
+      "spearman": 0.7278258293483495
+    },
+    "euclidean": {
+      "pearson": 0.7464773017077789,
+      "spearman": 0.7181662299104619
+    },
+    "evaluation_time": 52.55,
+    "manhattan": {
+      "pearson": 0.7471043337995533,
+      "spearman": 0.7183960860845646
+    }
+  }
+}