Maxime Labonne mlabonne

## LLAMA_Harsha_8_B_ORDP_10k-Nous.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / LLAMA_Harsha_8_B_ORDP_10k-Nous.md
            
            
              Created
              December 2, 2024 17:50
                — forked from asharsha30-1996/LLAMA_Harsha_8_B_ORDP_10k-Nous.md
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


LLAMA_Harsha_8_B_ORDP_10k
35.54
71.15
55.39
37.96
50.01


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
26.77
±
2.78


acc_norm
27.17
±
2.80


agieval_logiqa_en
0
acc
31.34
±
1.82


## Phi-3-mini-4k-instruct-Nous.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / Phi-3-mini-4k-instruct-Nous.md
            
            
              Created
              June 5, 2024 21:12
                — forked from CultriX-Github/Phi-3-mini-4k-instruct-Nous.md
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


Phi-3-mini-4k-instruct
44.44
71.88
57.77
41.9
54


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
29.13
±
2.86


acc_norm
28.74
±
2.85


agieval_logiqa_en
0
acc
42.86
±
1.94


## dolphin-2.8-mistral-7b-v02-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / dolphin-2.8-mistral-7b-v02-Nous.md
            
            
              Created
              April 8, 2024 23:36
                — forked from tosh/dolphin-2.8-mistral-7b-v02-Nous.md
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


dolphin-2.8-mistral-7b-v02
38.99
72.22
51.96
40.41
50.9


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
21.65
±
2.59


acc_norm
20.47
±
2.54


agieval_logiqa_en
0
acc
35.79
±
1.88


## AlphaMonarch-7B-Eq-bench.md

      
              1 file
            
          
              0 forks
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / AlphaMonarch-7B-Eq-bench.md
            
            
              Created
              April 4, 2024 22:00
            
          
Model
EQ-Bench
Average


AlphaMonarch-7B
73.62
73.62


EQ-Bench


Task
Version
Metric
Value

Stderr


eq_bench
2.1
eqbench,none
73.62


eqbench_stderr,none
2


percent_parseable,none
97.66


## Hermes-2-Pro-Mistral-7B-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / Hermes-2-Pro-Mistral-7B-Nous.md
            
            
              Created
              March 29, 2024 12:23
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


Hermes-2-Pro-Mistral-7B
44.54
71.2
59.12
41.9
54.19


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
23.23
±
2.65


acc_norm
22.83
±
2.64


agieval_logiqa_en
0
acc
38.40
±
1.91


## CodeNinja-1.0-OpenChat-7B-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / CodeNinja-1.0-OpenChat-7B-Nous.md
            
            
              Created
              March 22, 2024 19:56
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


CodeNinja-1.0-OpenChat-7B
39.98
71.77
48.73
40.92
50.35


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
27.17
±
2.80


acc_norm
26.38
±
2.77


agieval_logiqa_en
0
acc
38.10
±
1.90


## Kunoichi-DPO-v2-7B-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / Kunoichi-DPO-v2-7B-Nous.md
            
            
              Created
              March 22, 2024 18:27
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


Kunoichi-DPO-v2-7B
44.79
75.05
65.68
47.65
58.29


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
26.38
±
2.77


acc_norm
24.02
±
2.69


agieval_logiqa_en
0
acc
38.71
±
1.91


## Beyonder-4x7B-v3-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / Beyonder-4x7B-v3-Nous.md
            
            
              Created
              March 22, 2024 07:39
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


Beyonder-4x7B-v3
45.85
76.67
74.98
50.12
61.91


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
26.38
±
2.77


acc_norm
24.02
±
2.69


agieval_logiqa_en
0
acc
39.48
±
1.92


## UltraMerge-7B-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / UltraMerge-7B-Nous.md
            
            
              Created
              March 21, 2024 22:58
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


UltraMerge-7B
44.36
77.15
78.47
49.35
62.33


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
27.56
±
2.81


acc_norm
23.23
±
2.65


agieval_logiqa_en
0
acc
39.48
±
1.92


## FrankenMonarch-7B-Nous.md

      
              1 file
            
          
              1 fork
            
          
                0 comments
              
            
              0 stars
            
          
                mlabonne
                / FrankenMonarch-7B-Nous.md
            
            
              Created
              March 19, 2024 15:41
            
          
Model
AGIEval
GPT4All
TruthfulQA
Bigbench
Average


FrankenMonarch-7B
45.1
75.53
73.86
46.79
60.32


AGIEval


Task
Version
Metric
Value

Stderr


agieval_aqua_rat
0
acc
25.59
±
2.74


acc_norm
25.98
±
2.76


agieval_logiqa_en
0
acc
39.02
±
1.91
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	26.77	±	2.78
		acc_norm	27.17	±	2.80
agieval_logiqa_en	0	acc	31.34	±	1.82
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	29.13	±	2.86
		acc_norm	28.74	±	2.85
agieval_logiqa_en	0	acc	42.86	±	1.94
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	21.65	±	2.59
		acc_norm	20.47	±	2.54
agieval_logiqa_en	0	acc	35.79	±	1.88
Task	Version	Metric	Value
eq_bench	2.1	eqbench,none	73.62
		eqbench_stderr,none	2
		percent_parseable,none	97.66
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	23.23	±	2.65
		acc_norm	22.83	±	2.64
agieval_logiqa_en	0	acc	38.40	±	1.91
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	26.38	±	2.77
		acc_norm	24.02	±	2.69
agieval_logiqa_en	0	acc	38.71	±	1.91
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	27.56	±	2.81
		acc_norm	23.23	±	2.65
agieval_logiqa_en	0	acc	39.48	±	1.92
Task	Version	Metric	Value		Stderr
agieval_aqua_rat	0	acc	25.59	±	2.74
		acc_norm	25.98	±	2.76
agieval_logiqa_en	0	acc	39.02	±	1.91