Spaces:

JQL-AI
/

JQL

Running

App Files Files Community

mbrack commited on May 29

Commit

8af2b1b

verified ·

1 Parent(s): 26dcb36

Update index.html

Browse files

Files changed (1) hide show

index.html +12 -5

index.html CHANGED Viewed

@@ -15,6 +15,7 @@
     .hero.is-primary { background-color: #f9d5e5; }
     .subtitle img { max-width: 100%; height: auto; }
     .section-title { margin-top: 2em; }
   </style>
 </head>
 <body>
@@ -62,7 +63,12 @@
             <span class="author-block"><sup>5</sup>Computer Science Department, TU Darmstadt,</span>
             <span class="author-block"><sup>6</sup>AI Sweden</span>
           </div>
           <div class="column has-text-centered">
               <span class="link-block">
                 <a href="https://arxiv.org/abs/2505.22232" target="_blank"
@@ -154,6 +160,7 @@
           <li>Benchmark performance improvement over FineWeb2</li>
           <li>Higher document retention vs. FineWeb2 heuristic filter</li>
           <li>Effective dynamic threshold strategies: Trade-off document quality for quantity</li>
         </ul>
       </li>
       <li><strong>⚡ Annotation Speed:</strong> ~11,000 docs/min (A100 GPU, avg. 690 tokens)</li>
@@ -169,14 +176,14 @@
       <li><a href="https://huggingface.co/datasets/Jackal-AI/JQL-LLM-Edu-Annotations" target="_blank">🧠 Synthetic LLM-annotated dataset (14M+ documents)</a></li>
       <li><a href="https://huggingface.co/Jackal-AI/JQL-Edu-Heads" target="_blank">🪶 Lightweight annotation models</a>:
         <ul>
-          <li>JQL-Gemma</li>
-          <li>JQL-Mistral</li>
-          <li>JQL-Llama</li>
         </ul>
       </li>
       <li>🛠️ Training & inference scripts</li>
       <ul>
-          <li><a href="https://huggingface.co/Jackal-AI/JQL-Edu-Heads" target="_blank">Web Corpus Annotation</a></li>
           <li>More coming soon</li>
         </ul>
       <li>🗄️ Large-scale dataset coming soon</li>

     .hero.is-primary { background-color: #f9d5e5; }
     .subtitle img { max-width: 100%; height: auto; }
     .section-title { margin-top: 2em; }
+    .contact-info { margin-top: 1em; } /* Added style for contact info */
   </style>
 </head>
 <body>
             <span class="author-block"><sup>5</sup>Computer Science Department, TU Darmstadt,</span>
             <span class="author-block"><sup>6</sup>AI Sweden</span>
           </div>
+          <div class="is-size-5 contact-info has-text-centered">
+            <span class="icon">
+              <i class="fas fa-envelope"></i>
+            </span>
+            <span>Contact: mehdi.ali@iais.fraunhofer.de, brack@cs.tu-darmstadt.de</span>
+          </div>
           <div class="column has-text-centered">
               <span class="link-block">
                 <a href="https://arxiv.org/abs/2505.22232" target="_blank"
           <li>Benchmark performance improvement over FineWeb2</li>
           <li>Higher document retention vs. FineWeb2 heuristic filter</li>
           <li>Effective dynamic threshold strategies: Trade-off document quality for quantity</li>
+          <li>Generalizes to unseen languages</li>
         </ul>
       </li>
       <li><strong>⚡ Annotation Speed:</strong> ~11,000 docs/min (A100 GPU, avg. 690 tokens)</li>
       <li><a href="https://huggingface.co/datasets/Jackal-AI/JQL-LLM-Edu-Annotations" target="_blank">🧠 Synthetic LLM-annotated dataset (14M+ documents)</a></li>
       <li><a href="https://huggingface.co/Jackal-AI/JQL-Edu-Heads" target="_blank">🪶 Lightweight annotation models</a>:
         <ul>
+          <li>JQL-Edu-Gemma</li>
+          <li>JQL-Edu-Mistral</li>
+          <li>JQL-Edu-Llama</li>
         </ul>
       </li>
       <li>🛠️ Training & inference scripts</li>
       <ul>
+          <li><a href="https://github.com/JQL-AI/JQL-Annotation-Pipeline" target="_blank">Web Corpus Annotation</a></li>
           <li>More coming soon</li>
         </ul>
       <li>🗄️ Large-scale dataset coming soon</li>