Code · Données · Modèles
Projets GitHub, datasets HuggingFace et notebooks interactifs. Des outils concrets pour les langues africaines, le deep learning et l'IA inclusive.
Projets open source couvrant le deep learning, les chatbots IA en langues africaines, la visualisation NLP et la bibliothèque Python publiée sur PyPI.
Wolof culture chatbot
Chatbot IA conversationnel en langue wolof, proof-of-concept fonctionnel d'un agent dialogue dans une langue nationale africaine à faibles ressources numériques.
Fondations DeepLearning PSW
Collection de notebooks Jupyter pour l'apprentissage du Deep Learning, CNNs, RNNs, Transformers, MNIST, CIFAR-10. Ressource pédagogique partagée avec la communauté.
Claude Code Best Practice Playbook
Guide de meilleures pratiques pour optimiser l'utilisation de Claude Code : structuration des hooks, gestion du contexte, patterns de sous-agents parallèles et réduction drastique des coûts en tokens.
Claude Code Token Optimization
Système de hooks Claude Code qui réduit la consommation de tokens de 285M à 50M (-82%) par session : rejet des lectures de fichiers volumineux, interception intelligente des outils et monitoring du budget en temps réel.
text2mapviewer
Bibliothèque Python publiée sur PyPI permettant de visualiser des textes géolocalisés sur des cartes interactives. Idéal pour l'analyse géospatiale de corpus NLP.
ollama_chatpdf_llama3
Système RAG local avec Ollama + LLaMA 3 pour interroger des documents PDF en langage naturel, entièrement offline, sans API cloud.
Waxal_Multiling_4_SER-Wolof
Dataset multilingue pour la reconnaissance des émotions (SER) en wolof. Premier corpus annoté dédié à cette langue nationale sénégalaise pour les tâches d'IA affective.
speechocean762_fluency_4_training
Adaptation du dataset SpeechOcean762 pour l'entraînement de modèles d'évaluation automatique de la fluence, annotations de prononciation, aisance et prosodie.
🤗 Voir sur HuggingFace →Avalinguo-Audio-Dataset-splitted
Dataset audio Avalinguo découpé en splits train/validation/test pour l'évaluation automatique de la fluence orale. Prêt à l'emploi pour les pipelines HuggingFace.
🤗 Voir sur HuggingFace →TP Webinaire EUREKA : IA & Maths sur MNIST
Notebook interactif accompagnant le webinaire « De la Terminale à la Révolution IA ». Classification MNIST avec un réseau de neurones from scratch, expliqué par les maths du lycée.
TP Article GPT OSS 20B : LLM Open Source
Notebook pratique accompagnant l'article sur les LLM open source 20B. Inférence, fine-tuning léger et comparaison de modèles de génération de texte.
TP Computer Vision : Classification GRSRB (panneaux routiers)
Reconnaissance de panneaux de signalisation routière avec un CNN sur le dataset GTSRB. Transfer learning, data augmentation et optimisation des performances.