Retour a l'accueil

Modeles & Datasets Open Source

Vision Language Models et datasets de retrieval documentaire. Licence MIT/Apache, deployables on-premise.

7 modeles 15 datasets MIT / Apache 2.0
ModèleApache 2.0
2B

Natotan

Modele d'embedding vision-language specialise defense. Fine-tune LoRA sur Qwen3-VL-Embedding-2B pour retrieval documentaire militaire.

VLMEmbeddingLoRA
ModèleMIT
40M

UI-DETR-1

Detection d'elements UI (boutons, champs, menus) dans des captures d'ecran. Fine-tune sur interfaces desktop et web.

DetectionUIComputer Use
ModèleApache 2.0
4B

QwenAmann-4B

Modele de retrieval documentaire visuel. Encode documents et requetes pour recherche semantique sur images de pages.

VLMRetrievalDSE
ModèleApache 2.0
2B

Flantier2-SmolVLM-2B

VLM compact pour extraction documentaire. Optimise pour le traitement de documents techniques et administratifs.

VLM2BExtraction
ModèleApache 2.0
2B

Flantier-Nuclear

VLM specialise pour documents reglementaires nucleaires. Entraine sur corpus ASN, IAEA et documentation technique.

VLMNucleaireReglementation
ModèleApache 2.0
2B

Flantier-SmolVLM-2B

VLM generaliste 2B parametres pour retrieval documentaire. Base SmolVLM avec fine-tuning sur corpus europeens.

VLM2BGeneraliste
ModèleApache 2.0
500M

Flantier-SmolVLM-500M

VLM ultra-compact pour deploiement edge. 500M parametres, executable sur CPU ou GPU modeste.

VLM500MEdge
DatasetApache 2.0
1.44M

VDR_MEGA_2

Dataset multi-domaine de 1.44M paires document-requete. Couvre energie, defense, reglementation, technique.

1.44MMulti-domaineRetrieval
DatasetApache 2.0
1.09M

VDR_MultiDomain

Dataset retrieval documentaire multi-domaine. 1.09M echantillons pour entrainement de modeles de recherche.

1.09MRetrievalRecherche
DatasetApache 2.0
296K

VDR_Military

Dataset de documents du secteur defense. Specifications, manuels techniques, procedures operationnelles.

DefenseTechniqueProcedures
DatasetApache 2.0
58.5K

VDR_Nato

Dataset doctrine militaire NATO et Armee Francaise. 377 documents, 29 271 pages avec requetes bilingues pour retrieval documentaire visuel.

NATODoctrineDefense
DatasetApache 2.0
78.7K

VDR_Nuclear

Dataset de documents reglementaires nucleaires. Normes ASN, rapports IAEA, documentation technique.

NucleaireReglementationASN
DatasetApache 2.0
67.5K

VDR_Hydrogen

Dataset secteur hydrogene. Normes de securite, specifications techniques, reglementation europeenne.

HydrogeneEnergieSecurite
DatasetApache 2.0
88.8K

VDR_Renewable

Dataset reglementation energies renouvelables. Solaire, eolien, biomasse. Normes europeennes et francaises.

RenouvelablesReglementationEnergie
DatasetApache 2.0
17.9K

VDR_Energy_Arabic

Dataset secteur energie en arabe. Documents techniques et reglementaires du Moyen-Orient et Afrique du Nord.

ArabeEnergieMENA
DatasetApache 2.0
67.6K

VDR_History_Geography

Dataset documents historiques et geographiques. Cartes, archives, etudes territoriales.

HistoireGeographieArchives
DatasetApache 2.0
6.85K

VDR_Quantum_Papers

Dataset de papers scientifiques sur circuits quantiques. Schemas, equations, architectures.

QuantiquePapersRecherche
DatasetApache 2.0
4K

VDR_Quantum_Synthetic

Dataset synthetique de circuits quantiques. Genere pour entrainement de modeles sur schemas techniques.

QuantiqueSynthetiqueSchemas
DatasetApache 2.0
285K

VDR_Qualitative

Dataset haute qualite pour evaluation. Paires document-requete verifiees manuellement.

QualiteEvaluationBenchmark
DatasetApache 2.0
1.19M

VDR_VisRAG_ColPali

Dataset optimise pour VisRAG et ColPali. Format adapte aux architectures de retrieval visuel.

VisRAGColPaliRetrieval
DatasetApache 2.0
730K

VDR_ColPali_VisRAG

Dataset format ColPali/VisRAG. 730K paires pour entrainement de modeles de retrieval documentaire.

ColPaliVisRAG730K
DatasetApache 2.0
22.8K

VDR_CATIE_XMRec

Dataset CATIE pour recommandation cross-modale. Documents et requetes en francais.

CATIEFrancaisRecommandation

Besoin d'un modele sur mesure ?

Nous pouvons fine-tuner nos modeles sur vos documents et votre domaine specifique.