Secteur public
Médias
Judiciaire

olmOCR

Médias Country or Region les états-unis d'Amérique
Sourced From
Hugging Face: The Essential AI Toolkit for Journalists and Content Creators UNESCO (2023) 'Global toolkit on AI and the rule of law for the judiciary'. Available at: https://unesdoc.unesco.org/ark:/48223/pf0000387331 (Accessed March 2025).
olmOCR convertit les PDF et autres documents en texte brut tout en préservant l'ordre de lecture naturel. Il prend en charge les éléments complexes tels que les tableaux, les équations et l'écriture manuscrite, ce qui le rend idéal pour le traitement des documents universitaires et techniques. Les utilisateurs peuvent exécuter olmOCR sur leurs propres GPU, permettant ainsi une conversion de documents à haut débit et à grande échelle. Cela permet un traitement économique, estimé à seulement 190 dollars par million de pages, ce qui le rend idéal pour les archives universitaires et techniques à grande échelle.
Collecte d'informations et vérification des faits

Collecte de données (outils de renseignement open source, plateformes de données géospatiales, ensembles de données d'archives publiques) Vérification des données (vérification des faits, recherche d'images inversées, traçage des sources) Exploration des médias sociaux (filtrage automatisé, identification de modèles) Systèmes de surveillance et d'alerte des dangers

#déployer Exécutez olmOCR sur des GPU personnels pour une conversion de documents évolutive et à haut débit, à moindre coût. Traitez efficacement de gros volumes de documents, pour un coût estimé à 190 $ par million de pages.
#générer Convertissez des PDF et autres documents en texte brut tout en préservant l'ordre de lecture et les éléments de mise en forme tels que les tableaux et les équations. Assurez une grande précision grâce à des techniques d'invite avancées, adaptées au contenu académique et technique.
Développé par
Académie, Société civile
Type de déploiement
Plateforme Web
Modération communautaire
Ne nécessite pas de community manager
Niveau de difficulté
Nécessite un développeur
Licence
Open source
Retour à tous
Avec le soutien de

Guide de l'utilisateur

© IRCAI and UNESCO

Les désignations utilisées et la présentation des documents dans ce dépôt ne signifient pas que l'UNESCO et l'IRCAI expriment une opinion sur le statut juridique d'un pays, d'un territoire, d'une ville ou d'une zone, ou sur ses autorités, ou sur le tracé de ses frontières ou limites. Les idées, opinions et contenus présentés dans ce dépôt sont ceux des auteurs ; ils ne représentent pas nécessairement les vues de l'UNESCO et de l'IRCAI et n'engagent pas les organisations.