Público
sector
sector
Medios
Judicial
Whisper Speaker Diarization
Medios
Estados Unidos de América
Hugging Face: The Essential AI Toolkit for Journalists and Content Creators
UNESCO (2023) 'Global toolkit on AI and the rule of law for the judiciary'. Available at: https://unesdoc.unesco.org/ark:/48223/pf0000387331 (Accessed March 2025).
La herramienta Whisper Speaker Diarization transcribe audio e identifica a los diferentes oradores, lo que la hace útil para reuniones, entrevistas y podcasts. Es compatible con 100 idiomas y proporciona marcas de tiempo a nivel de palabra, lo que facilita el seguimiento de las conversaciones. Todo se ejecuta localmente en el navegador, utilizando Whisper-base para la transcripción y pyannote-segmentation para la separación de los oradores, sin necesidad de llamadas a la API ni conexión a internet tras la carga. La herramienta es completamente de código abierto.
Producción
Visualización de datos (gráficos de datos ambientales, modelado 3D) Desarrollo de temas (maquetas, guiones gráficos, agregación de noticias) Generación automatizada de contenido (asistentes de escritura, correctores gramaticales) Asistencia Técnica (Producción remota, Efectos visuales, Cámaras autónomas)
#construir
Aproveche el código de fuente abierta para crear funciones personalizadas y potenciar sus aplicaciones con funcionalidades personalizadas.
#transcribir
Transcribe audio en texto y analiza conversaciones con marcas de tiempo a nivel de palabra y segmentación de hablantes.
- Desarrollado por
- Sociedad civil
- Tipo de implementación
- Plataforma web
- Moderación de la comunidad
- No requiere gestionnaire de communauté
- Nivel de dificultad
- Requiere desarrollador
- Licencia
- Código abierto