Whisper Speaker Diarization

Medios Estados Unidos de América

Hugging Face: The Essential AI Toolkit for Journalists and Content Creators UNESCO (2023) 'Global toolkit on AI and the rule of law for the judiciary'. Available at: https://unesdoc.unesco.org/ark:/48223/pf0000387331 (Accessed March 2025).

La herramienta Whisper Speaker Diarization transcribe audio e identifica a los diferentes oradores, lo que la hace útil para reuniones, entrevistas y podcasts. Es compatible con 100 idiomas y proporciona marcas de tiempo a nivel de palabra, lo que facilita el seguimiento de las conversaciones. Todo se ejecuta localmente en el navegador, utilizando Whisper-base para la transcripción y pyannote-segmentation para la separación de los oradores, sin necesidad de llamadas a la API ni conexión a internet tras la carga. La herramienta es completamente de código abierto.

Producción

Visualización de datos (gráficos de datos ambientales, modelado 3D) Desarrollo de temas (maquetas, guiones gráficos, agregación de noticias) Generación automatizada de contenido (asistentes de escritura, correctores gramaticales) Asistencia Técnica (Producción remota, Efectos visuales, Cámaras autónomas)

#construir Aproveche el código de fuente abierta para crear funciones personalizadas y potenciar sus aplicaciones con funcionalidades personalizadas.

#transcribir Transcribe audio en texto y analiza conversaciones con marcas de tiempo a nivel de palabra y segmentación de hablantes.

Sitio web

Desarrollado por: Sociedad civil
Tipo de implementación: Plataforma web
Moderación de la comunidad: No requiere gestionnaire de communauté
Nivel de dificultad: Requiere desarrollador
Licencia: Código abierto

Volver a todos

Con el apoyo de

Guía del usuario

El diseño y la presentación de los materiales de este repositorio no implican la expresión de ninguna opinión por parte de la UNESCO y el IRCAI sobre el estado legal de ningún país, territorio, ciudad o área, o de sus autoridades, o sobre la delimitación de sus fronteras o límites. Las ideas, opiniones y contenido presentados en este repositorio son de los autores; no representan necesariamente las opiniones de la UNESCO y el IRCAI y no comprometen a las organizaciones.