Gate News: últimas noticias cripto y precios de criptomonedas

Kimi lanza el nuevo modelo de audio universal Kimi-Audio

Jin10 datos 26 de abril, hoy, Kimi lanzó un nuevo proyecto de Código abierto: el nuevo modelo de audio base universal Kimi-Audio. Según se informa, este modelo admite múltiples tareas como el reconocimiento de voz, la comprensión de audio, la conversión de audio a texto y el diálogo por voz.

Más

03:22 GoldenOctober2024

AliTongyi's Qwen2-Audio open-source audio language model, with related papers selected for the ACL 2024 conference.

El 13 de agosto, Gold10 Data informó que Ali Tongyi ha lanzado el modelo Código abierto Qwen2-Audio en la familia de modelos Código abierto Qwen2. Qwen2-Audio permite la pregunta y respuesta de voz sin necesidad de entrada de texto, comprendiendo y analizando señales de audio enviadas por los usuarios, incluyendo voz humana, sonidos naturales y música. Este modelo supera significativamente a los modelos anteriores en múltiples evaluaciones autorizadas. El equipo de Tongyi también ha lanzado una nueva evaluación de modelos de comprensión de audio llamada Indicador de referencia, cuyo artículo relacionado ha sido seleccionado para la conferencia de alto nivel internacional ACL2024 que se está celebrando esta semana.

Más