Mistral 发布其首个开源 AI 音频模型 Voxtral

该公司将 Voxtral 定位为第一个能够部署“真正可用的语音智能生产”的开放模型。开发人员不再需要在廉价、开放但转录不准确且不能真正理解所说的内容的系统和功能良好但封闭的系统之间做出选择，而后者会让开发人员承担更高的费用并对部署控制更少。由于其 LLM 主干平台Mistral Small 3.1，它可以理解最多 40 分钟的音频，允许用户针对音频内容提问、生成摘要，或将语音命令转换为实时操作，例如调用 API 或运行函数。

Published at: 2025-07-16 00:05:24

Still want to read the full version? Full article