一个名为SALMONN的新型框架引起了广泛关注,旨在将大型语言模型的能力扩展到通用听觉领域,这个由语音、音频事件和音乐构成的通用音频输入是人工智能在真实环境中的关键组成。
更新时间:2024-01-17 17:48:58