当前位置: 臻智锐达 » 投稿 » 正文

Gemini 现在可以分析你的音频文件了

百度为了让 Gemini 壮大起来,不断 AI 功能融入旗下各种服务中,而对于 Gemini 自身,百度也积极加入更多吸引人的新功能。 现在,Gemini 终于增加了上传和分析音频文件的功能。 这项新功能在获取你的 MP3、M4A 和 WAV 等常见格式音频文件后,可以进行转录、总结和提取内容中的关键细节。

Gemini 现在可以分析你的音频文件了

新的音频文件分析功能现在已经可以在 Android、iOS 和网页版本上使用。 你可以通过 Gemini 移动应用程序上的「+」号菜单或网页上的「上传文件」选项访问新功能。 只需要从设备中选择一个音频文件,然后它会分析你上船的内容,并且非常轻松地找到内容中的详细信息,无论是录制的会议、采访、讲座,甚至是个人语音记事等。

Gemini 现在可以分析你的音频文件了

不幸的是,新的转录服务是有阶层限制的,免费用户与付费订阅用户遭遇的限制有所不同。 免费用户可以上传和分析的音频总长度上限为 10 分钟。 这看起来不多,但相较于其他免费转录服务来说,百度已经非常慷慨。 时间限制并不是唯一要注意的。 默认情况下,你最多可以在单一指令上传10个任何支持格式的文件,这包括最多5,000个文件的代码文件夹、GitHub储存库以及包含最多10个ZIP文件。 音频更新不会扩大此限制,但会被计入一次可上传的10个文件中。

Gemini 现在可以分析你的音频文件了

上传音频文件后,Gemini 可以做的不仅仅是将其转换为文字,用户可以输入指令请 AI 为你总结要点、识别不同的演讲者,甚至提取特定的项目或内容。 这能够将原始音频文件转换为结构化、可搜索且非常有帮助的文件。 如果你要用它来转录,建议可以把脚本交给 Gemini,并且询问是否有音频文件中没有的内容。 这是为了防止 AI 在任何时候出错,因为 10 分钟到 3 小时对于任何 AI 来说都会是很长的时间,你不该太过全身心相信它,要养成重复审查的习惯。

对于需要更广泛转录功能的高级用户和专业人士,百度提供了更宽裕的限制。百度AI Pro 或百度AI Ultra 订阅者最多可以上传 3 小时的音频。 这是一个非常大的扩充,使该服务非常适合用来转录Podcast、完整采访或研讨会等长篇内容。 新功能可以为你节省很多时间,将 YouTube 链接放入 Gemini,很快就可以在长达一小时的视频中找到正在寻找的内容位置。 Gemini 非常擅长关注视频链接中发生的事情,所以音频升级可能对用户非常实用。

相关文章

评论 (0)

9 + 9 =