新闻 /
起原:智通财经网2024bat365官网入口
英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式东说念主工智能(AI)模子,旨在为制作音乐、电影和视频游戏的东说念主们提供处事。
笔据英伟达的说法,这款模子名为Fugatto(Foundational Generative Audio Transformer Opus),不错使用任何文本和音频文献来生成或修改音乐和声息。
举例,该模子不错笔据文本提醒创建音乐片断,从现存歌曲中删除或添加乐器,改造声息中的口音或热枕,甚而发出从未听过的声息。
英伟达哄骗音频规划司理、管弦乐队指示兼作曲家Rafael Valle示意:“咱们但愿创建一个能像东说念主类相开心会和产生声息的模子。”
英伟达指出,告白代理商不错使用Fugatto快速定位多个地区的现存告白,并在配音中加入不同的口音和情谊。此外,视频游戏建立者不错使用东说念主工智能模子修改游戏中事前录制的财富,以适哄骗户在玩游戏时阁下变化的手脚。
Fugatto不错使小号发出狗吠声或萨克斯管发出喵喵声。该公司补充说,通过微统逐一丝的颂扬数据,规划东说念主员发现它不错经管未经事前进修的任务,比如从文本中生成高质地的歌声。
英伟达示意,Fugatto的齐备版块使用了25亿个参数,并在包含32个Nvidia H100 Tensor Core GPU的Nvidia DGX系统上进行了进修。该模子的合座责任耗时一年多。
Fugatto可能会与Runway等初创公司以及 Meta Platforms(META.US)等大公司的访佛时代张开竞争。10月,Meta 发布了名为Movie Gen的东说念主工智能模子,该模子不错笔据用户提醒创建传神的视频和音频裁剪。
本年 2 月2024bat365官网入口,ChatGPT制造商OpenAI推出了Sora,它不错笔据文本指示创建传神且奢靡思象力的场景。这家由微软(MSFT.US)相沿的公司尚未向公众发布文本转视频模子。
Nvidia英伟达模子文本音频发布于:北京市