当前位置：首页 > 数码 > 正文内容

Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)

admin2年前 (2024-04-23)数码316

簡介

Meta 的 MusicGen 是一個開源的人工智慧 (AI) 音樂模型，於 2023 年 6 月發布。它在多個方面取得了重大進步，包括：使用更少的訓練數據開源代碼和模型權重僅使用商業許可的訓練材料

模型的進展

自 MusicGen 發布以來，Meta 在以下兩個關鍵領域對其進行了升級：多波段擴散立體聲输出

多波段擴散

多波段擴散是一種技術，允許模型以較低的採樣率生成音樂，然後使用神經音頻壓縮模型對其進行重建，從而產生高保真度輸出。

多波段擴散的優點

顯著減少計算時間和成本改善聲音質量，減少偽音

立體聲輸出

MusicGen 現在可以生成立體聲輸出，從而使生成的音樂更加生動和令人興奮。

立體聲輸出的優點

提升空間感知和沉浸感使音樂更具吸引力

音樂範例

以下是一些使用 MusicGen 生成的音樂範例，展示了這些進步的影響：

原始 MusicGen 模型 (3.3B 參數)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散，立體聲輸出)

如您所見，升級後的 MusicGen 模型顯著改善了聲音質量和空間感。

結論

MusicGen 是 AI 音樂領域的一項重大進步。多波段擴散和立體聲輸出等改進提高了模型的保真度和靈活性。隨著持續的研究和發展，我們可以期待 MusicGen 及其他 AI 音樂模型在未來產生更多創新的音樂體驗。

大模型是什么？与人工智能有什么区别？

大模型与人工智能区别：以前的模型大都是弱人工智能，像阿尔法狗只能下围棋，而各种识别产品也只能完成一个任务。这些模型之间是隔离的不能互相支撑。而大模型则通过扩大模型的参数规模，并通过大量数据的训练，来支撑所有人工智能的任务。

大模型就是一种参数规模非常大的人工神经网络。因为参数足够大之后它能力非常强，所以在很多任务上都表现出非常好的能力。

因为大模型学习了非常多的知识，经过了非常多的数据训练，这样就具有了非常好的通用性。包括像我们日常生活中经常见到的各种人工智能产品，比如说人脸识别、对话机器人，等等。

因为大模型的容量非常大、能力非常强，所以它把所有的任务都合在一起，用一个模型来提供非常多的任务的支撑，就是我们人工智能这个领域所谓的通用人工智能，所以它展示出来通用人工智能一个非常好的前景。

人工智能大模型的类型

大模型可以分为两类，通用大模型和垂直大模型。通用大模型，基础大模型，擅长处理多种任务，是行业技术的制高点，推动产业革命。如GPT系列就是通用模型。训练通用大模型的参数规模大，需要强大的算力支撑，通常是头部企业的兵家必争之地。

国内科技、互联网巨头纷纷布局，网络的文心一言、阿里的通义千问大模型、腾讯的混元大模型、科大讯飞的星火认知大模型、商汤科技的日日新大模型等都是。

垂直大模型，行业大模型，是大模型应用落地的重要形式。基于通用大模型进行微调，通过训练专业数据，向各行各业等多个场景提供更加精准、高效的解决方案。比如华为盘古大模型就是针对行业提供专业大模型，已经初步运用在政务、金融、铁路、气象、煤矿等领域。

国际上，除了ChatGPT外，还有Llama2，是Meta与微软联手推出的开源大模型，包含70亿参数、130亿参数、700亿参数三个规模；其训练数据快速增加，接受了2万亿tokens的训练。

未来 AI 歌手会成为主流吗？

很可能会成为主流。 AI歌手利用机器学习和深度学习技术，通过分析大量的音乐数据和艺术家的风格，能够创作原创音乐，并以人工生成的声音演唱。这种技术有一些潜在的优势，例如：1. 创造力和多样性：AI歌手可以从不同风格和曲风中吸收灵感，并创造出新的音乐作品。它们可以在短时间内生成大量不同风格的音乐，展现出多样性和创造力。 2. 跨语言和文化：AI歌手可以轻松地适应不同语言和文化的音乐创作，消除了语言和文化差异对音乐传播的限制。 3 表演：与人类艺术家相比，AI歌手可以在任何时间表演，没有疲劳和限制。这种可持续的表演能力使得音乐在全球范围内更加可及。 AI 孙燕姿是一个有趣的例子，展示了人工智能在音乐创作和表演方面的潜力。虽然AI歌手和音乐创作目前还处于起步阶段，但随着技术的不断发展，它有望在未来成为主流。需要注意的是，尽管AI在音乐创作和表演方面取得了一些令人印象深刻的成果，人类艺术家的创造力和情感表达仍然是不可替代的。将AI与人类艺术家的才能结合使用，可能会创造出更加丰富。

免责声明：本文转载或采集自网络，版权归原作者所有。本网站刊发此文旨在传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题，请联系本网，我们将在第一时间删除。同时，本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证，请读者仅作参考，并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失，本网站不承担任何责任。

标签: Meta

“Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)” 的相关文章

Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)

11月20日，Meta宣布为Facebook和Instagram推出两款基于文本的图像编辑工具，分别是EmuEdit和EmuVideo，这两款工具适用于照片和视频，Meta公布了更多相关信息，如下所述…

Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)

簡介

模型的進展

多波段擴散

多波段擴散的優點

立體聲輸出

立體聲輸出的優點

音樂範例

原始 MusicGen 模型 (3.3B 參數)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散，立體聲輸出)

結論

大模型是什么？与人工智能有什么区别？

未来 AI 歌手会成为主流吗？

“Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)” 的相关文章

Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)

粤ICP备2024228868号-2

Powered By Z-BlogPHP. Theme by TOYEAN.

Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)

簡介

模型的進展

多波段擴散

多波段擴散的優點

立體聲輸出

立體聲輸出的優點

音樂範例

原始 MusicGen 模型 (3.3B 參數)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散)

升級後的 MusicGen 模型 (3.3B 參數，多波段擴散，立體聲輸出)

結論

大模型是什么？与人工智能有什么区别？

未来 AI 歌手会成为主流吗？

“Meta的开源人工智能音乐模型-全面解析 (META的开源大模型)” 的相关文章

Emu-Edit-使用-探索人工智能图像编辑的无限可能 (EmuEdit)

粤ICP备2024228868号-2 var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?973599abd4c57458cf7c36d7795a4507"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();

Powered By Z-BlogPHP. Theme by TOYEAN.

粤ICP备2024228868号-2