
[デジタルトゥデイ ファン・チギュ 記者] ステイビリティAIが、6分20秒の曲を生成できる新しいオーディオモデル群「ステーブルオーディオ3.0」を公開したと、テッククランチが20日(現地時間)報じた。
同社によると、ステーブルオーディオ3.0はスモールSFX、スモール、ミディアム、ラージで構成され、最上位モデルでは6分を超えるプロ仕様の楽曲制作に対応するという。
スモールSFXとスモールはそれぞれ4億5900万のパラメータを持ち、端末内で最大2分のサウンドや音楽を生成できる。ミディアムは14億、ラージは27億のパラメータ規模だ。
ミディアムとラージはどちらも6分20秒の完成曲を作成でき、楽曲の構成やメロディのトーンも維持できると同社は説明している。これは2024年に公開されたステーブルオーディオ2.0に比べて2倍以上の長さだ。
ステイビリティAIはスモールSFX、スモール、ミディアムモデルの重みを公開し、誰でも利用・改変できるようにした。一方でラージモデルはAPIと自己ホスティングの有料サービスでのみ提供される。年間売上が100万ドル(約1億4000万円)を超える企業は別途エンタープライズライセンスを取得する必要がある。
同社は今回のオーディオモデル群が完全なライセンスを確保したデータに基づき構築されたと明らかにした。昨年、ワーナー・ミュージック・グループとユニバーサル・ミュージック・グループとモデルおよび音楽制作ツールを共同で開発する契約も結んでいる。
ステイビリティAIはプロのミュージシャン向けの新製品群も開発中だが、具体的な機能は公表していない。ユニバーサルオーディオとフェンダーで最高デジタル責任者を務めたエタン・キャプランがステイビリティAIに合流し、プロ向け音楽製品の開発を率いているとテッククランチは伝えている。













コメント0