テキストの指示はもちろん、画像や動画を読み込ませて直感的に作曲できる。そんな音楽生成機能「Lyria 3」がGeminiで使えるようになりました。
音楽生成AIといえば「Suno」が有名ですが、「Lyria 3」最大のメリットは「いつものチャット画面から一歩も出ずに、サクッと30秒の曲が作れる」手軽さにあります。
今回は、そんなLyria 3を使った楽曲生成の具体的な手順から、Sunoとの違い、無料・有料プランのリアルな回数制限、そして実際に使ってみてわかった注意点までをまとめて解説します。
音楽生成AI「Lyria 3」とは?
「Lyria 3」は、Googleが開発した最新の音楽生成AIモデルです。最大の特徴は、いつものGeminiのチャット画面からそのまま曲が作れること。専用のソフトなどは不要で、テキストや画像、動画を投げるだけで、30秒の楽曲を手軽に生成できます。
基本は無料でも利用可能ですが、有料プランのほうが生成回数などの上限が多めに設定されています。無料・有料プランごとの細かい違いについては、記事の後半で詳しく解説しています。
「Lyria 3」で生成したデモ音源
早速ですが、以下は実際に「Lyria 3」で生成した音源です。
ラップ調の曲からアイドルソング、海外ボーカルにJAZZ、8ビットゲーム風のBGMまで、かなり幅広いジャンルの音楽を作れるのがわかるかと思います。
「Lyria 3」の特徴
「Lyria 3」の特徴について、もう少し詳しく掘り下げていきます。
- チャット画面から手軽に楽曲を生成できる
- 画像・動画をもとに楽曲を生成できる
- 歌詞を指定できる
それぞれ、詳しく見ていきましょう。
チャット画面から手軽に楽曲を生成できる
楽曲の生成は、Geminiのチャット画面で完結します。いつものチャット欄に「男性ボーカルのJ-POP」や「カフェで流れるBGM」などと入力するだけで、十数秒ほど待てば楽曲が生成されます。
別のアプリなどを開く必要なく、手軽に楽曲を生成できるのが「Lyria 3」ならではのメリットです。
画像・動画をもとに楽曲を生成できる
テキストだけでなく、画像や動画ファイルを読み込ませての作曲も可能です。
たとえば、夕焼けの写真をアップロードして「この風景に合うBGM」と指示するだけで、雰囲気を汲み取った楽曲が生成されます。言葉でうまく表現しにくい視覚的なイメージも、直感的に音楽へと形にできます。
歌詞を指定できる
短いワンフレーズから、ある程度まとまった自作の歌詞まで、自由に指定して歌わせることもできます。
ただし、生成される楽曲の尺は30秒で固定。あまり長い歌詞を詰め込むと歌の途中で切れてしまうため、ボリュームの調整には注意が必要です。
「Lyria 3」の使い方
「Lyria 3」の使い方はとても簡単です。基本編と応用編に分けて解説をしていきます。
【基本】チャット画面から楽曲の生成
それではまず基本の使い方からです。
STEP.1 Geminiにログイン

まずはGeminiにアクセスし、ログインをしましょう。
STEP.2 ツールから「音楽を作成」を選択

ツールメニューを開き、「音楽を作成」を選択します。
なお、右側で選択できるモデル(高速・思考・Pro)による生成物のクオリティや生成スピードの差は、執筆時点では感じられませんでした。基本的にはどのモデルを選択しても同じだと思われます。
STEP.3 プロンプトを入力する

入力バーに、制作したい楽曲のイメージをプロンプトとして入力します。今回は、以下の内容で試してみました。
STEP.4 楽曲が生成される

十数秒ほどで、楽曲が完成します。
また、楽曲の生成と同時に、その曲のイメージに沿ったカバー画像も「Nano Banana 2」によって自動生成される仕様です。今回は「ポジティブモンスター!」というタイトルが付けられ、その名前に沿ったキャラクター画像が出力されました。
実際に生成された音源は以下です。メタル特有の激しさはやや控えめですが、ジャンルの雰囲気は十分に捉えられています。
【応用①】画像をアップロードして楽曲を生成する
続いては応用編として、画像を素材とした楽曲の生成です。今回は、ドライブシーンの画像をアップロードしてみます。

アップロードした画像
すると、「開放的なドライブにぴったりの曲を作成しました。晴れ渡る空の下、オープンカーで風を切って走る爽やかでエネルギッシュなイメージを形にしています。」というメッセージとともに、楽曲が生成されました。
完成した楽曲がこちらです。爽快感のあるドライブミュージックに仕上がっています。
【応用②】歌詞を指定して楽曲を生成する
続いては、歌詞を指定して楽曲を生成してみます。指定した歌詞は以下です。
見上げた空に 散らばる願い
言葉にできない 想いがある
迷いながら 震えながら
僕らは 答えを探してる
あの日見つけた 小さな勇気
今はまだ 蕾のままでも
いつかきっと 咲き誇るから
光の射す方へ 駆け抜けて
そして、出来上がった楽曲がこちら。
指定した歌詞を忠実に再現してくれましたが、想定よりもスローテンポな曲に仕上がったため、30秒という尺が足りず途中で切れる形となりました。
【応用③】トラック(テンプレ)を使って楽曲を生成する

最後は、あらかじめ用意された「トラック(テンプレート)」から楽曲を生成する方法です。
一から言葉で指定しなくても、「ラテンポップ」「フォーク バラード」「ワークアウト」といった多彩なジャンルのトラックが用意されています。
今回は「90年代のラップ」を選択し、そこからさらに自分好みの要素を加えて作成してみました。
一からプロンプトを考えるのが面倒な時は、このテンプレートから入るのがスムーズかもしれません。
音楽生成AI「Suno」との違い
以前紹介した音楽生成AI「Suno」と比較すると、楽曲のクオリティや構成の自由度においては、現時点(2026年3月)ではやはり音楽特化型のSunoに軍配が上がります。Sunoはフルコーラスの生成や、Aメロ・サビといった展開の細かなコントロールが可能です。
一方、Geminiの強みはその「手軽さ」にあります。普段の作業で使っているチャット画面から移動せずにそのまま楽曲を作れるだけでなく、画像や動画を読み込ませて直感的に作曲できるのは、マルチモーダルAIであるGeminiならではのメリットです。
ですので、「本格的に1曲作り込みたい時はSuno、AIで音楽を生成してみたい、サクッと短い音源が欲しい時はGemini」といった使い分けが現実的でしょう。
「Lyria 3」の利用料金
基本的に無料でも利用可能ですが、契約しているプランによって「生成できる曲数」や「制限が解除されるまでの時間」が異なります。
前提として、現在のGoogleのAIプランには以下の4種類が用意されています。
- 無料プラン:基本的な機能が使えるアカウント
- Google AI Plus(月額1,200円):個人・家族向けのスタンダードプラン
- Google AI Pro(月額2,900円):より多く生成できるパワーユーザー向けプラン
- Google AI Ultra(月額36,400円):プロフェッショナル向けの最上位プラン
実際に生成回数を検証したところ、無料プランでは連続10曲で制限がかかり、解除までの待機時間は約24時間でした。対して、月額2,900円の「Proプラン」は連続37曲まで生成でき、約1時間後には制限が解除されることを確認しました。
この結果から、中間の「AI Plus」でも十分な曲数が作れそうで、最上位の「AI Ultra」なら制限を気にせず相当数の楽曲を生成できそうです。
「Lyria 3」の注意点
最後に、「Lyria 3」を利用するうえでの注意点を見ていきましょう。
日本語楽曲の発音やリズムが若干怪しい
英語の楽曲に比べると、日本語の歌詞は発音のイントネーションやリズム感が若干怪しくなることがあります。とはいえ、不自然さはあくまで多少のレベルであり、日本語の楽曲のクオリティも十分に高いです。
今後のアップデートで、さらに日本語の精度は改善されていくだろうと思います。
歌詞の再現度にはムラがある
歌詞を指定して楽曲を生成する場合、必ずしもすべて指示通りに作ってくれるわけではありませんでした。
一部しか反映されないことや、まったく指定した歌詞にならないこともあります。何度か試した体感としては、単語やフレーズが多く複雑な歌詞を指定した場合に、反映されない傾向がありました。思い通りの歌詞の楽曲になるかどうかは、現状では少しガチャ的な要素があると言えます。
楽曲には電子透かし(SynthID)が入る
生成したすべての楽曲には、人間の耳には聞こえない「SynthID」という電子透かしが自動で埋め込まれます。これにより、専用ツールを通せば「AIが作った曲」であることが判別できる仕様になっています。
まとめ
別のアプリなどを開く必要なく、Geminiのチャット欄で手軽に楽曲を生成できる「Lyria 3」。
本格的な作り込みならSunoなどの専用ツールには敵いませんが、「AIでサクッと楽曲を作ってみたい」という方には最適なツールだと思います。
まずは無料プランの範囲内で、テキストや画像からどのような音楽が生まれるのか、実際に試してみてはいかがでしょうか。
生成AIに関する、ほかのおすすめの記事はこちらです。
Googleの画像生成AI「Nano Banana(ナノバナナ)」の上位モデル、「Nano Banana Pro」がついに登場しました。 無印版では難しかった「正確な日本語の描写」や「画像サイズの指定」が、今回のPro版ではほぼ完ぺきに改善されています。 本記事では、進化した機能の使い方...
Googleの生成AI「Gemini」で利用できる会話機能、「Gemini Live(ジェミニ・ライブ)」。 当初は有料プラン限定の機能でしたが、現在は無料ユーザーにも開放され、誰でも利用できるようになりました。 最大の特徴は、従来の音声検索とは異なり、話の途中で割り込んだり、カメラで映した映...
対話型AI検索エンジン「Perplexity」が、2025年7月にリリースした独自のWebブラウザ「Comet(コメット)」。 最大の特徴は、ユーザーの指示に従ってAIが自律的にWebページを操作する「エージェント機能」を搭載している点です。 Amazonで条件に合う商品を探して...
OpenAIから、待望の新型画像生成モデル「GPT-Image-1.5」が登場しました。 今回の目玉は、なんといってもキャラクターの「一貫性」と、会話感覚で直せる「編集機能」の進化、そして「テキスト(日本)の正確な描写」です。 本記事では、筆者が実際にこのツールを使い倒して分かったリアル...







コメント