1.50億のパラメータを持つ人工知能はどこかぁ~に君ぃ~を隠しているからぁ~♪の続きを歌えるのか?まとめ
・10億版に比べて50億版の表現力は明らかにあがっており違和感が減っている
・特に英語の歌では人工知能によって補完された歌である事に気付けないレベル
・繋ぎの部分は違和感がないが学習済みの楽曲に我田引水の傾向が存在する
2.生の音声を直接生成できる人工知能の上位版の実力
「10億のパラメータを持つ人工知能は張り詰めたぁ~弓のぉ~震える弦よぉ~♪の続きを歌えるのか?」の続きなので、初見の方はリンク先を先に読んでいただけると背景がわかります。★印が私が個人的に出来が良いと思えた曲です。ノイズが多く少し音量も大きめなのでご注意ください。
1.もののけ姫の主題歌
前回の10億版で非常に印象的な結果を出していたので引き続き一曲だけ作曲して貰いました。表現力が確実に上がっている感があります。
入力として与えたイントロ部分の長さ10秒
2.耳をすませばの「カントリーロード」
耳をすませばの挿入曲であるカントリーロードは元々、英語の歌「Take Me Home, Country Roads」の日本語カバーなので、英語の楽曲しか知らないJukeboxとは親和性が高いであろうと言う事で選択してみました。
入力として与えたイントロ部分の長さ12秒
(1)★
(2)
(3)
3.Take Me Home, Country Roads
カントリーロードのカバー元であるアメリカの歌手ジョン・デンバーが1971年に発表して歌っている「Take Me Home, Country Roads」をカバーして貰いました。これが英語圏の楽曲を使ってトレーニングされた50億版jukeboxが真の実力を発揮できるシチュエーションだと思いますが、続きを聞いてみたいと思えるような曲が出来てしまっています。
入力として与えたイントロ部分の長さ12秒
(1)★
(2)
(3)
3.天空の城ラピュタの「君をのせて」
もののけ姫の主題歌と傾向が似た(トトロのあっるっこ~♪やナウシカのランランララ~♪に比べれば)、歌声がハッキリと綺麗な主題歌なので選曲してみました。ラピュタだけ数が多いラピュタ多すぎ問題が発生していますが、様々な環境で計算させて計算に必要な時間を計測したのとNo1の曲の出来に驚愕したのでバリエーションを調べて見たくなったためです。
入力として与えたイントロ部分の長さ16秒
(1)★
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
まとめ
カントリーロードの(1)がわかりやすいのですが、繋ぎの部分をごにょごにょっと違和感がないような形にして、jukebox自身が慣れ親しんでいる(英語圏の)楽曲に我田引水シフトしていく傾向が存在するので、「そうじゃなくて同じ傾向の曲として続けてみて欲しいんじゃよ!」と言う気持ちが沸きあがってきますね。
githubのページには10億版なら独自データを使ったトレーニングが出来そうな事が書いてあるのですが「データセットが均質(homogeneous)である場合(例えば、全てピアノの曲、同じスタイルの曲など)、通常、数日から1週間のトレーニングで妥当なサンプルが得られます。」との事。
・どのくらいの量の曲データで実現できるのか?
・均質とはどの程度の均質性が必要なのか?ジブリ(というか久石譲さん)からは久石譲っぽいスタイルだなって印象を感じた事がほとんどなくて均質ではない気が凄いしていて「妙に耳に残る良い曲だなと思って作曲者を調べたらJoe Hisaishi」のパターン(菊次郎の夏とか)が多いので難度が高そう。
・1週間GPU動かしっぱなしは、いざと言うときのためのお家賃として確保してある定額給付金10万円が投入される財政出動規模になる恐れ
3.50億のパラメータを持つ人工知能はどこかぁ~に君ぃ~を隠しているからぁ~♪の続きを歌えるのか?関連リンク
1)openai.com
Jukebox
2)www.ghibli.jp
もののけ姫 作品静止画
耳をすませば 作品静止画
天空の城ラピュタ 作品静止画
3)www.ponoc.jp
スタジオポノック(ジブリの元制作部門の人達が立ち上げた会社)