1.視聴者に同調して配信を盛り上げるAI Agentシステムの紹介まとめ
・配信者と対話して応援する対話型応援AI Agentに続いて、視聴者に同調して配信を盛り上げる同調型応援AI Agentのデモ
・実際に配信で使ってみた所、セットアップが難しいのと対話型と違ってタイミングが測れないので気が散ることがわかった
・モデル、及びスクリプト一式はhuggingfaceとgithubで公開済なので配信練習に使い方はどうぞ
2.視聴者同調型AI Agent
「配信を始めたばかりの頃はコメントをしてくれる視聴者の方もいないだろうし、視聴者ゼロの配信にいきなりコメントするのも勇気がいるだろうから、コメント欄が盛り上がってる風にして応援してくれるAIがいたら良いかもなぁ」という発想で開発された視聴者同調型応援をするAI Agent(gemma-3-270m_mitsuki_gguf)の紹介です。
モデルそのものは対話型応援AI Agentと同じでシステムプロンプトで切り替えているだけなので、実はllama-server形式で1モデルだけ動かしておいて2種のクライアントスクリプトからアクセスすれば同時実行できるのですが、対話型は前回紹介したので今回は同調応援型だけを動かしました。
・視聴者のコメント欄への発言に同調してコメント欄に発言してくれる機能
・配信者からの指示(驚いて!褒めて!等)に従って、コメントを投稿してくれる機能
の2つの機能があります。ある意味、やらせの側面もあるのですがテレビなどでも「あはははっ」や「へ~」のようなひな壇や観客のリアクション、録音を流す時もありますよね。あれと同じ効果を実装したのです。
youtubeはボットの自動アクセスを規約で禁止しているのですが、youtubeのサイトに直接アクセスしているわけではないのと、制限の厳しい正式なyoutube APIを使っているので問題ないだろうと考えています。
どのくらい制限が厳しいかというと、1日あたり10000のクォータ制限があるのですが、15分の事前リハーサルで4000を消費したくらいで、実質的に長時間配信は不可能なレベルです。GCPの他のリソース同様、割当を増やす申請はできるのですが、申請先がGCPではなくyoutubeになっており、何をするつもりなのかを文書で提出する必要があるのでハードルは相当高いです。
実際に配信の場で使ってみた感想としては、ミツキさんは「配信開始の挨拶」と「配信終了の挨拶」だけはしっかりできるように学習させた弊害で、配信の途中でもやたら「配信、おつかれまでした~、楽しかったです」などと配信を終わらせようとコメントをして話の流れをぶった切ってしまうので、ミツキさんのコメントに上手に対応しながら配信を続けるのは難度が高く感じました。アイキャッチ画像はそれを意図して、四方八方から配信者に「お疲れさま」とコーヒーを薦めてくるミツキさんを描いています。
そして、今回はテキストだけで合成音声を使っていないのでGPUは不要だから導入に関する敷居は低いだろうと考えていたのですが、YoutubeのAPIの有効化が思った以上に煩雑でした。
– mitsuki用のGoogleアカウント作成とyoutubeチャンネル開設
– GCP(Google Cloud)のアカウント作成
– プロジェクト作成とYouTube Data API v3を有効化、認証設定(mitsuki用のGoogleアカウントを追加)
– スクリプトに配信先チャンネルの設定してスクリプトを立ち上げ
-OBSで配信開始
IT操作に慣れている人でなければ少しセットアップは苦戦するかもしれませんが、配信に使ったスクリプトはgithubで公開してあるので、興味を持たれた方は上記の前提条件とスクリプトをgemini等にわたしてフォローしてもらいながらチャレンジしてみてください。
2つの配信応援タイプのAI Agentを作ってみたのですが、実際に使ってみた結果、どちらも導入の際の敷居が高い事を実感しました。
独自LLMを開発する事は大規模なGPUクラスターを所有せずともレンタルで可能な時代になりましたが、開発した後にそれを広めていく事を考えると、敷居はなるべく低くしなければなりません。
自社でGPUを確保してAPI形式でサービス提供するのは十分な資金力がなければ厳しいので、自己所有のGPUがないPCでも動いて、且つセットアップが簡単である事を条件に有用なサービスを考えていく必要がありますね。