26-02-26-1315
この記事を閲覧するにはアカウントが必要です。

よって世界からすべての歌が消えた——
IrodoriTTSエグいて。ライン越えた感じある。これ同人音声作り放題やん。
これが全部AI。こんなものが無限に生成できる。
今人類が一つの夢を叶えました!!!!!!!(https://youtu.be/pKrG0lRka_E?si=0HqFbszRS0RtEtT8&t=906)
恐ろしいところ:
- 長尺生成に耐える:今までの機構の多くは5s以上になると破綻したが、これは30sでもまったく破綻しない
- 絵文字による完璧な感情操作
- 生成がバカ早い:24GBのVRAMだと30秒音声の生成が1秒以下で終わる。
- 音声クローンの再現度がMoeより高い
弱点:
- オーディオコピーの場合、元オーディオのテンションにかなり引っ張られる。絵文字操作よりずっと強く
- 元がプロ声優の場合問題ないが、トーシロだとトーシロ演技しか出ない。このへんはMoe(トーシロでもプロ演技が出来るがクローン力が低い)との差別化点
- 音質も引き継ぐので低音質には低音質が返ってくる
- 男の音声の精度が全体的に低い。女特化か?
- 30sまでしか生成できないっぽい
TIP:
- 長尺の音声をGradioのtrim機能で切り抜かせて使うのが良さげ
- 絵文字なしでも割と従ってくれる。文脈を付与すればオノマトペや「うふふ」みたいなのもちゃんとやってくれる。
- 😊より😆のが圧倒的に強い
記事の感想を伝えられます。
感想レターを書く
定型文を選択
スタンプを選択