スポンサーリンク

iMyFone VoxBox 話者のバラエティ豊かな音声合成ソフト

動画編集

この記事にはプロモーションを含みます。

スポンサーリンク

iMyFone VoxBoxを使ってみる

今回はiMyFoneさんよりVoxBoxというソフトのレビュー依頼をいただきました。

こちら音声合成ソフトになります。

普段VOICEPEAKで動画の音声を作っている私としては、大変興味ある内容なので使ってみました。

代表的な機能

  1. 画像/PDF/テキストを音声に変換でき、70種類以上の言語に対応
  2. 3200個以上のボイスを使用して、表現力豊かなナレーションを生成
  3. 自分の声を合成して文章を読み上げることが可能
  4. 文字起こし、ボーカル抽出、形式変換、録音など便利な機能も備える
  5. MP3、WAVなど多様な出力&入力フォーマットにサポート
  6. AIで自動ラップ生成

個人的には1、2、6が気になります。

合成音声の作成

早速合成音声を作成してみます。

このソフトの基本的なインターフェイスは↓です。

1.読ませたいテキストを入力

まずは真ん中のテキストボックスに生成したい文字を入力します。

2.話者を選択

テキストを読み上げる話者を選択します。

普通の人以外にDioや悟空やオオタニさんなど色々いますが……。

オススメは日本語名の話者です。

外国人名の話者だと漢字をきちんと読んでくれないときがあるので注意です。

ひらがなだと問題ないですが、文字を全部ひらがなで打ち込むのもなかなか大変です。

ゾンビまでいますが、漢字をうまく読んでくれなくてちょっと残念でした。ただそれが逆にリアル?

また、金の冠マーク話者はプレミアム話者ということで購入しないと使用できません。

かつ発音が自然な話者は通常の5倍の文字消費となるのも注意です。

話者の横に付いているiマークにカーソルを当てて話者のステータスを確認しましょう。

3.読み方のカスタマイズをする

話者によって設定の多寡がありますが、下記のように全般・個別のカスタムできます。

個別の設定については、文字を範囲選択して各種設定をクリックすると、その範囲の文字にタグ付けされます。

VOICEPEAKのように読みをカスタムする(一時をいちじやいっときと読み変えさせるなど)ことはできないですが、効果音を入れたり強調したりと柔軟性が高いです。

ちなみに画面の左上に表示されている数字は、音声合成できる文字数と文字起こしできる残り分数となっています。

このあたりはサブスク購入制になっています。金額についてはまた後ほど。

4.出力する

一通り終わったら生成ボタンを押してファイルにして合成音声の内容を確認できます。

強化ボタンを押すとファイルの音質を向上させられますが、1回強化で1000文字の消費となります。

内容と音質がOKだったらダウンロードマークを押すことでWAV、MP3、AACで出力可能です。

こちら出力して終わりだけでなく、…マークの部分を押すとメニューが出てきます。

下書きを開く、を押すとその音声の元のテキスト、カスタムタグ、話者が画面に反映されます。

後でファイルを修正したり作り直したりするときにこの機能非常に便利です。

以上で音声合成が可能です。

続いて、代表的な機能を紹介していきます。

音声クローン

音声クローンです。

自分の声を合成音声の話者にできるというすごい機能。複数の音声サンプルを投入すると生成してくれます。

ただ、こちらは1話者につき14,000円かかる別機能です。

自分のオリジナル音声を使えて、かつ言い間違えやブレス、リップ音によるリテイクがなく動画作成できるとなるとお得なのでは?と思います。

AIラップ生成

英語限定ですが、ラップを作ってくれます。

曲はプリセットから選び、自分で歌詞を入れるスタイルです。

歌詞は自分で手入力しても良いですし、AIに自動生成してもらうこともできます。

AIに投げるラップのテーマは日本語でもOKです。ぶん投げて出てきた歌詞をインポートして生成するとできあがります。

どう使うのか迷いますが、妙に完成度が高いのでなんかに使いたいです。

文字起こし

音声ファイルを読み込ませると、テキストデータにしてくれる機能です。

試しに私の動画で使っている音声を読み込ませてみると、ほぼ正確に文字起こししてくれているので驚きです。この機能だけで1本ソフト作れるのでは?と思いました。

困った時は

作業で困った時は、画面上中央にある使い方ガイドボタンをクリックすると各機能のヘルプが出てきます。

絵中心のガイドなのでわかりやすいです。

まとめ

と、VoxBoxを一通り使いました。

私の感想はこちら。

良いところ

  1. 豊富な話者
  2. 操作が簡単
  3. 精度の高い文字起こし

気になるところ

  1. 日本語発音はVOICEPEAKのほうがナチュラル

日本語の発音はVOICEPEAKに対してやや固いかなというところがありますが、なにかの紹介やニュースの読み上げ動画などであれば充分使えると思います。

話者が限られる他のソフトに比べて、多くの話者が用意されておりバリエーションが広がります。複数の話者を出す動画作りをしている方には最適かと思います。

料金について

こちらのソフトの料金は月額サブスク、永久ライセンスと色々あります。気になる方は下記の画像をクリックしてみてください。

コメント