努力したWiki

推敲の足りないメモ書き多数

ユーザ用ツール

サイト用ツール


Action disabled: source
documents:voiceroid:seikacenter:seikacenter-003

SeikaSay の説明

概要

20190327/cでの説明となります。

SeikaSay コマンドは SeikaCenter を利用するためのインタフェースプログラムです。SeikaCenterAPI.DLLを利用しています。

cidが2000のVOICEROID2話者を発声させる最少の記述は以下となります。

seikasay -cid 2000 -t "これは音声発声のテストです"

その他オプションは以下のようになります。

E:\seikacenter\sandbox>seikasay
seikasay command Version:20190327/u cli, DLL Version:20190327/u asm


print informations:
  seikasay [-list | -cid ID -params | -cid ID -current]
options:
    -list       : print speaker list.
    -params     : print default effect parameters.
    -current    : print current effect parameters.

call TTS system:
  Use argument mode:
    seikasay -cid ID [-save filename ] [ [option [option [option [.... [option ] ] ] ] ] ] -t TalkText
  Use standard input mode(shift jis encoding):
    seikasay -cid ID [-savepath path ] [ [option [option [option [.... [option ] ] ] ] ] ] -stdin
  Use file input mode(utf-8 encoding no BOM):
    seikasay -cid ID [-savepath path ] [ [option [option [option [.... [option ] ] ] ] ] ] -f TextFile

Common Options:
    -cid         ID  : select speaker.
    -save        FILE: save voice.            FILE = wave file name
    -savepath    PATH: save path.             PATH = wave file save path

SAPI5 speaker options:
    -volume      VOL : sound volume.          VOL =    0 ~ 100 default 100
    -speed       SPD : play rate.             SPD =  -10 ~  10 default 0

VOICEROID2/VOICEROID+EX speaker options:
    -volume      VOL : sound volume.          VOL =  0.00 ~ 2.00 default 1.00
    -speed       SPD : play speed.            SPD =  0.50 ~ 4.00 default 1.00
    -pitch       PCH : play pitch.            PCH =  0.50 ~ 2.00 default 1.00
    -intonation  ITN : play intonation.       ITN =  0.00 ~ 2.00 default 1.00
    -emotion KEY VAL : add emotion.           VAL =  0.00 ~ 1.00 default 0.00
                                              Example: -emotion "喜び" 0.8
Use CeVIO speaker options:
    -volume      VOL : sound volume.          VOL =  0 ~  100 default 50
    -speed       SPD : play speed.            SPD =  0 ~  100 default 50
    -pitch       PCH : play pitch.            PCH =  0 ~  100 default 50
    -alpha       ALP : play alpha.            ALP =  0 ~  100 default 50
    -intonation  ITN : play intonation.       ITN =  0 ~  100 default 50
    -emotion KEY VAL : add emotion.           VAL =  0 ~  100 default 0
                                              Example: -emotion "喜び" 100


E:\seikacenter\sandbox>

オプション説明

seikasayコマンドに指定するオプション -cid は必ず最初に指定します。
次にオプション -t, -stdin, -f のいずれかのオプションが有効になっている必要があります。

コマンド 内容
seikasay -cid 2000 -volume 1.3 -t “発声しましたか?” “これは音声発声のテストです。” “発声しましたか?これは音声発声のテストです。” を発声する。
seikasay -cid 2000 -volume 1.3 -stdin ※標準入力から入力されたテキストで発声する。
seikasay -cid 2000 -volume 1.3 -f words.txt words.txt の内容を1行ずつ発声する。UTF-8 BOM無しのテキストファイル。

cidはSeikaCenterの画面でも確認できますし、-list オプションで確認する事もできます。この環境では2000が琴葉茜を指し、2003が京町セイカ、1700が京町セイカ+EX、3000がさとうささら、5000が鳴花ヒメを指しています。

G:\SeikaCenter\sandbox>seikasay -list
cid   speaker
----- ---------------------------
 2000 voiceroid2 - 琴葉 茜
 2001 voiceroid2 - 琴葉 葵
 2002 voiceroid2 - 民安ともえ(v1)
 2003 voiceroid2 - 京町セイカ(v1)
 2004 voiceroid2 - 結月ゆかり(v1)
 2005 voiceroid2 - 東北ずん子(v1)
 2006 voiceroid2 - 京町セイカ(v1) - どよーん
 1700 voiceroid - VOICEROID+ 京町セイカ EX
 3000 cevio - さとうささら
 3001 cevio - すずきつづみ
 3002 cevio - タカハシ
 3003 cevio - ONE
 4000 bouyomichan - 女性1
 4001 bouyomichan - 女性2
 4002 bouyomichan - 男性1
 4003 bouyomichan - 男性2
 4004 bouyomichan - 中性
 4005 bouyomichan - ロボット
 4006 bouyomichan - 機械1
 4007 bouyomichan - 機械2
 5000 gynoid - 鳴花ヒメ
 5001 gynoid - 鳴花ミコト
 1000 sapi - Microsoft Haruka Desktop
 1001 sapi - CeVIO-さとうささら
 1002 sapi - CeVIO-すずきつづみ
 1003 sapi - CeVIO-タカハシ
 1004 sapi - Microsoft David Desktop
 1005 sapi - Microsoft Zira Desktop
 1006 sapi - CeVIO-ONE
 1400 speechplatform - Microsoft Haruka Desktop
 1401 speechplatform - CeVIO-さとうささら
 1402 speechplatform - CeVIO-すずきつづみ
 1403 speechplatform - CeVIO-タカハシ
 1404 speechplatform - Microsoft David Desktop
 1405 speechplatform - Microsoft Zira Desktop
 1406 speechplatform - CeVIO-ONE
----- ---------------------------

G:\SeikaCenter\sandbox>

他のオプションは以下の通りです。

オプション 説明
-save WaveFile WaveFile で示すファイルに音声データ(Wav形式)を書き出します。絶対パスでの指定をしてください。
-savepath Path 標準入力時およびファイル入力時、Path で示すフォルダに音声データ(Wav形式)を書き出します。
そのフォルダの下にファイル名 「“SAY”+数字連番_cid+“.wav”」で保存します。フォルダは絶対パスで指定してください。
-volume P 音量 Pを指定します。
-speed P 話速(速さ) Pを指定します。
-pitch P 高さ Pを指定します。
-alpha P 声質 Pを指定します。
-intonation P 抑揚 Pを指定します。
-emotion eP P 感情パラメタ eP に P を設定します。

VOICEROID2,CeVIO,SAPIではそれぞれ指定可能なオプションと指定する値が異なるので注意してください。
簡単な範囲チェックはしていますが、例えば VOICEROID2 のオプション -speed で 0.559 なんて指定した場合はたぶんエラーになるので、あまりイレギュラーな指定はしないでください。順次修正していきます。

オプションの数値範囲。

オプション VOICEROID2 VOICEROID+EX CeVIO SAPI 棒読みちゃん ガイノイドTalk
-volume 0.00 ~ 2.00 0.00 ~ 2.00 0 ~ 100 0 ~ 100 0 ~ 100 0.00 ~ 2.00
-speed 0.50 ~ 4.00 0.50 ~ 4.00 0 ~ 100 -10 ~ 10 50 ~ 200 0.50 ~ 4.00
-pitch 0.50 ~ 2.00 0.50 ~ 2.00 0 ~ 100 - 50 ~ 200 0.50 ~ 2.00
-alpha - - 0 ~ 100 - - -
-intonation 0.00 ~ 2.00 0.00 ~ 2.00 0 ~ 100 - - 0.00 ~ 2.00
-emotion 0.00 ~ 1.00 - 0 ~ 100 - - -

VOICEROID2ではスタイル、CeVIOでは感情・コンディションと説明されている、感情のパラメタを指定するオプションが -emotion になります。

感情パラメタには名前がついています。この名前をそのまま指定する事になります。

記述 説明
seikasay -cid 3000 -emotion “元気” 50 -t “さとうささらは元気です” CeVIO さとうささら の元気パラメタを指定
seikasay -cid 3000 -emotion “哀しみ” 50 -t “さとうささらは哀しいです” CeVIO さとうささら の哀しみパラメタを指定
seikasay -cid 3000 -emotion “クール” 100 -t “さとうささらはクールなのです” CeVIO すずきつずみ のクールパラメタは指定しても無効
seikasay -cid 3000 -emotion “元気” 0 -emotion “哀しみ” 100 -t “さとうささらはとても哀しいのです” CeVIO さとうささら の元気・哀しみパラメタを指定
seikasay -cid 2000 -emotion “喜び” 1.00 -t “茜ちゃん元気ー!” VOICEROID2 琴葉茜 の喜びパラメタを指定
seikasay -cid 2000 -emotion “怒り” 1.00 -t “茜ちゃん激オコー!” VOICEROID2 琴葉茜 の怒りパラメタを指定
seikasay -cid 2000 -emotion “クール” 1.00 -t “茜ちゃん超クール” CeVOI すずきつづみ のクールパラメタは指定しても無効
seikasay -cid 2000 -emotion “悲しみ” 0.7 -emotion “怒り” 0.3 -t “茜ちゃんしんみり” VOICEROID2 琴葉茜 の悲しみ・怒りパラメタを指定

話者が対応していない感情パラメタを適用することはできません。たとえば すずきつづみ の感情パラメタ“クール”をさとうささらに指定しても有効になりません。さとうささらは“クール”に対応していないからです。
東北イタコの感情パラメタ“セクシー”を琴葉茜に指定してもセクシーボイス茜ちゃんにはなりません。琴葉茜は“セクシー”に対応していないからです。

利用可能な感情パラメタは、SeikaSayコマンドの -params オプションで確認できます。
cidが3000のさとうささらは、元気,普通,怒り,哀しみ、の4つの感情パラメタを持っています。

G:\SeikaCenter\sandbox>seikasay -cid 3000 -params
cid:3000
---------------------------------
effect   : volume         = 50 [0.0~100.0, step 1.00]
effect   : speed          = 50 [0.0~100.0, step 1.00]
effect   : pitch          = 50 [0.0~100.0, step 1.00]
effect   : alpha          = 50 [0.0~100.0, step 1.00]
effect   : intonation     = 50 [0.0~100.0, step 1.00]
emotion  : 元気             = 100 [0.00~100.0, step 1.00]
emotion  : 普通             = 0 [0.00~100.0, step 1.00]
emotion  : 怒り             = 0 [0.00~100.0, step 1.00]
emotion  : 哀しみ            = 0 [0.00~100.0, step 1.00]
---------------------------------

G:\SeikaCenter\sandbox>

cidが2000の琴葉茜は、喜び,怒り,悲しみ、の3つの感情パラメタを持っています。

G:\SeikaCenter\sandbox>seikasay -cid 2000 -params
cid:2000
---------------------------------
effect   : volume         = 1 [0~2, step 0.01]
effect   : speed          = 1 [0.5~4, step 0.01]
effect   : pitch          = 1 [0.5~2, step 0.01]
effect   : intonation     = 1 [0~2, step 0.01]
emotion  : 喜び             = 0 [0~1, step 0.01]
emotion  : 怒り             = 0 [0~1, step 0.01]
emotion  : 悲しみ            = 0 [0~1, step 0.01]
---------------------------------

G:\SeikaCenter\sandbox>

cidが1700の京町セイカ+EXは、感情パラメタを持っていません。

G:\SeikaCenter\sandbox>seikasay -cid 1700 -params
cid:1700
---------------------------------
effect   : volume         = 1.00 [0.0~2.0, step 0.01]
effect   : speed          = 1.00 [0.5~4.0, step 0.01]
effect   : pitch          = 1.00 [0.5~2.0, step 0.01]
effect   : intonation     = 1.50 [0.0~2.0, step 0.01]
---------------------------------

G:\SeikaCenter\sandbox>

標準入力

-stdin が指定される場合、標準入力からの入力と判断されます。以下はWindowsで作成したSJISテキストファイルtalk.txtに記述された2行「夜ふかしは」「からだに悪いですよ。」を発声します。

E:\seikacenter\sandbox>dir
 ドライブ E のボリューム ラベルは CCER です
 ボリューム シリアル番号は 7ECE-5660 です

 E:\seikacenter\sandbox のディレクトリ

2018/10/02  09:35    <DIR>          .
2018/10/02  09:35    <DIR>          ..
2018/09/24  01:17            10,240 SeikaCenterAPI.dll
2018/10/01  04:14            17,920 seikasay.exe
2018/10/02  09:37                34 talk.txt
               3 個のファイル              28,194 バイト
               2 個のディレクトリ  219,942,924,288 バイトの空き領域

E:\seikacenter\sandbox>type talk.txt
夜ふかしは
からだに悪いですよ。

E:\seikacenter\sandbox>type talk.txt | seikasay -cid 2000 -emotion "悲しみ" 0.8 -stdin

E:\seikacenter\sandbox>

引数に -savepath オプションを付与すると、入力した1行単位で音声保存ができます。生成されたテキストファイルは utf-8エンコーディングになっています。

E:\seikacenter\sandbox>type talk.txt | seikasay -cid 2000 -emotion "悲しみ" 0.8 -savepath E:\seikacenter\sandbox -stdin 

E:\seikacenter\sandbox>dir
 ドライブ E のボリューム ラベルは CCER です
 ボリューム シリアル番号は 7ECE-5660 です

 E:\seikacenter\sandbox のディレクトリ

2018/10/02  09:40    <DIR>          .
2018/10/02  09:40    <DIR>          ..
2018/10/02  09:39                17 SAY000001_2000.txt
2018/10/02  09:39           126,172 SAY000001_2000.wav
2018/10/02  09:40                32 SAY000002_2000.txt
2018/10/02  09:40           175,564 SAY000002_2000.wav
2018/09/24  01:17            10,240 SeikaCenterAPI.dll
2018/10/01  04:14            17,920 seikasay.exe
2018/10/02  09:37                34 talk.txt
               7 個のファイル             329,979 バイト
               2 個のディレクトリ  219,942,617,088 バイトの空き領域

E:\seikacenter\sandbox>

chcpコマンドで、標準入力の文字コードを確認できます。以下はSHIFT-JISの時です。

E:\seikacenter\sandbox>chcp
現在のコード ページ: 932

E:\seikacenter\sandbox>

以下はUTF-8の時です。

E:\seikacenter\sandbox>chcp
Active code page: 65001

E:\seikacenter\sandbox>

ファイル入力

-f オプションでファイルを指定するとそのファイルの1行毎を発声します。-savepath オプションで音声が保存されます。以下はWindowsで作成したUTF-8のテキストファイルtalk.txtを指定し音声保存させた例です。

E:\seikacenter\sandbox>dir
 ドライブ E のボリューム ラベルは CCER です
 ボリューム シリアル番号は 7ECE-5660 です

 E:\seikacenter\sandbox のディレクトリ

2018/10/16  17:14    <DIR>          .
2018/10/16  17:14    <DIR>          ..
2018/10/16  16:20            22,016 SeikaCenterAPI.dll
2018/10/16  10:08             5,800 SeikaCenterAPI.xml
2018/10/16  15:30            18,944 seikasay.exe
2018/10/16  17:15               602 talk.txt
               4 個のファイル              47,362 バイト
               2 個のディレクトリ  199,571,509,248 バイトの空き領域

E:\seikacenter\sandbox>seikasay -cid 2000 -savepath E:\seikacenter\sandbox -f talk.txt
会場の周辺には、原宿駅や、代々木駅もあるし、ちょっと歩けば、新宿御苑駅もある。
老人ホームの場合は、健康器具や、ひざ掛けだ。
ちょっと遅い昼食をとるため、ファミリーレストランに入ったのです。
嬉しいはずが、ゆっくり寝てもいられない。
自然の研究者は、自然をねじ伏せようとしてはいけない。
おごりを捨て、謙虚な姿勢を取り戻さねば、冬は過ごせない。
先だって、ごく短期間だが、久方ぶりに、ヨーロッパへ行った。

E:\seikacenter\sandbox>dir
 ドライブ E のボリューム ラベルは CCER です
 ボリューム シリアル番号は 7ECE-5660 です

 E:\seikacenter\sandbox のディレクトリ

2018/10/16  17:17    <DIR>          .
2018/10/16  17:17    <DIR>          ..
2018/10/16  17:17               119 SAY000001_2000.txt
2018/10/16  17:17                46 SAY000001_2000.wav
2018/10/16  17:17                68 SAY000002_2000.txt
2018/10/16  17:17                46 SAY000002_2000.wav
2018/10/16  17:17                98 SAY000003_2000.txt
2018/10/16  17:17                46 SAY000003_2000.wav
2018/10/16  17:17                62 SAY000004_2000.txt
2018/10/16  17:17                46 SAY000004_2000.wav
2018/10/16  17:17                80 SAY000005_2000.txt
2018/10/16  17:17                46 SAY000005_2000.wav
2018/10/16  17:17                86 SAY000006_2000.txt
2018/10/16  17:17                46 SAY000006_2000.wav
2018/10/16  17:17                89 SAY000007_2000.txt
2018/10/16  17:17                46 SAY000007_2000.wav
2018/10/16  16:20            22,016 SeikaCenterAPI.dll
2018/10/16  10:08             5,800 SeikaCenterAPI.xml
2018/10/16  15:30            18,944 seikasay.exe
2018/10/16  17:15               602 talk.txt
              18 個のファイル              48,286 バイト
               2 個のディレクトリ  199,571,509,248 バイトの空き領域

E:\seikacenter\sandbox>

音声保存時の注意

オプション -save、-savepath を使う際の注意。

指定するフォルダ名、ファイル名は絶対パスで指定してください。音声保存処理は SeikaCenterが実行するので、相対パスの場合、SeikaCenter 基準で保存先が決められてしまいます。

documents/voiceroid/seikacenter/seikacenter-003.txt · 最終更新: 2019/07/24 18:26 by k896951

ページ用ツール