NTTアドバンステクノロジ株式会社

Windows対応音声処理ソフトウェア
音声工房Custom+Macro


こちらの商品にはもれなく、サウンドファイル操作ユーティリティ .WAV Toolsが付属します

マクロ機能を搭載

音声工房 Custom+Macro(以下 +Macroと呼びます)は従来の音声工房 Customにマクロ機能が加わったものです。マクロ機能とは複数の操作をテキストファイル(マクロファイルと呼ぶ)にあらかじめ書いておくことによって、マクロを指示した後は操作メニューを選ぶことなく、一連の動作が1回の操作でできるようになる機能です。マクロファイルがあれば必ずしも音声工房全体に対して習熟しておく必要はなく、初めて音声工房に接する方でも特定の動作を行うことが可能になります。また操作の順序を並べて記述するだけではなく、操作の対象を+Macroが開いているすべての音声ファイルにすることも可能で、同じ条件による分析などは簡単に書くことができます。

このマクロ機能によって複数の処理があたかも1つのコマンドのように機能し、しかもその内容および順序はユーザの任意に設定することができます。つまり音声処理の定型化が可能になり、効率的に作業が行えるようになるのです。

以下に+Macroに標準で添付されているマクロファイルを例に、マクロ機能の実際についてご紹介します。

マクロ機能の実例

 マクロ機能によってどんなことができるか、+Macroに標準添付されているマクロ WithFSSを例にとって見てみましょう。W ithFSSは英語や日本語の発声練習・発音比較を意図したマクロファイルで、実践的なサンプルです。


# 教師(FSS)音声の波形表示・ピッチ分析・再生に続いて、
# 生徒が録音し、波形表示・ピッチ分析・再生する.
#
close
open ..\data\16k\fss_b000.wav
set_pitch female 10 hamming 30 10 180 400 0.80 300
pitch
play_wait
view_analysis
view_divided
new
window_tile
all view_divided
set_wave 16000 16 1
rec
saveas test.wav
set_pitch male 10 hamming 30 10 100 200 0.80 300
#set_pitch both 10 hamming 30 10 100 400 0.80 300
#set_pitch female 10 hamming 30 10 180 400 0.80 300
pitch
all view_divided
play
発声練習・発音比較を行う WithFSS
マクロファイルの内容
WithFSSマクロの実行結果

このマクロでは、最初に教師音声の波形ファイルを開いてピッチ分析と再生を行います。ユーザ(生徒)は教師音声を聞き終わったところで自分の発声を録音し、これもピッチ分析を行って先ほどの教師音声と並べて表示します。この結果から、教師音声との違いを視覚的に確認することができるのです。


対話による処理とマクロによる処理の手順の比較


上の図のようにWithFSSマクロでは、通常は[ファイル開く]、[ピッチ]、[再生]、[録音]、[ピッチ]、[ウィンドウ]等をユーザが順番に操作しなければならないところを、マクロファイルの指定のみで処理できます。つまり汎用的な音声分析ソフトウェアでありながら、発声練習というユーザの目的に特化した処理を記述することが可能になっています。

 もう一つ、標準添付されている別のマクロ、pitchをご紹介します。このマクロを実行すると、+Macroで現在開いているすべて音声ファイルのピッチ分析を行ってその結果をファイルに保存します。


# 音声工房で開いているすべてのファイルのピッチを計算し、結果をファイルに保存
#
# 分析パラメータを設定(設定しない場合は、現在音声工房で設定されているパラメータで計算)
set_pitch both 10 hamming 30 10 100 400 0.7 100

# すべてのファイルに対してピッチを計算し、結果をファイルに保存
# (WAVファイル名が orig.wav ならば 出力するファイル名は orig_pitch.txt)
all save_pitch %o_pitch.txt

全てのファイルに対してピッチ分析を行う pitch マクロファイルの内容


#から始まる行はコメント行ですので、実際には2行分のコマンドを記述すれば動作します。なお、分析結果の保存先ファイル名は上のように記述すれば、分析対象になる音声ファイル名から自動生成されるので重ね書きされることはありません。 他にも同様の方法である値で複数の波形の振幅正規化を行うマクロファイル normalize.txt も付属しています。

マクロ自動実行機能でさらに便利に

ここまではマクロファイルを作成することによってユーザが指定した時に、一連の動作が実行されることをご紹介してきました。+Macroではさらにそのつどマクロファイルを指定することなく、特定の動作の前後に自動的に実行されるマクロを設定することもできます。これをマクロ自動実行機能と呼びます。特定の動作とは、

  • 新規ファイルの作成
  • ファイルを開く
  • 上書き保存/名前を付けて保存
  • 録音

を指します。あらかじめ設定しておくことで、これらの動作が実行される直前または直後に指定のマクロを実行することができます。 この機能により例えば、

  • ファイルを開いた後でソナグラムも表示する
  • 保存する前に、変更前の波形のバックアップファイルを作成する
  • 録音後に振幅正規化を行う

などの動作ができるようになります。一度設定しておけば毎回マクロが実行されるので、手間が省けます。また完全に定型的な処理で結果を目視する必要もない場合は、希望する処理を行うマクロをファイルを開いた後で実行するようにセットしておきます。その後は処理したいファイルをWindowsエクスプローラなどから+Macroにドロップするだけで、処理が完了します。

マクロ機能以外の新規機能

+Macroではマクロ機能以外にも次のように便利な新しい機能が盛り込まれています。

  • 音声情報のラベリングに利用できる、マーカー編集機能
  • ピッチとホルマントなど複数の分析結果の比較/印刷が容易になる、全分析結果表示機能
  • 選択した任意の矩形区間を拡大できる、矩形拡大モード機能
その他の主な機能紹介

音声工房Custom+Macro画面

1.ユーザ処理コマンド
ユーザーが作成、定義したWindowsアプリケーションを登録し、音声工房Customから起動することができます。デフォルトとして弊社で作成した帯域通過フィルタ、FIRフィルタ、標本化周波数変換、雑音重畳のアプリケーションを登録してあります。
コーデックなどユーザ独自のアプリケーションを登録すれば、ユーザー独自の音声処理系にカスタマイズすることができます。
2.連続再生
種々の条件の音声を比較受聴したり、いろいろな音声を適当な順序で連続的に再生することができます。
各音声をランダム順序に呈示する、対比較やXAB比較などのために音声を組として扱う、各音声間へ無音区間を挿入する、作成した連続再生音声を再生する、ファイルへ保存する、ファイル順序をテキストデータに書き出すことができます。
3.音声波形編集
  • 音声の録音・再生、音声データファイルの読み込み/保存、音声の編集(切り取り、写し取り、挿入、上書き、加算等)ができます。音声波形の印刷もできます。
  • マーカーの設置/移動/削除/ラベル名の付与が可能で、マーカーの設置情報をファイルに保存し、また読み込むことができます。
4.信号処理
  • 指定区間の音声パワーを測定してdBV単位で表示します。(波形実効値 10000 を 0 dBV にしています)
  • 音声データの振幅をdB単位で変更、dBV単位で正規化することができます。
  • 指定区間のオフセット除去、位相反転ができます。
  • ステレオデータに対して、両チャンネルの交換、指定チャンネルに遅延を与えることができます。
  • 正弦波、雑音、無音の信号を作成し、音声データに挿入/上書き/加算ができます。
  • 指定箇所の話速(発声速度)を、0.2~5.0倍の範囲で変更することができます。
  • 指定箇所のピッチ(声の高さ)を、0.5~2.0倍の範囲で変更することができます。
5.パワー包絡分析
表示された音声データに対しパワーの時間変化を表示します。 
パワー包絡分析画面
6.ピッチ分析
表示された音声データに対しピッチ(基本周波数)の時間変化を表示します。
分析結果のファイルへの保存、分析画面の印刷ができます。
ピッチ分析画面
7.スペクトル分析
音声波形のある時点の瞬時スペクトルまたはある区間の平均スペクトルを求めることができます。FFTによるパワースペクトルとLPCによるスペクトル包絡を抽出、表示します。
分析結果のファイルへの保存、分析画面の印刷ができます。
また、波形をクリックした時点で瞬時にスペクトルを表示する、リアルタイムスペクトル機能もあります。
スペクトル分析画面
8.ソナグラム分析
表示された音声データに対しソナグラムを抽出し、カラー表示またはモノクロ表示します。
ソナグラムとは、横軸に時間、縦軸に周波数(音の高さ)、色で音の強さを表し音声を視覚化したものです。日本語では声紋と呼ばれます。
ソナグラム分析画面
9.ホルマント分析
表示された音声データに対しホルマントを抽出し、ホルマント周波数の時間変化を表示します。
ホルマントは音声波形のスペクトルの中で、特にエネルギーが集中している周波数成分で、声道の共鳴周波数をあらわします。
単独表示またはソナグラム分析結果上に表示することができます。分析結果のファイルへの保存、分析画面の印刷ができます。
ホルマント分析画面
10.3Dスペクトル表示
表示された音声データに対しスペクトルの時間変化を3D的に表示します。スペクトル分析法はFFTまたはLPCが選択できます。
3Dスペクトル画面
機能、性能
バージョン Ver.4.0
動作環境 OS:Windows2000/XP/Vista、CPU:PentiumIII以上、主記憶:256MB以上、ハードディスク:空き領域1GB以上を推奨、サウンドデバイス:Windows対応のもの
データ形式 WAVE形式(Windows標準)、RAW形式(ラベルなし、ベタ形式)
波形表示 複数波形表示可能、全体/部分 表示、絶対/相対振幅 表示、スクロール表示可能、振幅拡大表示、ズームイン/ズームアウト、波形+全分析結果表示可能
波形編集 切り取り/写し取り、挿入/上書き/加算/クロスフェード
マーカー編集 マーカー設置/移動/削除/ラベル名付与、マーカーファイル保存/読込
録音再生 8または16ビット、40Hz~96kHz、2CH可、全体/部分再生、逆方向再生可能、録音前の波形モニタ可能、再生箇所をカーソル表示
連続再生 可能
信号処理 パワー測定、振幅変更・最適振幅変更、振幅正規化、位相反転、ステレオ遅延、ステレオCH交換、オフセット除去、信号作成(純音/無音/雑音)、上下バイト入れ換え、話速変換、ピッチシフト、フェードイン・フェードアウト
音声分析 ピッチ、パワースペクトル、スペクトル包絡、ソナグラム、ホルマント、平均スペクトル、ホルマント on ソナグラム、log周波数スペクトル、3Dスペクトル表示、リアルタイムスペクトル
ファイル出力 パワー包絡、ピッチ、スペクトル、平均スペクトル、ソナグラム、ホルマント、線形予測係数等
印刷 1波形 or 1分析結果 or 全分析結果を詳細印刷可
ユーザ処理 組み込み可能(帯域通過フィルタ、FIRフィルタ、標本化周波数変換、雑音重畳、帯域阻止フィルタ、エコーを付属)
マクロ 一連の処理手順および開いているファイルに対して同一処理を行うことが可能(教師音声の波形表示・ピッチ分析・再生に続いて、生徒が録音し波形表示・ピッチ分析・再生するマクロ、すべてのファイルを-10dBVにて振幅正規化するマクロ等を付属)
価格
標準価格 ¥165,900(税込)
音声工房LongDataとセットでご購入いただくとお得です
ご注文方法
ただし請求書払いをご希望される場合は、下記お問い合わせ窓口へ電話、FAX、E-mailにてご連絡ください。
お問い合わせ
NTTアドバンステクノロジ株式会社 音声工房担当/話速工房担当
〒210-0007 神奈川県川崎市川崎区駅前本町12-1 川崎駅前タワーリバークビル13F
TEL:044-220-2131(10:00~17:30) FAX:044-220-2025
音声工房 E-mail: sp4win@ntt-at.co.jp
話速工房 E-mail: ssc-support@ntt-at.co.jp
セキュリティポリシープライバシーポリシー個人情報の取り扱いについて