インタビューの音声起こしはいつもしっちゃかめっちゃか

 

仕事でインタビューの音声起こしをよくする。

 

短い記事だと、取材時の印象・記憶をメインにして、

録音は適当にざっと聞き飛ばして書いてしまえるのだが、

ある程度のボリュームがあるとそういうわけにもいかず、

まず基本的に話している内容を

そのままタイプして文字に、文章にしていく。

 

特に本を作る時は必須作業になる。

時間が掛かり、骨が折れる、かなりしんどい作業である。

 

最近は自動音声起こしのアプリ・ソフトが出回っていて、

ざっとした内容を自動で文字にしてくれるのだが、

それですごく楽になるかというと、

正直、そうでもない。

かえって自分で手作業でやったほうが

捗る場合が往々にある。

 

もちろん、一つにはそのアプリ・ソフトの性能がある。

有料のものは精度が高く、無料は低い。

でも有料だって完璧ではないので、

結局、五十歩百歩だったりする。

 

たぶん、みんながアナウンサーみたいな喋り方で

ゆっくりめに話してくれれば、

かなり精度の高い起こし文になるんだろうが、

そんなふうに話せ、と相手に要求できるわけがない。

 

何と言っても話しているのは人間なので、

声の大きさも高さも違うし、

喋り方のクセも千差万別。

言い間違いも起こる。

やたらと倒置法を多用する人もいる。

感情が乗ってくれば早口にもなるし、

活舌の良しあしだってある。

 

結果、自動音声起こし機が打ち出す文章は

かなりしっちゃかめっちゃかになる。

 

読んでも、ここは何て言ってるんだろう?

本当にこんなこと言ってたっけ?

ということだらけで、

結局、自分で聴き直して書き直さないとわからない。

 

また、僕のやるインタビューの音声起こしは、

かなり相手の内面に入っていくことを必要とされるので、

ちゃんと録音を聴き直しながら手入力することで

言外の意図・感情が読み取れ、

どんな狙いで彼・彼女がこういうことを話しているのか、

発見できることもあって面白い。

 

ただ、淡々とした会議の議事録とか報告会みたいなものなら

自動音声起こしは機は効力を発揮すると思う。

あとは分量の問題。

この分野の機械化は結構難しい。