フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで |
|
|
著者: 荒木 雅弘 定価: ¥ 3,570 | まずはこれ.パターン認識・機械学習の初学書 ![]() ![]() ![]() ![]() ![]() 「音声認識システム」というタイトルが誤解を招きやすいが, パターン認識,機械学習の初歩を解説している初学書. まえがきに書かれているとおり,学部3年生を対象にしているため, イメージを重視して,わかりやすく書かれている. 前提知識がなくても全部を読むことができ,ほとんどをすんなり理解 できるだろう.よく書かれている. 研究室配属になった学生にぽんと渡して予習したり,講義についてい けない場合のフォローに役に立つと思われる. これを読んでおけば,いきなりとっかかるとつまずくような入門書も すんなり読めるようになるだろう. 音声認識システムには言語モデルも使われるが,隠れマルコフモデル, 文脈自由文法,N-gramという代表的な言語モデルを網羅しているのも 個人的には気に入っている. 評価法についての解説もある.内容のバランスがとてもいい. また本書ではHTK,Weka,Palmkit,Julius/Julian,Galateaなどのフリー ソフトの簡単な使いかたも解説しているが,研究をしていて意外に時間 を食うのが,こういったツールのとっかかりだったりする. そういう意味では,結果を出すまでの使いかたが解説されているのは非常に ありがたい. 著者が目標としているとおり,今まで入門書とされていた本の前に読むことで すんなり入れるようにするための書. 音声認識,パターン認識,機械学習といった分野に興味があるが, 何から読んでいいかわからない,という人にはまずこれを薦めたい. 「わかりやすいパターン認識」の前にどうぞ. |
|
| |
よくわかる音声 (日本語教師・分野別マスターシリーズ) |
|
|
著者: 松崎 寛,河野 俊之 定価: 価格:→¥ 1,750 | 丁寧な解説 ![]() ![]() ![]() ![]() ![]() とにかく、丁寧! 日本語教師を目指そうという人には面白いと思うかもしれないが、私のようにこの本を読む前にどこかでちょっとだけかじっているような人は、すべてわかった気にさせられてしまう。 ちゃんと読めばちゃんとよくわかります。 音声の救世主 ![]() ![]() ![]() ![]() ![]() この本を読む前は、他の本で勉強していましたが、全く分からずでした、、、でも、この本を読んでから、4日で読み終わり、音声がすごく分かるようになりました! 何度もこの本を読めば、音声は、問題ないと思います。超おすすめ!! 非常にわかりやすい ![]() ![]() ![]() ![]() ![]() よくわかるシリーズの中では、とてもわかりやすい本だと思う。<br>特によくわかるシリーズの「言語学」の本がレベル的に<br>ぴったりだった人には特に良いと思う。本当の初心者向けであり<br>基本から丁寧に解説がされているほうだと思う。<br>また、問題の量や配置が完全初心者にとっては最適だと思う。<p>他の本で音声学を学んだ人にとっては、いきなり問題に挑戦し<p>できなかった箇所を復習するにはとても良い本だと思う。<p>基本から応用までこれをびっちり覚えることによって<br>検定試験にも十分対応ができるレベルまで到達できると思う。 |
|
| |
ディジタル音声処理 (ディジタルテクノロジーシリーズ (6)) |
|
|
著者: 古井 貞煕 定価: 価格:→¥ 1,949 | これからデジタル音声処理をはじめるならこれ! ![]() ![]() ![]() ![]() ![]() 本の内容は最新ではありませんが、これからデジタルでの音声処理を行うための基本的な事が詳しく説明されており、説明している分野も広いです。<br>私もこの本からはじめました。少し古い本ですけど、説明は非常にわかりやすいと思います。 |
|
| |
AmiVoice Es 2008 USBマイク同梱版 |
|
|
製作: エムシーツー 定価: 価格:→¥ 22,072 | 執筆に使っています。 ![]() ![]() ![]() ![]() ![]() 本を書くために思い切って購入してます。使ってみると、音声の認識も非常にスムーズで、快適に利用できます。認識しにくい単語も辞書登録することで簡単に対応ができます。また、最初に例文を読み上げて学習させる必要もないので、その日からすぐに使い始めることができます。非常に満足のいくソフトウェアです。 ちなみにこの文章も AmiVoice で書いています。50(←誤字)もこの程度ですもので十分実用に耐えられます。 タイピングソフトを買えばよかった・・・ ![]() 14万円の医療用を買うお金がなく、忙しい外来業務で使えるかと思って一般用を購入した医師です。残念ながら医療用語を無限に入力してユーザー辞書を作る必要があり、変換効率が悪すぎます。期待していた分がっかりです。一般の使用に関しても自分的にはいまいちです。この購入代金をタイピングソフトの購入にあててブラインドタッチを改善させた方がよかったと後悔しています。腱鞘炎になってタイプができないときにはいいかもしれません。 満足のいく商品です。 ![]() ![]() ![]() ![]() Amazonで二件の高評価を得ていたのですが、他のサイトをみると「つかいものにならない」との評価がありました。不安をおぼえながらも購入を決意。結論から言えば「使いものになります」といったところです。値段相応以上です。ちなみに変換例を次にあげておきます。(説明書の最初を読んでみました。括弧内が誤変換です) 音声認識技術が、研究され始めてからおよそ30年が経ちました。 SF 映画やアニメの世界では気軽に声でメール(命令)したり、ロボット対話したりという強い(シーン)も沢山見かけます。ほとんどの人々が近い将来、自分の声ですべてのコンピューターを制御するような時代が来ることを信じていると思います。 あと説明書が薄くわかりやすいことも良い点です。また不思議なことですが正確丁寧に発音を心がけるよりスラスラ読んだほうが認識率はいいです。 |
|
| |
Dragon Naturally Speaking 05 Select 日本語版 |
|
|
製作: ニュアンス コミュニケーションズ 定価: 価格:→¥ 14,719 | かなりいい ![]() ![]() ![]() ![]() ![]() このシリーズがバージョンアップするたびに買い換えているが、かなり認識率が上がったように思える。 ただ、CPUの速度に依存するような感じもあるので、最低2Gは必要だろう。 |
|
| |
ViaVoice for Windows Pro V10.5 日本語版 |
|
|
製作: ニュアンス コミュニケーションズ 定価: 価格:→¥ 15,343 | 読み上げには役に立つ ![]() ![]() ![]() ![]() ![]() 私も昔、ViaVoiceゴールドというソフトを購入して、そのあまりの認識率の悪さに、全く使うこともなく捨ててしまいました。しかし最近翻訳の仕事があり、音声入力も進歩したのではないかと思いViaVoiceについて調べてみました。そうしたらかなり好意的な評価が多かったので、購入することにしました。 その結果わかったことは、ViaVoiceには適した分野と適してない分野があるということです。もっとも適しているのは、すでにある文書を読み上げる場合です。この場合はワープロ検定一級とかギネスブック並みの速さという宣伝も嘘ではありません。私はタッチタイプができないので、長文を入力する場合、視線がキーボードと画面を行き来し、非常に疲れます。このような状況の場合ViaVoiceは非常に役に立ちます。 つぎに役に立つのは、日記とかメールの作成です。このような簡単な文章は、口をついて出てくるので、入力が容易です。しかし翻訳のような仕事にはあまり向いていないと思います。というのは、英文を読んで、長い間考えて、ポツッと一つの文書が出てきます。それも完全な文章ではなく、推敲を必要とするような文章です。しかも考えてる間に、無意識に「ああ」とか「うう」とかいう意味のない言葉が出て、それが意味のない文章に変換されてしまいます。これはかなりストレスです。それからもうひとつの問題は、長文を入力していると、そのうちに反応しなくなることです。 ちなみにこの文章はViaVoiceで入力しました。 予想以上の性能 ![]() ![]() ![]() ![]() ![]() 今から約10年前、我が家に初のPC(IBM社製)が来ました。 そのPCに、当時のViaVoiceの体験版(?)が付属していました。 声でPCが操作できるなんて近未来的だな〜と思い、試してみましたが、当時の性能では認識できても誤変換が多く、正直言って実用には適していませんでした。 そして最近、ふとViaVoiceの名前を思い出し、検索してみると、Ver.10.5まで出ていました。 10年前のワクワクがよみがえり、早速購入。色々と設定し、使い始めると・・・素晴らしい! 音声の認識精度はさることながら、莫大な量の文章を解析しているだけあって、文脈に合った同音異義語もきちんと選んでくれています。 固有名詞などもあとからどんどん追加できますし、入力した文章をさらに解析してくれますので、使い込むほど使いやすくなります。 キーボードで文章を全て打ち込むよりもスピードは飛躍的に上がりますし、肩凝りなどの疲労もかなり減らせます。 長い文章を打ち込むことが多い方は、購入を考えてみてはいかがでしょうか? 十分に使えます。 ![]() ![]() ![]() ![]() ![]() A4で25枚分の文章(記述式アンケート)を、このソフトで入力しましたが、私の場合9割以上の認識率でした。正直驚きました。私のワープロソフトは一太郎ですが、違和感なく操作できました。ワード派なら、さらに使い勝手位はよいものと思われます。 どうしてもキーボードから目が離れない厄年の私にとって、このソフトはまさに救世主。仕事の能率がとても上がりました。 ただ、職場でディスプレーに向かってぶつぶつ喋っているのは、どこか変ですが、……。 |
|
| |
携帯電話用ワンプッシュコール au用 |
|
|
製作: エクセルエンジニアリング 定価: 価格:→¥ 2,981 | |
|
| |
送料無料★ベテラン添乗員が考案した、音声付翻訳手帳『おしゃべり紀行(ワールド編)』 |
|
|
製作: コモライフ 定価: | |
|
| |
TANITA 体組成計音声インナースキャン BC-200 |
|
|
製作: ビッグフィールド 定価: | |
|
| |
Victor CN-2010A 接続コード 0.3m |
|
|
製作: ビクター 定価: 価格:→¥ 540 | |
|
| |
PS3用/PS2用『D端子ケーブル+音声ケーブル』 |
|
|
製作: ゲームテック 定価: ¥ 1,880 | 買ってはいけない ![]() このケーブルで1125i,720p出力を行ったところ 画面が波打つという症状がでました。 普通の525iではそのような症状はでませんでした。 もし,高解像度で出力するためにこのケーブルを買おうとしている人がいたら買ってはいけません。 やはり値段なりの品質だということなんでしょう。 事実上480pまで、それ以上は使い物にならない ![]() PS3で使用するため購入、安いけどAV機器に激安で有名なカモンのケーブルも使ってますので大丈夫だろうと思ったらD3(1080i)だとゴーストが半端じゃ無い位出ます。XMBのアイコンですら単一色に見えない始末。はっきり言ってカモンの5mケーブルの方が超高級品に思える品質。 フェアライトコアが付いてないしケーブルも細いので、シールド性が弱くて折り返しノイズをまともに受けてる感じです。 仕方ないのでPS2に刺してある別メーカーのD端子ケーブルに差し替えたらまともな画質になりました。その代わりPS2の解像度であるD2(480p)程度なら問題無さげです。 格段の違い(PS2での使用) ![]() ![]() ![]() ![]() ![]() 確かに本体には少しきつく、差しにくい感じがしました。 しかし、それ以外は十分です。 画像が格段によくなります。(液晶40型テレビ) いまだに、PS2のソフトがたくさん出ているので、PS3の40Gしか持っていない私には必需品でした。 普通の端子での大画面テレビでの使用が画像が粗すぎたからです。 買って大正解でした。 ちなみにPS3はHDMI端子でつないでいます。 |
|
| |
世界のナベアツ 3の倍数の時アホになる音声電卓 |
|
|
製作: エハラ 定価: 価格:→¥ 1,550 | オモローな電卓 ![]() ![]() ![]() ![]() [3]、[6]、[9]を押したときにアホな音声が出て、[=]を押したときに「オモロー」と音声が出ます。ただそれだけなのはナベアツと一緒なのでそこがオモローです。 計算結果が3の倍数や3のつく数字のときにもアホな音声が出てくれたら言うこと無しだったのですが、数を読む機能までは搭載できなかったようです。 音符マークのボタンを押せば音声を消すこともできるので人前での使用も可能です。 |
|
| |
PS3用/PS2用『D端子ケーブル+音声ケーブル』 |
|
|
製作: ゲームテック 定価: ¥ 1,880 | 買ってはいけない ![]() このケーブルで1125i,720p出力を行ったところ 画面が波打つという症状がでました。 普通の525iではそのような症状はでませんでした。 もし,高解像度で出力するためにこのケーブルを買おうとしている人がいたら買ってはいけません。 やはり値段なりの品質だということなんでしょう。 事実上480pまで、それ以上は使い物にならない ![]() PS3で使用するため購入、安いけどAV機器に激安で有名なカモンのケーブルも使ってますので大丈夫だろうと思ったらD3(1080i)だとゴーストが半端じゃ無い位出ます。XMBのアイコンですら単一色に見えない始末。はっきり言ってカモンの5mケーブルの方が超高級品に思える品質。 フェアライトコアが付いてないしケーブルも細いので、シールド性が弱くて折り返しノイズをまともに受けてる感じです。 仕方ないのでPS2に刺してある別メーカーのD端子ケーブルに差し替えたらまともな画質になりました。その代わりPS2の解像度であるD2(480p)程度なら問題無さげです。 格段の違い(PS2での使用) ![]() ![]() ![]() ![]() ![]() 確かに本体には少しきつく、差しにくい感じがしました。 しかし、それ以外は十分です。 画像が格段によくなります。(液晶40型テレビ) いまだに、PS2のソフトがたくさん出ているので、PS3の40Gしか持っていない私には必需品でした。 普通の端子での大画面テレビでの使用が画像が粗すぎたからです。 買って大正解でした。 ちなみにPS3はHDMI端子でつないでいます。 |
|
| |
Wii用D端子ケーブル『D端子+音声ケーブル』 |
|
|
製作: ゲームテック 定価: 価格:→¥ 980 | 相性があるようです ![]() 三菱のハイビジョンブラウン管テレビに接続しましたが、ゴーストみたいに斜めに画像が流れ使い物になりませんでした。純正品では正常に表示されましたので返品しました。返品等手続きが面倒ならば純正品をお勧めします。 コンポジットと比較して ![]() ![]() ![]() ![]() 黄色ケーブル(コンポジット)でずっと遊んでたんですが 画質に不満はなかったものの、一応D端子でつないでみることに。 自宅のTVは32インチ液晶、D4までの対応のものですが 正直コンポジットから変えても驚くほどの差はありませんでした。 でも2000円くらいの出費なら痛くないかな。 特に文字の潰れ具合などを注意して見てましたが ケーブルをいくら変えても出力側(ソフト側)ですでに潰れているものは救えません。 当然だけど。コンポジットで満足な方はあえて買い換える必要ないのかも。 Wiiとテレビをつないでいる環境によっては… ![]() ![]() ![]() ![]() ![]() 最近はD端子ケーブルも知名度が上がってきて、使う人も増えてきたのではないでしょうか?Amazonランキングでも常に上位ですし。私も純正のD端子ケーブルでもレビューしていますので、そちらも参考に。 ただ、WiiはPS3やXBOX360とは違い、環境によってはただD端子をつなげば綺麗というわけにはならないらしいです。(もちろん設定も必要ですが…)次世代機と呼ばれる3つのゲーム機の内、WiiだけがD2表示(480p)と少々スペックが低いです。もちろん画質が良くなければ面白くないと言う意味ではありません。Wii独特の面白さがあります。つまり、D端子でフルHDTV(ハイビジョン)などに接続すると画質が悪くなるそうです。相性などもありますが、ケーブルが悪い云々より、Wiiというゲーム機そのもののスペックの限界でしょう。 つまりWiiはSDTV(ブラウン管など)向きのゲーム機ということです。自分の環境に合わせて、D端子ケーブルを購入するか考えて下さい。SDTVだと綺麗になります。 そして、このゲームテックのD端子ケーブルは純正よりも安いので、手軽に買えます。 |
|
| |
音声感情測定器 ココロスキャン |
|
|
製作: セガ 定価: 価格:→¥ 714 | ココロスキャンするココロ ![]() ![]() ![]() ![]() ・メイン操作はほぼタッチペンのみです ・音楽に「Nights」等の「ササキトモコ」さんを起用してました。地味に嬉しかった ・「脳トレ」の様にプレイヤー3人まで登録出来ます ・毎日少しだけサクッとプレイするタイプのゲームだと思う ・「声」を使うゲームだけに、夜中等はプレイ出来ないのが残念。仕方無いんですが ・「声」を使わない、タッチペンのみで遊ぶミニゲームも付いてました ・テンションを抑えた棒読みで「声」を出すと測定結果にホトンド差が出なかった 「隠された内面」を測定するというよりは、自然な会話の中にどの様な感情が 出ているかという「表面的な心情」を測定している様な感じだと思う ・やり込めばやり込む程、個人データの閲覧が楽しくなっていきました 測定結果が天気予報に見立ててあるのもオモシロかった ゲームとしてひとひねりしてある感じです ・DSに多くリリースされている実用シリーズ(?)的なカセットですが ゲームメーカーセガが手がけただけあって、思ったよりメニューが豊富で 1人でもソコソコ遊べるカセットでした。かなりゲームっぽく作られています ・あくまでゲームとして遊ぶのが楽しいのであって、実際にウソ発見機的な使い方は 出来ないと思う。それ程高精度と言う訳ではなさそう。2000円くらいでの 購入であれば、十分楽しめると思います 安価なゲームですが技術的には凄いです ![]() ![]() ![]() ![]() ![]() このソフトは光吉俊二博士が提唱する特許技術"ST"(Sensibility Technology:感性制御技術)を採用しており、ゲームながらかなり最先端の技術が搭載されています。(詳細はwikipediaなどを参照してみてください) この技術は音声から喜び、怒り、哀しみ、平常、興奮、笑いなどの人間の感情状態を検知するもので、今までの音声認識技術や"ウソ発見器"のようなものとは根本から違い、"怒ってるふり"や"動揺したふり"などをしても、脳がそのような状態では無いと全く反応しません。 実際に"ST"は金融機関コールセンターでの与信管理や医療分野、米国政府機関での応用、採用が進んでいます。 ゲームとしては確かに1人で遊んでもそれほど面白くは無いですが、パーティーや合コン、○ャバクラなどではかなり盛り上がります(笑) けっこうあたってる気がする! ![]() ![]() ![]() ![]() テレビをみながらDSを横において「その場の空気測定器」をやってると、みのさんがどんだけコーフンしてるのか?わかったりして、結構たのしい。あと、自分が実は何に興奮するのとか調べられるんだけど、妙に心当たりがあったりする結果がでるんで友達と爆笑しまくり。思ったりよりいいものだ。 |
|
| |