• ベストアンサー

パソコンで使えるSiri(音声入力秘書機能)は?

普通のパソコンでも、音声入力でそこそこ賢い(パソコンの演算能力を考えると最低でもiPhone程度は欲しい)、音声入力型の秘書機能ソフト(この種類のカテゴリー名称が分からない)を、有償無償関わらず探しているのですが、どのような物がありますでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • neko-ten
  • ベストアンサー率55% (1287/2335)
回答No.3

>かなりプライベートな会話もあるでしょうし、スタンドアローンのサービスだと思っていました。 やっぱり大多数の人はオフラインだと思っていたようで、始め出たときかなり話題になりましたね。 オフラインになると、思いきり「Siriは利用できません インターネットに接続してください」って出てくるんです。 >そうなると、ますます、スタンドアローンで(できればオープンソースで)動くソフトが欲しく思うのですが、最近のストレージ容量も大きく演算能力も高いですし、ソフトの提供は難しいのでしょうか? >また、どの程度のストレージ容量が必要なのでしょうか? 実際のところ、どこまでさせたいかによると思います。 それこそ、質問に有るとおりSiriクラスまで自然言語判別を行わせようとすると、ストレージとしてはテラじゃたらないと思います。 AppleはSiri実装時にデータセンタ自体を作りましたからね・・・。 まぁ、Siriは言語問わず、ブレ問わずですから個人利用ではそこまでいかないとは思います。多人数利用でもないですし。 あと、個人利用PCではアーキテクチャとしてあまりこういった分野に向かないってのはあります。 ほかに問題なのはパターン定義です。 現状、コンピュータはパターンを基に動作させることしかできませんから、言語組み合わせのパターンの学習、最適な判断、といったものが必要です。 となってくると、ストレージ容量もそうですが、分岐予測などのためにIOの速度が必要です。予測エラーになるたびのっそり読み込みなおしでは・・・。 また、そもそもの予測を行うベースになるデータをどっから持ってくるんじゃってこともあります。 「日時を指定してOutlookから読みだす」とか、そういったものはあまり難しくないですが・・・ 「内容を分析して、予定表登録を促すか、返信を促すかを決める」レベルまでいくとデータ収集自体が問題になると思う。 技術根幹だから、これをソフトとしてまるっと提供する企業はないんじゃないかな・・・。 Appleとかは、どれくらいデータ持ってるのかもう把握できないレベルすねぇ・・・。 実際自然言語をつかったコンピューティングは、まだまだ開発段階の部分も多いです。 なんで、そもそも「まだ技術がないデスヨー!」って部分も多分にありますね。

temi_00
質問者

お礼

再度、回答いただきありがとうございます。 話題になっていたのですが・・・ 恥ずかしながら、その当時あまり興味が無く、IMBなど警戒してるなー程度にしか思っていませんでした。 一応、記事だけは斜め読みしてたのですけどねhttp://www.computerworld.jp/topics/615/203177 データセンタレベルのストレージが本当に必要なのか、やはり疑問に思い、気になってIBMのワトソンのストレージを調べてみたのですが、メモリー15TB(DBを含むかは不明)とありました。これが全ストレージ容量であれば、言語の理解部分だけなら意外とコンパクトに収まる気がします。 また、普通のパソコンはネットに繋がっていますし、良く分からないことはすべてGoogleへ投げれば良い気もしますし、インターフェイスだけの理解として、もう少し理解してくれるだけで良いような・・・ 暗黙知が多くこれが難しいのかもしれませんが、そう言う物ではないのでしょうか? また、確かに、根幹的な技術と思いますが、オープンソースの中には、普通の会社では到底作れないようなソフトもかなり大量にありますので、こういった物も少しは開発されているのではないかと思うのですが、まだまだ、技術がそこまで追いついていないのでしょうかね。 寧ろ、技術やアイディアが足りないからこそのオープンソースプロジェクトという気もするのですけどね・・・

その他の回答 (2)

  • neko-ten
  • ベストアンサー率55% (1287/2335)
回答No.2

>パソコンの演算能力を考えると最低でもiPhone程度は欲しい 勘違いしてますが、SiriはiPhoneで演算なんかしてません。 全部クラウドで、膨大な自然言語サンプルを処理したうえでの認識だから、同じ程度ほしかったらデータセンタ持ってきましょう。 音声認識だけであれば、ドラゴンスピーチとか昔からあります。 それらであれば、音声を文字として変換が可能です。 これらのソフトウェアでは、キーワード登録することである程度の操作が可能です。 ただ、やってることはランチャーですけどね。 問題は自然言語を意味のある言語として認識させる方法。 iPhoneを最低レベルって言ってますけど、このレベルのだとサンプルからしてPCにはいらないし個人収集とか無理です。 なんで、同じレベルほしけりゃクラウドベースのサービス提供になってきます。データセンタ持って来いってのはこれです。 AmiVoiceあたりがクラウドサービスやってますね http://www.advanced-media.co.jp/solution/cloud/ 個人向けできる価格帯じゃないですがね。 スタンドアロンでも、小規模な辞書をもって認識できますが、ほとんどは表記ブレに対するものていど。 議事録作成ソリューションなどでは、学習機能を使って行っていますが、これでも秘書機能は実装しません。

temi_00
質問者

お礼

回答いただきありがとうございます。 かなりプライベートな会話もあるでしょうし、スタンドアローンのサービスだと思っていました。クラウドベースで動いていたのですね。初めて知りました。 そうなると、ますます、スタンドアローンで(できればオープンソースで)動くソフトが欲しく思うのですが、最近のストレージ容量も大きく演算能力も高いですし、ソフトの提供は難しいのでしょうか? また、どの程度のストレージ容量が必要なのでしょうか?

  • B_one
  • ベストアンサー率55% (246/445)
回答No.1

普通のパソコンと言ってもMacやLinux、Windowsなどありますが・・・・ Windowsの場合、一番近いのは「ドラゴンスピーチ」かな? http://www.justsystems.com/jp/products/dragonspeech/

temi_00
質問者

お礼

OSは何でも構いませんが、ちょっとハイスペックな家庭用パソコンにインストールできる物を探しています。 ドラゴンスピーチについては、曲がりながらにでも、言語を理解しているとはちょっとまだ言えないですよね・・・正直、Siriでもかなり微妙だと思っているため、Siriくらいの能力は欲しいと思うのですが、難しいのでしょうかね? 若しくは、オープンソースでこの分野の開発はあまり活発ではないのでしょうかね?

関連するQ&A