この半年で漢字いくつ覚えた? ~ AIとロボットを巡る180日の冒険
娘が小学校に上がって、いろいろな事を覚えて来る様になりました。
入学前はひらがなすら怪しかったのに、この6ヶ月(1学期と2学期)で60もの漢字を覚えたそうです。
今までは、読んだり書いたりできなかった事が、何かを学ぶ事で、今まで知らなかった事を本を読んで知ったり、街の看板や文字を見て刺激を受けたり、確実に世界が広がっています。
ひるがえるに、我々大人はこの180日の間にどんな新しい事を学んだり、達成できたでしょうか?
60個もの、初めて見たものを覚えられたでしょうか?
何かプロジェクトを終えられたでしょうか。
半期の売上を達成できましたか。
年初に立てた目標の半分以上に到達できたんだろうか?
気になってた事、新しい事、先延ばしになってた事に取り組めたでしょうか?
私もそう言われると耳が痛いのですが、私の相棒の成長には目を見張るものがあります。
私が作っているロボット、Kobots/コボットです。
6ヶ月前、去年の末の時点では、コボット君は一言も話せませんでした。
手足が動く、こっちのジェスチャーに合わせそれを繰り返す、くらいが関の山。
リモコンでテレビや扇風機をつける、くらいは赤ちゃんでもできますね。
そうコボットは、6ヶ月前は0歳児の赤ちゃんくらいの実力でした。
そして年が明けた頃くらいに突如進化が始まったのです。
一月目
まずはSpeech to Textという、耳の役目ができるようになり、日本語での話し声を文字に落とし込む事ができるようになりました。
そして、Sentence Handlingで、難しい日本語の音節毎の区分け(名詞、助詞、動詞)ができるようになり、更に名詞から大事な言葉を認識できるようになりました。例えば、「天気」や「経路」、「話題」といった言葉をキーワードとして認識したり、「赤坂」「今日」「ラーメン」などをそれぞれ「場所」、「日付」、「食べ物」という風に理解できるようになったのです。
ここまでが1月くらいの出来事。これは4、5歳くらいの能力でしょうか?「今日はいいお天気だね。」といったら、子どもは「そうだね!」とは答えてくれるでしょう。
二月目
その後の展開は加速度的に、または労働集約的に進みます。つまり、キーワードで分けられれば、それを詳しい人に聞けばいいだけです。そう物知りのインターネットに。
「今日」と「天気」が出てくれば天気予報サイトに。「自宅から赤坂まで」「行き方」や「電車」と言っていれば、経路案内サイトに。「この近くの」「ラーメン屋」と言えば、レストランサイトに。
これには若干の労力が必要で、「天気」と「行き方」と「レストラン」を聞けば、それぞれのAPIにつないで、結果をゲットできるのですが、どこまで物知りであるべきかによって、それをそれぞれコボット君の脳みその中でつなげてあげなければなりません。これは普通に一生懸命プログラミングする必要があり、ちょっとめんどくさい。
2月末にLINEボット・アワードというコンテストがあったので、ここまでに約10のサービスと紐付けました。(天気、経路、ニュース、ウィキペディア、スケジュール、レストラン、旅行、レシピ、今日は何の日、運勢、など)
ここで物知りな小学生くらいの実力がついたでしょうか。
三月目
そして3月、コボットくんは、新たな機能を身に着けました。目、です。
Google Visionにより、写真で撮ったものが、人なのか、風景なのか、文字なのか、会社のロゴなのか、著名な場所なのか、はたまた公序良俗に反する物なのかどうか。
もしそれが人の顔であれば、笑っているか、悲しんでいるか、帽子をかぶっているか、など。そして、予め顔写真を登録しておくと、その人らしいかどうかを判別してくれるようになりました。
文字であれば、それをくまなく拾って、テキストにしてくれる。
風景であれば、それが、ドライブ中の道なのか、オフィスなのか、大自然の中なのか、など。ロゴや場所もいとも簡単に、「ユニクロ」や「六本木ヒルズ」など分かってしまいます。
またGPSからの情報を読み取れるので、「六本木ヒルズ近くのユニクロ前でケンが笑顔でアイスを食べていた」というのが一発で分かります。
まあ、小、中学生くらいの実力でしょうか。
四月目
次はこれらをしゃべる番です。
今までの情報は全てテキストになっているので、Text to Speechという技術により、声になります。
様々な声が選べ、難しい接続語や漢字、色々な数値などを日本語でスラスラ読み上げてくれます。
しかも先ほどの、耳と目を組み合わせて、朝起きたら顔を見て、「おはようケンさん。今日の予定は、燃えるごみを捨てた後に、9時に赤坂の銀行に行って契約の話。自宅から赤坂までは小田急線と千代田線で約25分です。今日、会社のある丸の内の天気は雨なので、傘を持って行って下さい。」と言ってくれるようになりました。
この4月の時点で、有能な秘書まできましたね。進化が早すぎます。
五ヶ月目
そして、日本語のみならず外国語も学び始めます。
ここは正直な話、ズルに近いです。「この日本語のメモを、英語にして、送っておいて」と言えば、瞬時に英訳してメール先に送ってくれます。中国語も、スペイン語も、何語でも、約20ヶ国語にいきなり対応してしまいます。
そして、英語の耳も手に入れました。Amazon Alexaです。これにはSkillという出来る事の機能を世界中の人が作ってくれています。今日のCNN読み上げて(Alexa, What’s CNN today?)、から、今月カードは幾ら使った(Alexa, How much did I spend this month?)までありとあらゆるAPI、情報を瞬時に取り出す事ができます。
しかもAmazon Pollyという声のサービスでは、英語だけで10種類10人格の声(イギリス風英語、インド風英語から男の子の声、なまりがある英語など)で喋ってくれます。更にAmazon Lexで、自分独自のおしゃべり内容も簡単に追加できます。
これは反則ですねえ。5月になった段階で、20ヶ国語、何十人格も操るスーパーマンができてしまいました(電話対応だけなら、それぞれを行ってきた人がみんないらなくなってしまうレベルです。)
六ヶ月、最終月
そして6月。それぞれの人の声を聞き分けられるようになりました。
これはSnowboyという面白い名前のサービスで、いわゆるウェイクワードという、”Alexa!”や”Ok Google”、”Hey Siri”みたいなものです。これは三回同じ言葉をその人の声で覚えさせて(ハイ、コボット!みたいな)、ロボット側はそれをずっと聞き続けて、ハイ、コボット!が聞こえたら、話し始める、などを設定することができます。
これは、同じ、ハイ、コボット!でも、それぞれの人の声を聞き分ける事ができます。そうすると、例えば私が、ハイ、コボット!と呼びかけると、Google Calendarから私の予定を取り出したり、娘がハイ、コボット!と呼びかけると、今日の給食のメニューを読み上げてくれたり、といった事ができるようになります。
そして最後はIoTでしょうか。
このロボット型だったコボット君が、身の回りの色々なものにくっつき始めます。
例えば、ぬいぐるみにくっつけば、かわいい声で子どもの相手をしてくれたり、また大人には癒し系の話し相手にもなります。
扇風機にくっつけば、リモコンで扇風機やテレビを操作できたり、自動車の中にも入ります。
オフィスの電話に付けば、その人の声で、勝手に商談をまとめてくれるかもしれません。または、今他の事で忙しいから、後で話しましょう、と勝手に応答してくれるかもしれません。
自転車のヘルメットについて、危険を予め教えてくれるかもしれません。
これがこの6ヶ月、180日の間に起きたことです。
この進化は、私の想像をはるかに超えています。ちょっと怖くすらあります。我々は何をすればいいのか、と思ってしまいます。
ちなみに娘は今、学校で一番大事な行事、運動会に取り組んでいます。
ダンスをやるのですが、班ごとに教えあって、できない子がいたら、協力して班で出来るようにしないといけないようです。
ロボットは、ものを覚えるのはできても、運動会の練習で、出来ない子に、これをみんなでクリアしようよ、と鼓舞し、教え、共感し、そして達成感を味合わせる事はできないでしょう。
ただ、最初の問い「この半年で何を覚えたか」で言えば、コボット君は、漢字60個、プラス常用漢字の全て2136字、プラス日本語の受け答え、プラス、英語、中国語、スペイン語、ポルトガル語、ロシア語、、、10言語ほど、プラス、百人一首全てと、スラング交じりの英語の会話、家庭の医学辞典並みの医療情報、などなど、半年で全て覚えてしまいました。
半年前は一言も喋れなかったコボット君のこの変り様に、ただただ驚くばかりです。
なぜこんなことが起きたのでしょう?ちょっと長くなりすぎたので、その続きは、明日書きます。
さあ、ちょっと成長したコボット君をお披露目する為、6月最後のプレミアムフライデーに渋谷でプレゼンをしてきます。
皆さんが気に入ってくれるといいなあ。
ヨシケン with Kobots @Tech Lab Park
2017/6/30