開発者インタビュー:HUEチャットボットを生み出したワークス徳島人工知能NLP研究所
本記事では、株式会社ワークスアプリケーションズのなかでも、2017年2月に開設した自然言語処理(NLP)に特化した研究開発機関「ワークス徳島人工知能NLP研究所」の概要と、研究所で開発したNLP技術をもとにしている同社製品「HUEチャットボット」の特徴や導入メリットなどについてご紹介していきます。
今回、お話を伺ったのは、ワークス徳島人工知能NLP研究所の内田所長です。内田所長は研究所のトップとして、国内の産官・産学連携プロジェクトや、世界各地のエンジニアとの共同研究開発プロジェクトなどを統括しています。
プロフィール
ワークス徳島人工知能NLP研究所 所長
内田 佳孝(うちだ・よしたか)
2004年3月、九州工業大学大学院情報工学研究科博士前期課程修了。在学中は対話システムの研究開発に従事。同年4月、株式会社ジャストシステムに入社。約12年にわたり、自然言語処理の研究開発から商品化に携わる。2016年7月、株式会社ワークスアプリケーションズに入社、2017年2月よりワークス徳島人工知能NLP研究所の所長。
ワークス徳島人工知能NLP研究所について
ワークス徳島人工知能NLP研究所とはどんなところでしょうか
AI(人工知能)という分野のなかでも、NLP(自然言語処理)技術に特化した、日本でも珍しい研究開発機関です。
設立の経緯は、バックオフィスで働く方々の生産性向上を実現して「新しい働き方」を提案したいという思いがあります。バックオフィス業務には、書類の処理や問い合わせ対応といった、日本語の読み書きの作業が多くあります。日本語の読み書きは機械化するのが難しく、どうしても人間が作業せざるを得ない仕事として残ってきた領域です。ワークスアプリケーションズは、この領域に独自のソリューションを提供したいと考えて、文字や言葉を扱う研究領域である自然言語処理にフォーカスした研究開発機関を設立しました。
研究所のミッションについて教えてください
我々のミッションは、自然言語処理技術を研究し、社会問題の解決につながる製品を開発することです。研究で留めるのではなく、実際に社会にアウトプットすることを見越した研究を行っています。これは設立当時から変わらない基本方針です。
日本語のNLP研究は、英語を中心とした海外の研究と比較して、その研究成果を社会へと還元するのが遅れる傾向にあります。海外の研究は大手企業が研究の中心にありますが、日本語の場合は日本の大学が研究の中心にあるためです。また、日本語の研究はほとんどが日本語話者によるものに限られるので、研究の数自体が英語と比べるとどうしても少ないという事情もあります。当研究所としては、日本語のNLP研究成果の社会還元を推進していきたいと考えています。そのための産学連携も活発に行っています。また我々の研究成果の一部はOSS(オープンソースソフトウエア)として公開しています。
現在取り組んでいる研究内容を教えてください
直近では、HUEチャットボット(後述)の改善活動を続けることと、AI画像処理(OCR)の研究を進めることを注力テーマとしています。
HUEチャットボットは、(日本最大規模の辞書を搭載した、全自動AI対話ツールです。
NLP技術を応用することで、従来課題とされていた言葉の揺れにも対応し、質問者からの問い合わせに、まるで人と話しているような高い精度での回答を実現します。)
AI画像処理は、(ERPパッケージ『HUE』に搭載済の高精度AI-OCR Engineをお客様向けに提供します。領収書や請求書などの様々なタイプの書類の電子化は勿論のこと、RPAやシステム連携を前提としたソリューションのご提案もしています。)
この2つの技術は別のものですが、共通している重要な意味は、これまでアナログだったデータをデジタル化できることです。エンドユーザーからの問い合わせのような自然言語の文章や、領収書や明細書などの紙で残されていた情報は、人間が読んで確認するしかないという意味で、アナログのデータでした。これらは、それぞれHUEチャットボットやAI 画像処理技術を使うことで、活用可能なデジタルデータとして蓄積できるようになります。
2017年に日本語形態素解析器「Sudachi」がOSS*1として公開され、多くの大手企業が採用していると聞いています
「Sudachi」は商用利用に耐える高品質の形態素解析器です。形態素解析とは、文を意味を持つ最小単位に分解して品詞や変化などを判定する技術です。日本語NLPにおける最も根幹的な基盤技術といえます。日本語の形態素解析器はいくつかありますが、Sudachiは収録されている語彙(ごい)の品質が高く、数も圧倒的に多い点が喜ばれています。継続的にメンテナンスしており、新しい言葉にも対応している点も評価されています。Sudachiに関連する論文は、国際会議であるLRECに採択されているほか(*2)、国内研究会では Best Paper Awardを受賞しています(*3)。
Sudachiは多数の大手グローバル企業でも採用いただいています。先日開催した弊社主催のイベントでは、医療サービスを提供している企業様や、電機メーカー様、大手人材サービス企業の研究所様より活用事例をご共有いただきました。
Sudachiはどのような用途で利用されることが多いのでしょうか
使われ方としては、検索精度向上のために使っていただくことが多いですね。Sudachiがプラグインを提供していることもあり、検索エンジンとしてさまざまなプラットフォームで標準になってきているElasticsearch(エラスティックサーチ)というOSS上で使われていることが多い印象です。
*1) OSSとは、オープンソースソフトウェア(Open Source Software)の略。作成者が無償でソースコードを公開しており、その利用や改変、再配布が自由に許可されているソフトウェアを指す。
*2) 2018年 言語資源に関する世界最大の学会「第11回 言語資源と評価に関する国際会議(LREC/エルレック)」に採択
http://www.lrec-conf.org/proceedings/lrec2018/summaries/8884.html
*3) 2021年 電子情報通信学会 言語理解とコミュニケーション研究会 (NLC)の優秀研究賞 (Best Paper Award)を受賞
https://www.ieice.org/iss/nlc/wiki/wiki.cgi?page=%B8%A6%B5%E6%BE%DE2020%C7%AF%C8%EF%C9%BD%BE%B4%BC%D4
SudachiをOSSとして公開したのはなぜでしょうか
ワークス徳島人工知能NLP研究所は、全くのゼロベースから立ち上げたため、2017年の設立からHUEチャットボットを開発するまでには苦労しました。私の前職では日本語のNLP研究のためのさまざまな基盤技術を保有していたのですが、ワークス徳島人工知能NLP研究所では日本語に関して使える言語資源が乏しく、これには戸惑いました。研究開発を進めるためには、まず基盤の技術から整備していく必要があったのです。それでまず開発したのが最も基本的な基盤である形態素解析器、Sudachiです。
ただ、この状況は他社様も同様でした。前述の通り日本語のNLP研究は大学が中心で、企業での研究はあまり盛んではありません。私の前職のように基盤技術一通りを自前で保有している企業がむしろ特殊であり、日本の他の一般的な企業では、我々と同様に、NLPを研究する場合は基盤技術を整えるところから始める必要があります。しかしながら、各社が独自に基盤の技術から開発するのは、日本語のNLP研究全体として見れば、非効率なことです。
ワークスの企業理念には「企業の生産性向上」が掲げられています。この理念に則り、Sudachiのような基盤の技術は、誰でも利用できるように公開すべきものであると判断いたしました。誰でも自由に使える高品質のNLP基盤技術があれば、企業のNLP研究者は社会の問題を解決する研究に集中できるようになり、日本語のNLP研究の発展が期待できます。また我々としても、さまざまな企業様やユーザー様から、こんな機能が欲しいといったフィードバックを頂いており、それらをヒントにSudachiをより良く改善していくことができています。
Sudachiの技術も搭載された『HUEチャットボット』とは
研究所の製品「HUEチャットボット」についてお聞きします。まず、HUEチャットボットとはどのような製品なのか教えてください。
問い合わせ対応のためのAI対話ツールです。ユーザーが問い合わせの内容を入力すると、その問い合わせに適合するFAQをAIが推定して、ユーザーに回答を返します。HUEチャットボットには、先ほどご紹介したSudachiをはじめ、我々のさまざまな研究成果を盛り込んで開発されています。
そのSudachiですが、「HUEチャットボット」のどのような部分に活かされているのでしょうか?
ユーザーからの問い合わせに非常に高い精度で回答できるという点に、Sudachiが大いに活かされています。
Sudachiは日本でも最大規模の語彙を搭載しており、表記の揺れや曖昧さに強いため、高い回答精度を実現することにつながっています。
例えば同じ言葉でも、漢字・カタカナ・ひらがなの違いや送り仮名の違い、更には間違った表記などについてもAIが汲み取り、同じ意味のものとして理解することができます。また、例えば Suica、ICOCA、Kitacaなどの固有名詞の違いも、「交通系ICカード」として一般化した認識をすることができます。
回答精度の高さが大きな特徴のひとつであるとのことですが、他にも「HUEチャットボット」ならではの機能は何かありますか?
「聞き返し機能」というものがあります。
例えば出張時の経費について聞きたい場合、「宿泊代」「交通費」のように、文章ではなく単語だけをチャットボットに入力して質問するエンドユーザーの方も多くいらっしゃいます。しかし、単語だけでは該当するFAQが多すぎて、ユーザーが求めているFAQをAIが特定できない場合があるのです。
そのようなとき、HUEチャットボットは不足している情報をユーザーに聞き返すことで、FAQの特定に必要な情報を補完します。ユーザーに聞き返される内容は、入力された単語と登録されているFAQをAIが解析して、自動的に生成されます。
例に挙げた「宿泊代」「交通費」を入力したとすると、「領収書について聞きたい」「料金の上限について聞きたい」などの選択肢をチャットボットが特定し、聞き返してくれます。
「HUEチャットボット」の回答精度は「聞き返し機能」で更に高まるのですね。
ただ、今お話いただいたような機能を活用するためには、事前の設定や導入後のメンテナンスが難しそうな印象も受けるのですが、そのあたりはいかがでしょうか。
チャットボットとしての機能ではありませんが、運用するための管理機能も充実していますので、そのような心配は不要です。チャットボットの導入に失敗したという事例は多いのですが、よくある原因の1つが、導入後のFAQのメンテナンスに手が回らずに、チャットボットの回答精度が悪化して使われなくなってしまうというケースです。HUEチャットボットの管理画面は「導入後もFAQの修正や追加が定期的になされるもの」という前提に立ち、お客様による管理運用のしやすさを重視した設計がなされています。実際にHUEチャットボットをお使いになったお客様からも、管理画面が使いやすく、運用しやすいというお声はよくいただきます。過去に他社様のチャットボットを導入したけれどうまく運用できなかったという企業様にも、ぜひHUEチャットボットを体験していただきたいと思っています。
どのような管理機能があるのでしょうか
「お問い合わせダッシュボード」という機能があり、ユーザーからの問い合わせ、それに対するチャットボットの回答、回答に対するユーザーの反応などが自動で集計・分析されて表示されます。お客様は、例えばチャットボットがうまく回答できなかった問い合わせの傾向を確認しながら、不足しているFAQの追加や修正を行うことができます。
また、チャットボットのAIに簡単な調整をかけることもできます。ある問い合わせに対してAIが推定するFAQ候補リストを確認してその優先順位を調整したり、例えば「”PASMO”という単語も『交通系ICカード』として扱わせる」というように、AIに同義語を設定するといったこともできます。
チャットボットを改善するための操作も、自分たちの手ですぐに行うことができるのですね。
はい。お客様の業務によって柔軟に運用していく必要があるFAQの追加・修正といった管理機能については、ベンダーに依頼いただくことなく、お客様自身で手軽に対応いただけるようになっています。管理画面には直感的に操作できるユーザビリティ―も十分に備わっていますので、操作にはプログラミングの知識も不要です。バックオフィスでWordやExcelなどを使っているような方であれば、問題なく管理機能をお使いいただけます。
勿論、当社での継続的なサポートもしっかり行います。
標準搭載されているSudachi辞書の継続的な更新や、AI機能のアップデートなどは当社が無償で提供していきます。
改めてにはなりますが、HUEチャットボットを導入することで、現場での業務にどのような変化が期待できるでしょうか
まず、HUEチャットボット導入の基本的な効果として、問い合わせ業務を効率化できます。お問い合わせ業務では同じような内容の問い合わせが多く発生しますが、HUEチャットボットを導入すればそれらに自動で応答することが可能です。人間が対応する必要があるのは、FAQに登録されていない、新しい問い合わせのみとなります。その新しい問い合わせについても、解決後すぐにFAQに追加することができますので、次回からはHUEチャットボットが回答できるようになります。
その他にも、社内でHUEチャットボットを運用したところ、窓口がメールだけだったときよりも、問い合わせ件数が増えるという事象が見られました。チャットボットならではの問い合わせの手軽さから、メールでは面倒さやハードルの高さを感じて躊躇されてしまった問い合わせも、チャットボットでは気軽に問い合わせられるようになったためと考えられます。これは、今までは拾えていなかった潜在的な課題を浮き彫りにしたり、新しいサービスの種が発見できたりする可能性があります。今後、様々な企業でもこういった効果があるのかについては、お客様にヒアリングする中で分析していこうと考えています。
どのようなお客様に「HUEチャットボット」の導入をお勧めしますか?
まだチャットボットを導入されたことがないお客様はもちろん、過去に他社様のチャットボットを導入したけれどうまく運用できなかったという企業様にも、ぜひHUEチャットボットを体験していただきたいと思っています。先ほどの話と重複しますが、導入に失敗する原因として多いのが、FAQのメンテナンスが追い付かず、チャットボットの回答精度が悪くなって使われなくなってしまうことです。HUEチャットボットは、基本的な日本語処理精度の高さに加えて、管理部門の方がメンテナンスしやすいことを重視した設計がなされています。勿論当社でも充分にサポートを行いますが、お客様自身での運用改善のしやすさ、そして管理画面の使いやすさという点は、是非多くの方に体験していただきたいと思っています。
「HUEチャットボット」の今後の展望についてお聞かせください
今後の展望について、短期目標と中長期目標に分けてお話しします。
まず、短期目標としては、お客様からいただいているさまざまなご要望にお応えしていきたいと思っています。HUEチャットボットでは、概ね3カ月に一度無償でバージョンアップしているのですが、そのなかで、例えば多言語対応であったり、LINEやTeamsのような多様なプラットフォームの中に組み込めるようにしたりといったことを随時対応してきました。これからも実際にいただいたお客様の声に対応して、より良い製品へと改善していきたいと思っています。
中長期目標としては、お問い合わせ対応以外にも機能を拡大させたいと考えています。1つは、企業内の業務システムとの連携です。チャットボットと業務システムをうまく連携させれば、エンドユーザーはチャットボットに日本語で指示をするだけで、さまざまな申請や手続きを実行できるようになります。
このほか、大学との共同研究も進めようとしています。大学では、コロナ禍において対面授業ができなくなり、チャットボットを採用するところが増えているということを受けて、教職員の皆さまの業務効率化や、学生の皆さんの学習意欲向上といったところにチャットボットが何か貢献できないかと思索しています。
もし現在研究中の新しいテーマなどがあれば、そちらについても是非教えていただけますでしょうか。
現在はFAQが不要なチャットボットの研究開発も進めています。例えば、製造業のお客様で、過去の施工事例など豊富なドキュメントはあるけれど、大量なのでFAQ化が難しいといった場合や、バックオフィス業務が忙しいお客様で、そもそもFAQを作る時間がないといった場合があります。そのような方にも問題なくご利用いただけるよう、FAQが用意できなくても、既存のドキュメントやマニュアル、過去の問い合わせメールなどがあれば、それらの情報を元にチャットボットが回答できる技術を提供したいと考えています。
Sudachi及びHUEチャットボットの導入相談、その他のお問い合わせ