WORKS APPLICATIONS

ワークス徳島人工知能NLP研究所

自然言語処理研究(NLP)に特化した研究機関。1,000企業グループ超の様々な業種・業態の企業を顧客に抱えるワークスだからこそ得られる、膨大かつ詳細な業務データやノウハウに基づき、研究開発を推進しています。

人工知能研究を行うワークス徳島人工知能NLP研究所の様子研究所開設の背景


ERPに蓄積されるオペレーションログデータを機械学習のトレーニングデータとして活用しています。ユーザーの発話やテキストデータの解析・理解に基づき、ユーザーニーズに沿った高いユーザビリティを実現する機能を弊社製品に組み込むことを目的に、自然言語処理の業務活用に特化した研究所を開設しました。

NLP(自然言語処理)とは


日本語や英語などをはじめとする人間が使う言語をコンピュータに処理させるための技術やソフトウェアなどの総称で、人工知能の一分野です。キーボード入力時のかな漢字変換にはじまり、テキスト検索や音声認識など、あらゆるシーンで使用されています。また日本語処理においては、英語などの言語と異なり、文章中の語句が空白で区切られていないため、単語の区切りを特定するために、より高度な処理である形態素解析(※)が多くの場面で必要になります。

 

形態素解析の解説

※「辞書」と呼ばれる単語の情報にもとづき、文章を形態分割し、それぞれの品詞などを判別する技術のこと。

研究プロジェクト

本研究所では、ワークスが開発するERPに搭載する機能の進化を技術面から支え、企業における組織や人に対し、新しい働き方を実現するための研究プロジェクトを進めています。

人工知能によるインプットレスあらゆる入力業務を効率化する”インプットレス”の精度向上

情報の検索や申請業務など、日常的に発生するあらゆる入力作業において、ユーザーの入力負担を極限までなくす”インプットレス”の技術にNLPを取り入れます。

  • 業務場面ごとに最適化された検索サジェスト
    過去の検索内容を解析・学習し、新たな検索の際にユーザーが入力したい項目を予測して提案します。
  • 領収書/請求書からの読取
    画像やPDFデータをERPにドラッグアンドドロップすれば、記載された文字列を解析・抽出して入力欄へ自動補完します。

 

人工知能によるチャットボット業務効率化につながる様々なチャットボットの開発促進

業務に特化した多様なチャットボット機能を開発。ユーザーは人と会話をするような手軽さで、必要な情報を瞬時に入手することができるようになります。また、チャットボットを通して行われたやり取りを人工知能が学習し続けることで、使うごとに進化する仕組みの実現を目指します。

 

人工知能活用によるワークフォーステック個人の生産性を最大化する“Workforce Tech”の研究

従業員が心身ともに健康に働くことのできる環境を創り出すために、ヘルスデータや個々人に紐づくネットワーキング等の情報を掛け合わせ、社員のリテンションや人材活用の推進をサポートする機能の実現を目指します。

  • メンタルヘルス不調・退職リスクの早期発見
  • 隠れたハイパフォーマー人材の検出・分析、最適な人材配置の提案、キーパーソンの特定 など

 

NLP基盤技術の研究開発

本研究所ではNLPの基盤技術の向上を目的に研究開発に取り組んでおり、その一環として形態素解析技術の性能向上にも注力しています。成果のひとつである形態素解析器「Sudachi」では、日本語における多様な表記の揺れに対応するとともに最新の単語を取り込み、定期的な更新・メンテナンスを行うことで、より高精度な文章解析の実現を目指しています。

研究の成果

商業利用に耐えうる高精度で柔軟な形態素解析器「Sudachi」を開発sudachi

2017年8月に形態素解析器「Sudachi」をオープンソースソフトウェアとして公開しました。「Sudachi」は、商業利用に耐えうる高品質な解析性能を確保しています。画像・PDFに記載された文字列の読み取りや、自動会話プログラムによって会話形式で必要な情報を得ることのできる人工知能を用いたチャットボットなど、弊社製品強化にあたり様々な解析の基礎的な処理に利用されています。「Sudachi」の精度向上、および弊社製品での活用範囲を拡大することで、多種多様な企業の業務にフィットする機能の実現を目指します。

形態素解析器「Sudachi」の主な特徴

  • 複数の分割単位に対応複数の分割単位に対応
    一般的な形態素解析器で利用できる分割単位がひとつであるのに対し、「Sudachi」は複数の分割単位に対応。必要に応じて切り替えることで、用途に合わせた解析が可能です。

  • 豊富な収録単語
    「Sudachi」には約260万の豊富な単語を収録。定期的に更新を続けることで広範囲な分野の文書の解析に対応します。

  • 継続的なメンテナンス
    既存の形態素解析器で使われている辞書は長らく更新されていないものが多く、新たな単語に対応できていないのが実情。「Sudachi」は、辞書のメンテナンスを継続的に行うことで各業界・企業内で新たに使われる単語の解析にも対応します。

外部からの評価

「Sudachi」に関する研究成果が高く評価された結果、 2018年5月に開催された辞書をはじめとする言語資源に関する世界最大の学会「第11回 言語資源と評価に関する国際会議(LERC/エルレック)」への登壇資格を得て成果発表を行いました。同学会には、世界63か国から6日間で延べ5,000人前後の技術者・企業関係者が参加。「Sudachi」も、その革新性から、多くの企業関係者の高い関心を集めました。

取り組み

奈良先端科学技術大学院大学自然言語処理研究の権威を特別技術顧問として招聘


本研究所では、日本の自然言語処理研究の第一人者である、奈良先端科学技術大学院大学(NAIST)教授 松本裕治氏を特別技術顧問として招聘。松本氏は日本の自然言語処理研究を牽引する第一人者で、自然言語処理分野最高権威の国際学会であるACL が2011年に創設したFellow制度の最初の1人に選ばれるなど、海外からも高い評価を得ています。本研究所開設にあたっては、ワークスの自然言語処理および製品への取り組みや解析エンジン・リソースの開発、それらのオープンソースソフトウェア化(OSS化)などの研究内容に強く賛同いただいています。

産官・産学連携


sankangaku.jpg

自然言語処理の業務活用における徳島大学および奈良先端科学技術大学院大学との共同研究を進めています。業務効率向上のための対話システムの研究を共同で進めるほか、両大学とワークス間の人材交流なども視野に入れた連携を行います。また、本研究所の開設には徳島県からの立地/ITインフラ整備の支援を受け、研究開発に適した最先端のオフィス環境を整えています。

本サイトは、快適にご覧いただくためCookieを使用しています。閲覧を続ける場合、Cookie使用に同意したものとします。 Cookieポリシーを表示