アクティビティ

公開ツール・リソース

ツール

[日本語形態素解析器: Sudachi]

https://github.com/WorksApplications/Sudachi

[チュートリアル]

https://github.com/WorksApplications/Sudachi/blob/develop/docs/tutorial.md

[日本語形態素解析器: SudachiPy (Pythonクローン)]

https://github.com/WorksApplications/SudachiPy

[チュートリアル]

https://github.com/WorksApplications/SudachiPy/blob/develop/docs/tutorial.md

[検索エンジンプラグイン: elasticsearch-sudachi]

https://github.com/WorksApplications/elasticsearch-sudachi

[チュートリアル]

https://github.com/WorksApplications/elasticsearch-sudachi/blob/develop/docs/tutorial.md

[日本語依存構造解析器: Kintoki]

https://github.com/WorksApplications/kintoki

[トライ木データ構造ライブラリ: jdartsclone]

https://github.com/WorksApplications/jdartsclone

言語リソース

[大規模日本語固有表現・形態素辞書: SudachiDict]

https://github.com/WorksApplications/SudachiDict

[大規模日本語同義語辞書]

https://github.com/WorksApplications/SudachiDict/blob/develop/docs/synonyms.md

[大規模日本語単語ベクトル: chiVe]

https://github.com/WorksApplications/chiVe

[チュートリアル]

https://github.com/WorksApplications/chiVe/blob/master/docs/tutorial.md

研究発表

論文誌

Membership Inference Attacks on Sequence-to-Sequence Models

https://arxiv.org/abs/1904.05506

Sorami Hisamoto, Matt Post (Johns Hopkins University), Kevin Duh (Johns Hopkins University) Transactions of the Association for Computational Linguistics (TACL), 2019 (To appear).

※第一著者がジョンズ・ホプキンズ大学を訪問していた際のプロジェクト

ニューラル機械翻訳における単語報酬モデルに基づく対訳辞書の利用

竹林 佑斗,Chu Chenhui(大阪大学),荒瀬 由紀(大阪大学),永田 昌明(NTT) 自然言語処理, Vol.26 No.4, 2019.

※第一著者が大阪大学に在学していた際のプロジェクト

国際会議

Automatic Generation of Japanese Question-Answering Pairs

Hiroki Tanioka (徳島大学), Kaoru Kimura (徳島大学), Kazuma Takaoka, Ryohei Nakatani, Yoshitaka Uchida

Fourth Asia Pacific Corpus Linguistics Conference (APCLC 2018), September 17, 2018.

Sudachi: a Japanese Tokenizer for Business

http://aclweb.org/anthology/L18-1355

Kazuma Takaoka, Sorami Hisamoto, Noriko Kawahara, Miho Sakamoto, Yoshitaka Uchida, Yuji Matsumoto (NAIST)

11th edition of the Language Resources and Evaluation Conference (LREC 2018), pp.2246-2249, May 10, 2018.

全国大会・学会研究会など

LOFを用いたドメイン外発話検出におけるデータ拡張の有効性の検証

山村崇(九州工業大学), 真鍋陽俊, 中谷良平, 内田佳孝

第18回情報科学技術フォーラム(FIT2019), September 3, 2019

統計情報を用いた人の心を捉える質問応答文の分析

https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/D4-9.pdf

谷岡広樹 (徳島大), 中谷良平, 内田佳孝

第25回言語処理学会年次大会, March 14, 2019.

User-Assisted Tabular Extraction in Japanese Invoice

https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/P5-26.pdf

Vincent Leonardo, Yuichiro Shimizu, Kensuke Masugata, Sorami Hisamoto, Yoshitaka Uchida, Kazuma Takaoka

第25回言語処理学会年次大会, March 15, 2019.

複数粒度の分割結果に基づく日本語単語分散表現

https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/P8-5.pdf

真鍋陽俊, 岡照晃 (国語研), 海川祥毅, 髙岡一馬, 内田佳孝, 浅原正幸 (国語研)

第25回言語処理学会年次大会, March 15, 2019.

【特別講演】製品利用可能な形態素解析器『Sudachi』の現状と今後の展望

内田佳孝

14回 テキストアナリティクス・シンポジウム, February 8, 2019.

形態素解析器『Sudachi』のための大規模辞書開発

https://pj.ninjal.ac.jp/corpus_center/lrw/lrw2018/P-1-08.pdf

坂本美保, 川原典子, 久本空海, 髙岡一馬, 内田佳孝

言語資源活用ワークショップ2018, pp.118-129, September 4, 2018.

製品利用可能な形態素解析器Sudachi

高岡一馬

第24回言語処理学会年次大会ワークショップ「形態素解析の今とこれから」, March 16, 2018.

形態素解析辞書で曖昧性解消に挑む

坂本美保

第24回言語処理学会年次大会ワークショップ「形態素解析の今とこれから」, March 16, 2018.

Information Extraction from English & Japanese Resume with Neural Sequence Labelling Methods

http://anlp.jp/proceedings/annual_meeting/2018/pdf_dir/P10-5.pdf

Akihiro Katsuta (長岡技術科学大学), Hutama Adhi Hanjaya, Somnath Asati, Sorami Hisamoto, Kazuma Takaoka, Yoshitaka Uchida, Yuji Matsumoto (NAIST)

第24回言語処理学会年次大会, pp.1007-1010, March 15, 2018.

質問応答システムの基盤化と応答可能性の判定

http://anlp.jp/proceedings/annual_meeting/2018/pdf_dir/A4-3.pdf

谷岡広樹 (徳島大学), 中谷良平, 与儀涼子, 内田佳孝

第24回言語処理学会年次大会, pp.651-653, March 14, 2018.

その他、勉強会 など

形態素解析器「Sudachi」から見る形態素解析ことはじめ

http://anlp.jp/proceedings/annual_meeting/2018/pdf_dir/A4-3.pdf

高岡一馬

オープンソースカンファレンス京都2018, August 4, 2018.

Elasticsearchのための新しい形態素解析器 「Sudachi」

https://qiita.com/sorami/items/99604ef105f13d2d472b

Elastic stack Advent Calendar 2017

Javaでつくる本格形態素解析器

スライド: https://www.slideshare.net/WorksApplications/java-82794239

高岡一馬

JJUG CCC 2017 Fall, November 18, 2017

形態素解析の話

https://www.slideshare.net/WorksApplications/ss-78025845

高岡一馬

NLPエンジニアによる自然言語処理の実用化にむけた勉強会 https://wap.connpass.com/event/59358/ , July 22, 2017

ERPと自然言語処理

https://www.slideshare.net/WorksApplications/erp-78025661

内田佳孝

NLPエンジニアによる自然言語処理の実用化にむけた勉強会 https://wap.connpass.com/event/59358/ , July 22, 2017