自然言語処理 | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

最新情報を発信する
SiTest ブログ

MeCab の辞書 mecab-ipadic-NEologd を試してみよう!

日本語の文書を解析しようと思った時に、ほとんどの人が 形態素解析のツールである MeCab を利用すると思います。MeCab でよく使われる辞書として IPADIC が挙げられます。しかし、IPADIC はとてもよく出来ていますが、更新されないまま年月が過ぎている状況です。
そこで今回は、新語に対応できる辞書の mecab-ipadic-NEologd をご紹介したいと思います。

続きを読む >

自然言語処理を活用してみよう!(固有表現抽出編)

自然言語処理は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術です。Web上では膨大なテキストデータがあり、テキストデータを解析し、色々なサービスで活用されています。その活用例を簡単にご紹介したいと思います。
自然言語処理の技術は、非常に広く毎年のように、様々な分野で新たな技術が研究されています。
今回はその中でも「固有表現抽出」という技術を実際のプロジェクト例を参考にご紹介したいと思います。

続きを読む >

人工知能が Twitter の「つぶやき」から感染症流行ピークを予測

※2017年5月12日に掲載されたCNNニュースの関連記事を受け、一部追記しています。(2017年5月16日)

私たちのネット利用のツールとして、切っても切り離せない存在「 SNS 」。
SNS の情報は私たちの生活に入り込み、今ではユーザー間の娯楽やコミュニティ構築だけでなく、デジタルマーケティングにも深く組み込まれるようになりました。

洪水や地震といった大きな出来事から、肩の痛みや鼻水といった個人的な出来事まで、SNS 上で起きた事柄を共有するユーザーは増えつづけています。

今回の記事は、そういったソーシャルメディアで投稿されるワードのデータを収集し、これから流行する感染症をいち早く察知するシステムの研究についてご紹介します。
続きを読む >

自然言語処理を活用してみよう!(形態素解析編)

自然言語処理は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術です。Web上では膨大なテキストデータがあり、テキストデータを解析し、色々なサービスで活用されています。その活用例を簡単にご紹介したいと思います。

弊社では、「SPAIA」という従来のスポーツニュースメディアとは違い、スポーツデータをAIによって解析し、新しいスポーツの見方や楽しみ方が実現できることに加え、弊社独自で編集部が取材・編集したオリジナルコンテンツを提供しています。

近日、選手名鑑を閲覧できる機能を提供予定です。また、NPB(日本野球機構)に関するコラム記事も多く出しており、その記事内容に選手名鑑に登録されている選手名があれば、該当する選手名鑑のページへリンクを貼る機能を作成してみたいと思います。

続きを読む >

高速検索エンジンElasticSearchを使ってみた!(More Like This 編)

前回は、ElasticSearchを使ってみて、その速さを体験体験してみました。
ElasticSearchの魅力は速度面だけでなく、類似文書を検索する機能や、ファジー検索、ファセット機能などがあります。そこで、今回は類似文書を検索して関連記事をレコメンドする機能を試してみたいと思います。ElasticSearchでは、「More Like This」 という機能を利用します。
続きを読む >


03-6441-3336

いますぐ無料で
お試しください。

SiTestの革新的な機能を、
1か月間無料でお試しいただけます。

お名前【必須】
メールアドレス【必須】
電話番号【必須】

利用規約はこちら