文章を自動要約するサービスTagDoxを使ってみた | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

文章を自動要約するサービスTagDoxを使ってみた

以前の記事でWatsonのNaturalLanguageClassifierをご紹介させていただきましたが、今回はその分類器機能に加え文章の内容を解析し要約してくれるサービスTagDoxを使ってみました。

概要

TagDoxは大量にある文書をタグ付し整理するためのウェブサービスです。
そういったサービスは度々ありましたが、加えて人工知能によって文書の要点も洗いだしてくれます。
上手く使えば文書の整理が一気に進むのではないでしょうか?

ただしまだβ版で日本語にも対応していないようです。
どの程度の対応具合かも併せて見てみましょう。

使い方

まず登録する必要があります。
まだβ版だからでしょうか、サービスの登録はLinkedInのアカウントが必須となります。
TagDox独自のアカウント登録はなくLinkedInとの連携でしか登録はできません。

登録したら下記のような画面が出てくるので分析したい文書をドラッグ&ドロップするだけ。

tagdox

その後Summary画面に移動してみましょう。
それまでアップロードしたドキュメントがサイドバーメニューに現れます。

それぞれタグごとに一覧表示されており選択するとそのタグに関連する文章が段落ごとに選ばれます。
そのためこのブログ記事の用に頻繁に段落を変える文書ですと段落あたりの情報量が少ないので最初は的外れなタグが設定されるかもしれません。

このサービスの面白い所は自分でタグセットを作成することができ、さらにそのタグごとの関連する文書に対して正解を入力することができます。
これによって文書とタグの関連度合いを学習し次の文書の分類に役立ててくれます。
学習を重ねることで精度は上がっていき、そのタグの内容を端的に表した段落を見つけることができます。
これによって目的に応じて文書の要点を抽出することができます。

この文書なんだったっけ?となっても要点を読み直せば思い出しやすいですね。

ちなみに学習モデルはグループを作り共有することもできますので、チーム間での情報共有等にも使いやすそうです。
サービスインしたらこのあたりから課金していくのでしょうか?

日本語対応具合

β版のサービスで日本語には対応していませんが無理矢理日本語のNLCの記事をファイルを読み込ませてみました。
画像のようにちゃんとタグで分類されましたが、中を見てみると全部同じような内容でした。

tagdox2

日本語のタグセットを整えるとか、もっと文書を読み込み学習させるとかすればもう少しかしこくなるかもしれませんが、現状日本語ではまだ使いにくい印象です。

まとめ

まだ始まったばかりのβ版のサービスですが、タグと関連段落抽出が実用段階で動作するなら非常に便利なサービスと言えるでしょう。
ただUI上ではWordで作った.docxファイル等も対応しているのですが、地味にpdfしか対応していなかったのも辛かったです。
あと文書の中には公開したくないものも多いのでPrivate、Public分けることもできます。
アップロード自体したくないファイルもあるので自社サーバーに立てれたらもっと便利だと思います。

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

グラッドキューブは
「ISMS認証」を取得しています。

認証範囲:
インターネットマーケティング支援事業、インターネットASPサービスの提供、コンテンツメディア事業

「ISMS認証」とは、財団法人・日本情報処理開発協会が定めた企業の情報情報セキュリティマネジメントシステムの評価制度です。

いますぐ無料で
お試しください。

SiTest の革新的な機能を
お試しいただけます。
利用規約

お名前【必須】
メールアドレス【必須】
電話番号【必須】