人工知能はどうやって男女判別しているの? | SiTest (サイテスト) ブログ

メニューボタン閉じるボタン

人工知能はどうやって男女判別しているの?

こんにちは。
昨年から引き続き「AI」 や「人工知能」という言葉をCMやニュースでよく耳にします。
ディープラーニングとの掛け合わせでどんどん進化していく人工知能ですが、何を学習させるかによってサービスの種類は大きく変わります。

アプリに登録して、休日の旅行プランやおすすめの曲など、人工知能が膨大なデータから個人の性別や好みを推測して適したものを提案するサービスは既にありますが、
プロフィール登録をしていなくても、人工知能からおすすめされるプランがあまりにも好みド真ん中だと、もしかして個人情報が漏れている…?と少し不安になることもあるかもしれません。

今回のブログは機械学習を通した人工知能の性別判断の仕組みに焦点をあてていきたいと思います。

最初に申し上げますと、人工知能による男女判別方法は多岐に渡ります。
今回は、人工知能が男性と女性をシンプルに見分ける場合の「素性」というキーワードを挙げたいと思います。

素性とは?

わたしたち人間は、なにかしらの情報を判断材料として男性と女性を見分けるはずです。
それは目に見えるものだけで判断したり、声や言葉遣いだけで判断していることもあります。

人工知能も同じで、男女の識別に使えそうな情報を取り出します。
その識別に使う情報のことを「素性」と呼びます。

機械学習では、男女の識別に使えそうな情報を取り出すために、個々の素性に対して重み(素性に対する重要度を数値化すること)を与えます。
どのような重みの学習をするかという点が、機械が自動で分類する上で重要です。

例えば、各素性に対して、女性の特徴が強く出るものは正の値、男性の特徴が強く出るものを負の値と定義して、以下のように重みとなる数値を設定してみます。
素性が持つ重み付けされた数値と、属性を表す数値を掛け合わせ、その掛け合わせた数値の合計によって男性らしさ、女性らしさを求めることができます。

この場合、Aさんは男性、Bさんは女性である可能性が高いという結果になりました。

このように、この数値の大小で機械は男性か女性かを自動で分類することが可能になります。
実際の機械学習では、素性とその重みを見つけ出すために大量のデータを必要なので、精度の高い判別にはデータの量と適切な重み数値の割り振りが重要となってきます。

人工知能にとってデータは宝

わたしたち人間の情報は些細なことでも人工知能にとっては大事なものです。
個人情報は除き、すでにさまざまなシーンでデータが収集されています。

実際にGoogleの場合は、興味にあった広告を表示することを目的として、Google検索エンジンのサイト閲覧履歴からユーザーの年齢と性別を予測しています。
女性のユーザーが多く訪れるサイトに頻繁にアクセスしていたら、Googleは女性と予想し、女性向けの広告を出すような仕組みになっています。

Googleの年齢や性別を推測するプロセス

1.ウェブサイトサイトアクセス時のブラウザ環境、IPアドレスなどを元に
各クライアント(PC、スマホ)に重複しない番号を付与

2.サイトにアクセスして動画を閲覧した場合、「Cookie」によってブラウザに番号が保存され、アクセス履歴を記録

3.日々の検索キーワードや、検索結果から 実際にアクセスしたページなどを記録

4.記録データを分析し、年齢や性別を割り出す
(例:就職活動と化粧品を頻繁に検索していれば、女性で20代前半の学生と判断される)

また、日本マイクロソフトが開発した「りんな」などの会話型ボットは、さまざまなSNSツールと連携できるようになり、徐々に一般ユーザーの生活の中に浸透しています。
機械学習の機会を増やすために、さまざまな企業がデータ収集に力を入れるという動きが見えて来ています。

ちなみに、「りんな」は昨年の12月21日より、過去に放送されたテレビ番組やCM、出演した俳優・芸能人・タレントの情報を、TVメタデータで横断的に取り込むことにより、芸能人がテレビで紹介したおすすめスポット情報を提供する「芸能人聖地巡礼」機能をユーザーに提供すると発表されています。

人工知能の判別精度が向上したらなにが期待できるか

性別は人間でもどちらか判断できないこともあるように、機械も100%の精度で判定することはできません。
先ほどの「りんな」のようなチャットボットのように、実践的な活用が広がる中で、
ユーザーからの問い合わせ対応や検索など人間の命令に従って答えるものから、人工知能自らが主体的に人間に関わりアシストするものへと人工知能の役割が変化しつつあります。

もし男女の判別精度がさらに向上したら、先ほどのGoogleの年齢・性別を推測して広告を最適化させていくように、人工知能でも同じく性別に合わせた提案レベルはさらに高まることでしょう。今後も人工知能の精度の高まりに目が離せません。

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

今すぐお気軽に
ご相談ください。

0120-315-465

(平日 10:00~19:00)

グラッドキューブは
「ISMS認証」を取得しています。

認証範囲:
インターネットマーケティング支援事業、インターネットASPサービスの提供、コンテンツメディア事業

「ISMS認証」とは、財団法人・日本情報処理開発協会が定めた企業の情報情報セキュリティマネジメントシステムの評価制度です。

いますぐ無料で
お試しください。

SiTest の革新的な機能を
お試しいただけます。
利用規約

お名前【必須】
メールアドレス【必須】
電話番号【必須】