データ駆動社会とSociety5.0

 AIは日々進化を続け,その応用範囲はどんどん広がっています。 これまでもデータの収集や分析は行われてきていましたが,意思決定はあくまでも伝統や積み上げてきたノウハウをもとに人間が行っていました。 これからの時代では,さまざまな形で集められたデータをもとにAIが意思決定や問題解決を行う社会となっていきます。このような社会のことを「データ駆動社会」と言います。 私たちが普段使っているスマートフォンアプリやオンラインショッピングでは,すでにAIが私たちの好みや行動パターンを学習して,おすすめの商品やサービスを提案しています。 他にも,医療の分野でも診断や治療にAIが活用され,より正確で迅速な対応が可能になっています。

 このAIを中心としたデータ活用は,日本が目指す未来社会「Society5.0」と深く関連しています。 Society5.0は,AIやIoTを活用して,現実世界とサイバー空間を融合させ,私たちの生活がより豊かで便利なものになった社会です。 IoTによって集めたデータをAIによって解析し,農業や交通,教育,防災対策など,あらゆる分野で,最適な解決策を瞬時に導き出してサポートします。 データ駆動社会がSociety5.0を支える大きな柱なのです。

 一方,データ駆動社会にはいくつかの懸念点もあります。代表的なものは次項で説明するAIシステムと倫理に関する問題と,AIの発展に伴う人間の働き方の変化です。 AIシステムが発展すると,現在人間が行なっている仕事の少なくない割合が自動化できてしまうでしょう。生成AIの発展に伴い,それは単純作業に限らず,知的で創造的な作業すらもAIに置き換えられる可能性が出て来ました。 結果的に仕事を失う人が出てしまうことや,新しい技術に適応できない人が取り残されて格差が生じてしまう恐れがあります。 AIの発展を進める立場としては,これらのことも頭に入れながら,なるべく社会に負の影響が少ないように進めていく責任があります。


AIシステムと倫理

 これまで学んできたように,AIシステムとは,顔画像から人を認識したり,車載カメラの映像から対向車や道路標識を認識したりと,何か問題を解決するためにデータを用意して適切に学習をさせたシステムのことでした。

 一方,AIシステムを実際に人間社会で用いる場合には,AIが人間社会において倫理的・法的・社会的な問題 (ELSI: Ethical, Legal and Social Issues) を引き起こさないように注意する必要があります。 AIにおけるELSIの例としては以下のような問題が挙げられます。

・AIが差別を助長することがないか
・AIによって事故が起きたときの責任の所在は定まっているか
・AIの学習に使ったデータに偏り(バイアス)はないか

 以下でそれぞれについて簡単に説明しますが,AIシステムのELSIに関する議論は今後しばらく続いていくことと思います。 2019年のG20サミットにて『AI原則』というものが作られ,少しずつ枠組みが作られてきてはいますが, AIシステムと共存していくための法律等の整備が進まないことには抜本的な進展は難しいでしょう。 法律を適切に整備するためにはAIについての基礎知識が必要不可欠です。 だからこそ,全員を対象としたAIリテラシー教育が必要となっています。

AIが差別を助長することがないか

 例えば某社がAIを活用した採用システムを手掛けた際に,自社の履歴書パターンから学習させた結果,もともとの従業員が男性の方が多かったために,「男性を多く採用するのが好ましい」という学習をしてしまったという話があります。 他にも画像認識システムが黒人の写真に「ゴリラ」というタグを付けたとして問題になったという話もあります。 これらは明らかな差別であり,AIだからといって許されることではありません。

 また,AIシステムの他のITサービスと比べての特性として「公開後もユーザからデータを集めて学習を続ける」というものがあります。 これによって,常に最新の動向を踏まえたサービスを提供できるようになるのですが,一方で悪意のあるユーザがAIの学習をコントロールするという,AIシステムに固有の”ハッキング”という脅威を持っています。 過去には,マイクロソフト社が作った”Tay”というTwitterボットのAIが,悪意を持ったユーザとの会話から学習を続けたせいで,差別的な発言を繰り返すようになってしまったという事件がありました。

 AIシステムを構築する際には,このように下手したら誰かを傷つけてしまうという可能性も想定した上で構築することが求められています。

AIによって事故が起きたときの責任の所在は決まっているか

 別な観点としては,例えば自動運転車が交通事故を起こしてしまった際にその責任は誰が負うのかといったような責任の所在の問題があります。 事実,これまでにも自動運転車が死亡事故を起こしたというニュースは何度かあります。

 技術者倫理に基づけば,製品の不具合による被害については製品の開発者が責任を負うべきですが, AIシステムはデータから学習して行動を決めるために,どんな行動を取るのかを開発者でさえ事前に全て把握することができないので, 開発者がどこまで責任を負うべきなのかは単純な問題ではありません。

 しかしながら,AIシステムを開発する立場にある人は,実際に責任を負わされるかどうかは関係なく,自分自身が責任を負うという意識のもとで,安全性を確保したシステムを作るために最善を尽くさなくてはならないでしょう。

AIの学習データに偏り(バイアス)はないか

 AIの学習にはデータが必要です。AIの学習の理論ではデータがそのクラス全体からまんべんなく集められたものであることを前提としています。 例えば,犬と猫を判別させるAIの学習で,猫の画像が全て左向きで犬の画像が全て右向きだったとします。そうしたらこのAIは「左向きが猫で右向きが犬」という学習をしてしまうでしょう。 このように,ある特定の性質を持った一部分から収集したデータのことをバイアスのあるデータと言います。

 バイアスにも種類があり,この犬と猫のような例を選択バイアスと言います。 他にも,SNS上の発言等から学習させようとすると,SNSで活発に発信する人は少数なので,その活発な少数の意見に偏ってしまうというのも有名なバイアスで,活動バイアスと言います。 これらは一例で,他にもたくさんのバイアスがあります。

 バイアスはとてもやっかいである上に無意識的に入ってしまうこともあり,対処の難しい問題です。 AIエンジニアは過去に問題になったバイアスの例などをよく調べ,バイアスに気づける感覚を養っていく必要があります。


AIエンジニアのための必要なスキルセット

 機械学習は全員が同じような事柄について学んでいくことがベストではなく、 大きく分けてビジネスサイドとエンジニアサイドで分けられます。 ビジネスサイドの方は、企画からエンジニアサイドの方に仕事をパスできるまでを担当します。 エンジニアサイドの方は、出てきたお題をどのように実装して解決していくかが問われます。

 ここでは、それぞれどのようなスキルセットが必要になるのかを見ていきます。


ビジネスサイド

 機械学習を含めたAI案件では、「AIで何か面白いことをやってみたい」といった手段が目的となるケースが少なくありません。この目的と手段が逆転してしまう問題を避けるためにも、「解決すべき問題は何か?」を考えなければいけません。

 また、ビジネスサイドの方も、機械学習の原理を理解し、必要なデータを収集し、簡単に解析をかけてみるところまでやってみることです。これができると、費用対効果の見積もりに役立ち、本格的に開発を進めるかの意思決定もできるようになります。

 つまり、ビジネスサイドに必要となるスキルセットは,以下の2つであると言えます。

・データ収集まで見据えた課題設定力
・おおよその解析から費用対効果を見積もる力


エンジニアサイド

エンジニアサイドでは以下の3つのスキルが重要となります。

データの整理・前処理の技能

 データの整理とは、持っているデータから該当の日付や条件のデータだけを取り出したり、複数の保管方法にまたがっているデータをつなぎあわせたりといった作業のことです。 また、データの前処理とは、機械学習にデータを投入するためにデータから特徴となる性質を計算したり、適切な変換を施す作業のことです。手元にあるデータをそのまま入力データとして使用できない手法や課題において必須のスキルです。

 ディープラーニングの登場以来、画像をそのままお手軽に入力データとして使用するケースも増えてきてはいますが、データ数が大量に無いような場合などディープラーニングが最適ではないこともありますし,大半のケースは目的に合わせた前処理を行うことで性能を向上できることが知られています。

機械学習アルゴリズムに対する数学的な理解

 機械学習では与えられたデータに対して試行錯誤しながらモデルを構築していくのですが、ハイパーパラメーターと呼ばれる人間側でチューニングすべき変数がいくつか存在します。 しかし、このハイパーパラメーターを調整しようにも、原理が理解できていないため、どのように調整すればよいかの検討がつかないのです。 適したチューニングを行うには原理の理解が必要となってきます。

検証も踏まえた運用

 機械学習では、学習に用いたデータでの精度よりも、学習に用いていない未知のデータに対してどれだけ精度が出せるかが重要になります。 そのために,一番シンプルな方法としては,手持ちのデータを訓練データと検証データに分け,訓練データでモデルを学習させて、その学習済みモデルを検証データを用いて評価することです。一般的にこの作業を検証と呼びます。 本運用の前段階として、検証を行いながらの仮運用をすることが重要です。その仕組みを作ることと,運用をするための様々なスキルが必要となります。


まとめ

AIの基礎的な部分を紹介してきました。最後にこれまでの内容を復習しておきましょう。

・AIの歴史と活用例
・AI開発の流れと分析設計
・データ駆動社会とSociety5.0
・AIシステムと倫理
・AIエンジニアに必要なスキル

さらにAIについて学びたい人はWebサイトや書籍などを利用して勉強してみましょう。




参考:
株式会社キカガク
Build Insider

Back
to_top