ビジネスの現場で必要とされる数学基礎の具体例~AI編~
ビジネスパーソンにとってのデータサイエンスの基礎理論にあたる「数学」を学ぶ重要性について、業務で活用する具体例をあげて考えていきます。
大きく「データ観察・可視化・分析」「数学基礎」「アルゴリズム」「機械学習基礎」「深層学習基礎」の5つに分け、本記事では、「AI編」として、「アルゴリズム」「機械学習基礎」「深層学習基礎」についてご紹介します。
※本記事は、「データサイエンス数学ストラテジスト[中級]公式問題集」および「データサイエンス数学ストラテジスト[上級]公式問題集」(いずれも日経BP)のまえがきの内容を再編集したものです。
AIを効率よく使える「アルゴリズム」の知識
AIツールをビジネスで活用していると、「いつまでたってもツールから答えが返ってこない」といった場面にぶつかることがあります。データ量が多すぎたり、時間のかかる処理をしたりするとこうしたことが起きますが、AI ツールはなぜ止まっているかを教えてくれるとは限りません。そんなとき、AI の使い手であるみなさんがAI の“ お医者さん” になる必要があります。そのためには「アルゴリズム」の知識が不可欠です。
たとえば、あなたがある小売店の社員だとして、(A)全国にある自社の店舗と(B)全国の市町村の人口データを持っていたとします。(A)(B)のデータがそれぞれランダムに並んでいる場合、各店舗とそれぞれの市町村の人口をひも付けるのはとてもたいへんです。たいへんというのは計算処理に多く時間がかかるということです。データの量や並び方によって計算時間が異なるといったアルゴリズムの基礎を知っていれば、「ランダムな並び順のデータなので計算に時間がかかりAI が止まってしまったように見えているんだ」とわかりますが、背景知識がないと原因にたどりつけないかもしれません。
分析に奥行をもたらす「機械学習基礎」
機械学習や統計モデルには予測・分類・強化学習の3種類があり、それぞれに対して複数の手法が存在します。たとえば、「ロジスティック回帰」は各要素の「確からしさ」がわかりますし、「決定木」は複数要素による「交互作用効果(ある要素と別の要素を組み合わせることでより傾向が強く出る効果)を捉えやすい」という特徴があります。
ビジネスの世界におけるデータ分析では、ロジスティック回帰や決定木を頻繁に使います。たとえば、あなたが通販会社でデータ分析を担当していて、どの顧客に対してDM を送付するのが効果的なのかを判断する必要があるとします。これまで購入してくれた顧客リストのなかからターゲットを絞り込んでいく際、機械学習的な「ランダムフォレスト」や「SVM(サポートベクターマシン)」などの手法を使えば精度を高めていくことが可能ですが、実際にはDM にそのターゲットに刺さるようなメッセージが必要であるため、ロジスティック回帰などのように「何の変数」が強く影響しているのかを知り、決定木分析で顧客のイメージを想像していくことが極めて重要となります。その際、分析ツールやPython のライブラリなどを使えば「パパっと」できてしまいまいすが、その裏側で実施していることをイメージできれば分析に奥深さが出てくるでしょう。
学習済みモデルで時間を短縮「深層学習基礎」
現在のAIは人間の脳をモデルにしたニューラルネットワークをベースに作られています。これを「深層学習」と呼び、人間と同様に、深層学習にもいろいろなタイプがあります。画像に強いタイプ、文章に強いタイプなどです。また、人間と同様に深層学習は学習しないといけないのですが、深層学習はその学習に時間がかかり、多くの「教師データ」(教材のようなもの)が必要です。しかし、これらは常に用意できるとは限りません。
たとえば、深層学習で猫を見分けるには、さまざまな種類、大きさ、色の猫の画像が必要です。囲碁や将棋の世界でもAIは浸透していますが、これらのAIには莫大な学習時間が必要で、一個人の環境ではなかなか用意できません。そんなときに有効なのが「学習済みモデル」です。学習済みモデルはその名のとおり、すでに学習を行ったあとのモデルですので、学習時間が非常に短くて済みます。先ほどの猫の例でいえば、学習済みモデルを使えばほとんど追加学習なしに猫を判別できるようになります。
ただし、これにも注意が必要です。学習済みモデルは未学習のものに対しては適用できないことがあります。たとえば、英語の文章を学んだ学習済みモデルは、日本語には適用できません。さらにいうと、日本語の文章を学んだ学習済みモデルでも、専門用語の多い文章は読めないことがあります。
AIと一緒に働くビジネスパーソンに必要なこと
さて、ここまでAIを説明したことで、AIと一緒に働くビジネスパーソンが身につけないといけないことが見えてきたと思います。このAIはどういったモデルで、どういったことに強くて、何に弱いのか、事前にどんなことが必要なのかといったことを理解しておくことが必要なのです。AIではどこまで適用可能なのか、その肌感覚を得るには、理論的背景を学ぶことはとても有効なのです。
記事を書いた人
木田浩理
三井住友海上火災保険株式会社 データサイエンティスト
伊藤豪
三井住友海上火災保険株式会社 データサイエンティスト
高階勇人
三井住友海上火災保険株式会社 データサイエンティスト
山田紘史
三井住友海上火災保険株式会社 データサイエンティスト
安田浩平
三井住友海上火災保険株式会社 データサイエンティスト