AI導入--機械学習で事業価値を生み出すデータとは

AI導入--機械学習で事業価値を生み出すデータとは

活用するデータの設計

 冒頭で述べたように、機械学習を活用した機能を作るためには学習させるデータが必要です。機械学習プロジェクトの検討フェーズにおいて、まずは目的(実現したいこと)を決め、その目的を達成するために必要な情報(機械学習を用いて予測したい情報)を設計します。そして、具体的にどのようなデータを用いて学習を行うか検討を始めます。

データの確認事項

  • 【データの出所】取得方法、取得期間 など
  • 【データの形式】文字コード、改行コード、数字の単位、時刻の基準 など
  • 【データの分布】データの集中の度合いや裾の長さ、相関性 など
  • 【基本的な指標】平均値、中央値、四分位範囲、標準偏差 など
  • 現象との関係】データが記録される条件や、データ取得時の例外処理 など

japan.zdnet.com