データサイエンス入门 応用基础としてのデータサイエンス 础滨×データ活用の実践
本書はデータサイエンスの入門書である「教養としてのデータサイエンス」の続編です。「データサイエンス基礎」、「データエンジニアリング基礎」、「AI (人工知能) 基礎」の3部構成となっており、各分野の研究者12名が分担して執筆しています。
データサイエンスとはデータを記述?可視化?分析するための方法論です。データエンジニアリングはデータの収集?加工?保護などに必要な技术の総称であり、AIは知能を人工的に実現する研究領域です。近年はAI分野の急速な発展により、身近な生活にもAIの技术を目にする機会が増えてきました。大学や企業の活動においても、人文系?理工系?医薬系など、分野を問わずデータを分析することの重要性が認識され、またAIを用いた研究開発が進んでいます。そして、それぞれの分野で数理?データサイエンス?AIを利活用できる人材が求められています。
政府は「AI戦略2019」において、具体的なデジタル人材育成目標としてリテラシーレベル (約50万人 / 年)、応用基礎レベル (約25万人 / 年) を掲げました。このうち一つ目の目標であるリテラシーレベルは前著「教養としてのデータサイエンス」がカバーしていました。本書の内容は二つ目の目標である応用基礎レベルに対応しています。応用基礎レベルは「文理を問わず、自らの専門分野への数理?データサイエンス?AIの応用基礎力を習得すること」を目標としています。その学習項目は、大学における当該分野の教育推進を担っている数理?データサイエンス?AI教育強化拠点コンソーシアムが策定し、2021年3月に「数理?データサイエンス?AI (応用基礎レベル) モデルカリキュラム~AI×データ活用の実践~」として公表しました。本書もこのモデルカリキュラムに準拠しており、そこに含まれる基本事項を網羅した標準的な教科書となっています。
特色として、アルゴリズムの説明ではPythonに、データベースの説明ではSQLに、それぞれ簡潔に触れていることが挙げられます。いずれも関連分野では必須のスキルとなっています。また数式による解説も適度に含められており、データ分析、情報セキュリティ、深層学習、自然言语処理などの考え方を着実に学ぶことができると言えます。多くの大学生がこれらの知識を身に付け、それぞれが進む分野にデータサイエンスやAIを応用できるようになることが期待されます。さらに深く勉強したくなった学生には、「データサイエンス入门」シリーズの各書籍も参照することをお薦めします。
(紹介文執筆者: 情报理工学系研究科 教授 清 智也 / 2023)
本の目次
1.1 データ駆動型社会とデータ分析の進め方 (久野辽平)
データ駆動型社会とSociety5.0 / データサイエンスをとりまく現状 / データ分析の進め方
1.2 データの記述 (宿久 洋)
種々のデータ / 基本統計量 / 量的×量的データの要約 / 質的×量的データの要約 / 質的×質的データの要約
1.3 データの可視化 (宿久 洋?久野辽平)
基本的なグラフ / ビッグデータの可視化事例
1.4 データ分析の手法 (原 尚幸)
回帰分析 / 単回帰モデル / 最小二乗法 / 家賃のデータの回帰直線と予測 / 決定係数 / 重回帰モデルと最小二乗法 / モデル選択 / 重回帰分析の結果の解釈 / ロジスティック回帰分析 / 時系列データとその基礎集計 / 時系列データの変動分解 / アソシエーション分析 / クラスター分析
1.5 数学基礎 ()
微分積分基礎 / 線形代数基礎 / 確率?統計基礎
2章 データエンジニアリング基础
2.1 ビッグデータとデータエンジニアリング (内田誠一)
情報通信技术 (ICT) の進展とビッグデータ / コンピュータで扱うデータ / Internet of Things (IoT) / ビッグデータ活用事例
2.2 データ表現、プログラミング基礎、アルゴリズム基礎 (辻 真吾)
データ表現 / プログラミング基礎 / アルゴリズム基礎
2.3 データ収集と加工、データベース ()
データの収集 / データの整形?加工 / データの集計 / データベース管理システムの利用
2.4 ITセキュリティ (宮地充子)
情報セキュリティの基礎概念 / 暗号化 / 電子署名 / 認証 / プライバシー保護
3章 础滨基础
3.1 AIと社会 (松原 仁)
AIの歴史 / AIの諸領域 / AIと身体性 / AIとゲーム / AIの難問 / 深層学習と実世界問題 / AIと知的財産権 / AIと倫理 / AIの開発環境と実行環境 / AIシステムの開発プロセス / AIとこれからの社会
3.2 機械学習の基礎と予測手法 (赤穂昭太郎)
機械学習の基本的な枠組み / 汎化能力とモデル選択 / 正則化法とスパースモデリング / 交差検証法によるモデル選択 / 識別問題の機械学習 / 機械学習の評価法 / ベイズモデリングと予測
3.3 深層学習の基礎 (今泉允聡)
深層学習の基本的な枠組み / ニューラルネットワークの原理 / パラメータの学習 / ニューラルネットワークの拡張 / 発展的トピック
3.4 ロボット、認識、言语 (高野 渉)
ロボットとAI / 認識とAI / 言语とAI
関连情报
松江清高 評 (『人工知能』38巻5号 p. 769 2023年9月)
书籍绍介:
科学新闻 2023年3月10日