データサイエンス入门 教养としてのデータサイエンス
人類社会はいま歴史の転換点に直面しています。言うまでもなく、ビッグデータの出現とデータサイエンスやAIなどのデータの活用技术の飛躍的発展を背景とするデータ駆動社会への転換です。自動運転、機械翻訳、画像認識、スマホ活用、コンピュータゲームなど、生活のあらゆる場面で21世紀初頭とは全く違う世界が拓かれつつあることは日々実感していることと思います。このような新しい社会の実現を視野に、政府は「AI戦略2019」において、デジタル社会の読み?書き?そろばんともいうべき「数理?データサイエンス?AI」の基礎を50万人のすべての大学生が習得すべきとしています。これに対応して数理?データサイエンス教育強化拠点コンソーシアムでは、2020年に产业界や関係団体の協力も得て、「導入」、「基礎」、「心得」、「オプション」の4部構成で約250のキーワード (知識?スキル) からなる数理?データサイエンス?AIのリテラシーレベルのモデルカリキュラムを公表しました。
本書は、このモデルカリキュラムのうち「オプション」を除く「導入」、「基礎」、「心得」のキーワードを網羅した完全準拠の入門書として執筆されたものです。3章11節構成のそれぞれの節は、日本を代表する研究者や実務家の方々に執筆していただき、多くの実際的な事例の紹介や豊富な図表を取り入れています。「導入」の章では、データ活用によって社会で実際に起きている変化を紹介するとともに、実際に活用されているデータ、データ活用のための技术、最新動向なども紹介し、データサイエンスやAIを学ぶ必要性を実感できるようにしています。「基礎」の章では、データを読む (分析の方法)、データを説明する (可視化),データを扱う (表計算) という最も基礎的なデータ活用技术の概略を学びます。その一方、「心得」の章では、AI活用の結果生じうる負の事例を紹介しながら、ELSIや倫理などのデータサイエンスやAIを適用する上での留意事項や、情報セキュリティやプライバシー保護などのデータを取り扱うときに守るべき事項を学びます。
本书によって、すべての大学生がデジタル社会のパスポートともいえるデータサイエンスの必须事项を习得し、データ活用社会を享受できるようになることを期待しています。なお、リテラシーレベルのカリキュラムのうち本书では取り上げていない「オプション」に兴味がある场合や、本书の内容を超えてより深く学びデータ駆动型社会の発展に贡献する意欲がある场合には、の他の11巻に进むことを推奨します。
(紹介文執筆者: 情报理工学系研究科 / 数理?情報教育研究センター 特任教授 北川 源四郎 / 2022)
本の目次
1.1 社会で起きている変化 (樋口知之)
ビッグデータ / 検索エンジンとSNS / 第4 次产业革命 / AI の驚異的発達 / 人間の知的活動とAI
1.2 社会で活用されているデータ (樋口知之)
データの種類 / データの所有者 / 構造化データと非構造化データ / 自動翻訳
1.3 データとAI の活用領域 (孝忠大辅)
事業活動におけるデータ?AI 活用の広がり / 活用目的ごとのデータ?AI 活用の広がり
1.4 データ?AI 利活用のための技术 (内田诚一)
誰もが無意識にデータを解析して生きている / さまざまなデータ解析 — 予測 / さまざまなデータ解析 — グルーピングとクラスタリング / さまざまなデータ解析 — 発見 / データ解析の関連話題 / 非構造化データ処理 / データ可視化 / パターン認識技术 / 人工知能
1.5 データ?AI 活用の現場 (丸山 宏)
データ分析による意思決定 / 情報技术による自動化 / データ分析?自動化の実際 / 組織的考慮点
1.6 データ?AI 利活用の最新動向 (内田诚一)
AI 等を活用した新しいビジネスモデル / AI 最新技术の活用例
第2章 [基礎] データリテラシー
2.1 データを読む (川崎能典)
データの種類 / データの分布と代表値 / 代表値の性質の違い / データのばらつき / 観測データに含まれる誤差の扱い / 打ち切りや脱落を含むデータ、層別の必要なデータ / 相関と因果性 / 母集団と標本抽出 / クロス集計表、相関係数行列、散布図行列 / 統計情報の正しい理解
2.2 データを説明する (椎名 洋)
データの表現 / データの図解表現 / データの比較 / 不適切なグラフ表現 / 優れた可視化の例
2.3 データを扱う (川崎能典)
表形式のデータ / データ解析ツール / SSDSE データを扱う
第3章 [心得] データ?AI利活用における留意事項
3.1 データ?AI を扱う上での留意事項 (中川裕志)
ELSI / 一般データ保護規則:GDPR / 十分性認定 / AI 倫理 / AI 脅威論 / ブラックボックス化 / 説明可能性 / アカウンタビリティ、透明性、トラスト / 公平性 / データ?AI 活用における負の事例紹介—データの悪用?目的外利用 / データ?AI 活用における負の事例紹介—フラッシュクラッシュ
3.2 データを守る上での留意事項 (佐久间淳)
データサイエンスにおけるセキュリティとプライバシー / データサイエンスと情報セキュリティ / データサイエンスとプライバシー
関连情报
第15回日本统计学出版赏 (日本统计学会 2022年)
书评:
白石壮馬 評 (『電子情報通信学会誌』Vol.105 No.2 2022年2月)
石井一夫 評 (『情報処理』Vol.63 No.2 2022年2月号)
中島悠太 評 (『映像情報メディア学会誌』Vol. 76 No. 1 2022年1月)
话题の本 (日刊工业新闻19面 2021年10月27日)