データサイエンスを学べるオススメ本紹介
データサイエンスやAI開発を学びたい方へ向けたおすすめ書籍を紹介します。
まずは予備知識をつける
まずはデータサイエンスの勉強を始めるまでの前提知識を押さえるのに適した書籍を紹介します。
高校数学までの基本知識、パソコンの使用経験、簡単なプログラミングの経験があればこの辺りは飛ばしても問題ありません。
数学の基本を身につけたい
created by Rinker
¥2,750
(2024/11/21 03:09:31時点 楽天市場調べ-詳細)
データサイエンスやAIを扱うならば、最低限の数学の素養は必須です。
とはいえ、なかなか範囲の広い数学をすべて復習するのは大変です。
この書籍は、データサイエンスやAIの理解に重要な項目のみに絞り、しかもPythonでどう計算を実行するかまで解説した、社会人がデータサイエンスを学び始めるための素晴らしい入門書となっています。
プログラミングの部分はよく分からない場合は、一旦飛ばして数学の部分だけ読んでいくのも良いでしょう。
データサイエンスをやるに当たって数学は全体的に大切ですが、その中でもとりわけ大切なのが「統計学」です。
「平均値」「中央値」などのデータの集計や、グラフの選び方・描き方・読み方に始まる統計学の知識とはデータを適切に取り扱うためのマニュアルとも言えるでしょう。
そんな統計学の基本的な方法論を、上記の書籍はマンガで平易に教えてくれます。説明も分かりやすく、入門に優れた一冊です。
ITスキルの基本を身につけたい
created by Rinker
¥1,738
(2024/11/21 06:24:35時点 楽天市場調べ-詳細)
さて、データサイエンスに必要なもう1つのスキル、それはITスキルです。(どんな職種であっても大切ですが…)
ITスキルといっても幅広いですが、まずはインターネットで調べたい事を調べられる、といったレベルからでOKです。その上で、社会人としてやっていくならば何はともあれ表計算ソフトはある程度使えた方が良いでしょう。
そして、表計算ソフトの代表格といえばやはりExcelです。
Excelに自信のない場合は、この本に掲載されているExcelの操作・ショートカット・関数を学べば、社会人として立派にやっていけるだけの十分なExcelスキルを得ることができます。
データサイエンスをするに当たっては最低限のプログラミングスキルも必要です。
そして、これらに使われるプログラミング言語の第一位はなんといってもPythonです。
Pythonさえ学んでおけば仕事は幾らでもあります。そしてこの書籍は初学者にもとても分かりやすくPython(プログラミング)の基礎を学ぶことができます。
(ちなみにゲーム開発、アプリケーション開発、Webページ作成などが目的の場合は、HTML/CSS、Javascriptなども学んでおくと良いでしょう。)
データサイエンスを学び始める
前提知識がおおよそ分かってきたら、いよいよデータサイエンスの世界に突入しましょう。
「データ分析」をメインに行うのか、「AI(人工知能)開発」をメインに行うのかで少し方向性が変わってきます。
データ分析をメインに学びたい
データサイエンスに大活躍する「統計学」をより深く学ぶためには、何十年も愛され続けるこの名著をお勧めします。
この書籍で説明されているように統計解析の手法を数式ベースで理解しておけば、手元のデータにより適切な統計処理を施すことができ、より良い判断を下すことができます。
少々、大学の参考書のようで堅苦しい雰囲気はありますが、文章は非常に平易に書かれています。
たまに差し込まれる統計学コラムも面白く、教養としても役立ちます。
こちらはより実践的な内容です。本のタイトルにもある「Kaggle」とはデータ分析コンペのサイト名です。主催者から与えられたデータを用いて、より最適なデータ分析をした個人(団体)には賞金が与えられます。
Kaggleでより上位に食い込むための戦略という名目の書籍ですが、理論一辺倒ではない、実践的な「分析精度の上げ方」についてさまざまな方法論を解説した意欲作です。Kaggleに参加することが目的でなくてもとても参考になります。
ちなみに、賞金目当てでなくても、勉強としてKaggleのコンペに参加するのは非常に勉強になるので、それはそれでおすすめです。(参加費は無料です。)
データ分析とはつまり、「データの中に潜む規則性を見つける」ことを目的としています。言わば(そういう意識を持っていなくとも)手元にあるデータを何かしらの数式に当てはめるという作業をしているのですが、そうやって数式化したものを「数理モデル」と呼びます。
その数式に当てはめる方法論は数多くあるのですが、この書籍はそんな数理モデル化の方法論の全体像を俯瞰して纏め上げた一冊です。
テーマ自体は難解なものもありますが、難しい数式は最低限にして説明されているので、とても読みやすく作られています。
AI開発をメインに学びたい
一般社団法人日本ディープラーニング協会主催の検定試験「G検定」の参考書です。
検定合格のためのテキストという謳い文句ですが、「AIの生まれた背景や技術のおおまかな全体像を知る」といった意味でとてもよく整理されています。
逆に、あまり込み入った説明は無いので、この書籍だけだとG検定に合格するのは難しいような気もします。合格目的より、AIの世界を学ぶために読む、という方が良いのかもしれません。
世の中のAIの9割方に使われているであろうディープラーニングの仕組みから実装方法まで一気に学べる一冊です。
Pythonの基本操作の説明から入るので、復習にも使えます。
ディープラーニングは非常に複雑で、その種類やパラメータが山ほどあり「何が何だか分からん」といった状態になるのですが、この書籍ではその中でも特に大事な部分の説明に絞り、数式は少なめに、なるべく平易に説明するように工夫がなされています。
また、説明と共にPythonコードも記載してあるので、この書籍を理解すればディープラーニングを自分で構築することができ、そのうえ精度を上げていくためのコツも掴めます。
データ活用やAI活用のビジネスを学びたい
データサイエンスに大事なのは技術力だけではなく、きちんとプロジェクトを遂行するためのビジネス力も重要です。
この書籍ではそのビジネス面のノウハウを解説しています。いくら数学やプログラミングの知識を多く蓄えても、それらが実用化されなければあまり価値はありません。
この本には、データサイエンス技術から最大限の効用を産み出すための基礎知識が詰まっています。特にマネージャークラス以上の方には必読書かと思います。
さらにハイレベルを目指す
こちらは、更に高度な技術力やビジネス知識をつけるための書籍です。
読破するには骨が折れるものが多いですが、これらの書籍の内容が頭に入っていたら、「日本を代表するレベルのデータサイエンティスト」と呼べるでしょう。
データ分析を極めたい
通称「緑本」と呼ばれる、統計モデリングの名著です。
より自由な数理モデリングを行うためには階層ベイズなどのベイズ統計モデルを学ぶ必要があります。
統計学・確率論・機械学習といった数学の基本知識と、Rというプログラミング言語の基本知識がある前提で話が進むので、まずはそのあたりを押さえてから臨むのが良いでしょう。
ベイズモデリングをStanというソフトウェアとRというプログラミング言語で行う方法について整理された書籍で、この表紙から通称「アヒル本」とも呼ばれます。
研究者の方でないとStanやRを使う機会はあまり無いかもしれませんが、Pythonでは実現が難しいほど高度な統計処理が可能です。
専門的な内容にはなりますが、このテーマを学ぶのならばこの書籍一択では無いでしょうか。
AI開発を極めたい
上述の「ゼロから作るDeep Learning」がディープラーニングの実装方法を中心に解説したものとすれば、こちらはディープラーニングの仕組みをきちんと数式で説明したものです。基本的な線形代数、微積分の理解が無いと読めませんが、この書籍を理解すればきちんと意思を持ってディープラーニングの構築・パラメータ調整が出来るようになるでしょう。
少し内容はハイレベルではありますが、薄めの本なので取っ付きやすいかもしれません。
AIビジネスの動向を押さえたい
AIのビジネス動向・技術動向を押さえたいのならば、おそらくこの書籍に勝るものはないでしょう。
AI技術は日進月歩に進化しており、それに合わせてビジネスの世界も変化し、そして拡がっていきます。この本は毎年発売されていて、そんなAIの動向を1年ごとに振り返っています。
厚く大きな本なので、全てに目を通すというよりは気になったテーマのみ読む形の方が良いかもしれません。
AI、データサイエンス関連の読み物
技術書寄りではなく、読み物として楽しめる図書を紹介します。
アメリカに次いで2位だった日本のGDPは、2010年頃に中国に抜かれました。
しかも、ここ数年の推移からするとドイツ・インド・韓国などの諸国に抜かれるのも時間の問題です。国民1人あたりの生産性という面ではすでに大敗しています。
著者は、この原因は「データを扱える人材」の不足や「未来を創る人材」の不足などにあると説きます。
現実は国家レベルでの対策が必要ですが、企業レベル・個人レベルでもやれる事はたくさんあります。
次世代を担う人材になるor育てるために、まずはこの書籍を通して日本国の現状を知り、受け入れ、そして具体的な行動を学びましょう。
東京大学の入試試験に合格することを目指したAI開発プロジェクト、通称「東ロボくん」プロジェクト責任者の新井紀子先生の著作です。
そのプロジェクトを通して露わになった「AIの得意なこと/不得意なこと」についてて述べつつ、同時に現在の「学校教育」「子どもの学力低下」の問題にまで切り込んだ意欲作です。
しかし学生の”読解力低下”の問題は想像以上でした。本書ではその具体例が色々と述べられており、これからの「教育」の在り方についても考えさせられます。
「データ」というものは、その見せ方によっていくらでも印象操作が出来てしまいます。
あくまで「恣意的な見せ方」であって「嘘」では無いため、メディアが世間を煽るための常套手段とも言えるでしょう。
これに騙されないために、我々は提示されたデータや数値にある背景をきちんと理解し、印象操作に惑わされず正しく理解・解釈しなければいけません。
この書籍はそんな様々な「印象操作されたデータ」を実例とともに紹介し、正しいデータの読み方を教えてくれます。
この実例がまた身近な例で面白く、教養としても十分な価値があります。厚めの本ですがスラスラと読み進められてしまいます。
ベストセラーを記録した人工知能(とりわけディープラーニング)に関する著書です。
一体AIとはどんな技術なのか。何が出来るのか。逆に、人間にしか出来ないことは何なのか。
人間の仕事が全てAIに奪われる事は無いでしょうが、人間とAIが共存共栄していかないといけない時代は必ずやってきます。
そんな、素晴らしい人生の相方であるAIとは一体何者なのか。
この本を読めば来るべき時代に備える事ができます。
その他の読み物
IT技術者のスキルアップの方法、出世や給与アップの方法、副業の始め方、それに加え健康維持の方法などといったテーマを扱う、他のIT関連図書とは一線を画した著作です。
IT技術者に向けた自己啓発本、といったイメージでしょうか。私がブログやYouTubeを開始したのもこの本がきっかけです。
仕事に対する考え方が変わり、より自分にとって良い人生選択をする一助となってくれるでしょう。
前作の続編です。前作の内容では語りきれなかった部分に注目し、とりわけタイトルにもあるように自身の「キャリアの伸ばし方」について細かく解説してあります。
かなり分厚く、多角的な話題が含まれるので、気になった項目だけを読むような辞書的な使い方をしても十分に楽しめます。
Googleの人事担当のトップであるラズロ・ボック氏の著作です。
Googleがどのように人材配置や人事評価をしているのか、どう素晴らしい人材を発掘しているのか、そういった人的リソースの活用ノウハウについて書かれた名作です。
人事に頭を悩ませない企業はまずありません。多くの企業でこの考えが取り入れられたら良いのに、と切に思います。
本ページの情報は、適宜、更新していきます。