高度情報教育基盤ユニット(iEdu)

ユニット提供科目

  1. 現在の位置 : ホーム
  2.  
  3. ユニット提供科目-科目内容
  4.  
  5. データ分析入門

データ分析入門

授業の概要・目的

全14回の予定は、以下の通りである。
・計算科学とは(1回)
計算科学(けいさんかがく、Computational Science)は、数学的モデルとその定量的評価法を構築し、計算機を駆使して科学技術上の問題を解決する学問分野である。計算科学概論、計算科学の応用について講述する。
・数値計算(4回)
計算科学の重要な手法である数値解析・数値計算の基礎について講述する。2分法やニュートン法などの基本的な数値計算の内容について学習する。ま た、線形代数の基礎的な内容を学習した上で、計算機で統計計算を行う上で重要となるアルゴリズムを解説する。特に、連立一次方程式の解法であるガウスの消 去法、最小二乗法において基礎となるQR分解と特異値分解について解説する。
・統計処理(5回)
統計処理について概説し、統計学の基礎的な概念である平均、分散等を解説する。
その後、回帰分析、主成分分析等のデータの統計処理について講述する。加えて、Excelと統計ソフトRの実習を行う。Excelにおいては、 VBA(Visual Basic For Application)によるプログラミングを習得する。統計ソフトRのR言語についても実習を行う。
・大規模データ処理とクラウドコンピューティング(2回)
より大規模なデータ処理を行うために、近年注目されているクラウドコンピューティングについて講述する。特に、Hadoop、MapReduce等の具体的な分散処理の手法について解説する。
・情報の可視化(2回)

授業計画と内容

ガイダンス
全14回の予定は、以下の通りである。
・計算科学とは(1回)
計算科学(けいさんかがく、Computational Science)は、数学的モデルとその定量的評価法を構築し、計算機を駆使して科学技術上の問題を解決する学問分野である。計算科学概論、計算科学の応用について講述する。

計算科学とは
・数値計算(4回)
計算科学の重要な手法である数値解析・数値計算の基礎について講述する。2分法やニュートン法などの基本的な数値計算の内容について学習する。ま た、線形代数の基礎的な内容を学習した上で、計算機で統計計算を行う上で重要となるアルゴリズムを解説する。特に、連立一次方程式の解法であるガウスの消 去法、最小二乗法において基礎となるQR分解と特異値分解について解説する。
連立一次方程式
QR分解
固有値問題
絶対値の大きいほうから数個の固有値と固有ベクトルを求める方法
レポート課題(木村分)
・統計処理(5回)
統計処理について概説し、統計学の基礎的な概念である平均、分散等を解説する。
その後、回帰分析、主成分分析等のデータの統計処理について講述する。加えて、Excelと統計ソフトRの実習を行う。Excelにおいては、 VBA(Visual Basic For Application)によるプログラミングを習得する。統計ソフトRのR言語についても実習を行う。

・大規模データ処理とクラウドコンピューティング(2回)
より大規模なデータ処理を行うために、近年注目されているクラウドコンピューティングについて講述する。特に、Hadoop、MapReduce等の具体的な分散処理の手法について解説する。

・情報の可視化(2回)

履修要件

特になし

予備知識

統計計算に重要な数値線形代数の知識は、授業内でも解説を行うが、必ず予習あるいは復習することを期待する。さらに、統計の基礎知識、特に、最小2乗法や主成分分析などの知識を、授業と並行して予習あるいは復習し、受講されることを期待する。

成績評価の方法・基準

全14回の途中に、線形代数の基礎知識と統計の基礎知識について、その知識を習得しているかを確認するため、レポート課題を出題する。さらに、大規模データ解析を行うことができるレベルの線形代数の知識と統計の知識を習得できているかについて、その習熟度をテストを通して判断し、評価する。講義・実習への出席状況も評価の基準に加える。

教科書

資料が必要な場合には、授業中にプリント等を配布する

その他(授業外学習の指示・オフィスアワー等)

木村欣司:金曜・3限目13:00-14:30 kkimur[at]amp.i.kyoto-u.ac.jp
授業時間外で、質問がある場合には、あらかじめ、上記のアドレスにメールをすること。

ページの先頭へ

S