1. 現在の位置 : ホーム
  2. 提供科目
  3. 2017年度の科目
  4. データ分析実践

データ分析実践Practice of Data Analysis

授業の概要・目的

統計処理やプログラミング言語の基礎知識を持たない学生を対象として、大規模データ解析を行う為のプログラミング技術の習得を目指す実践科目である。 「データ分析入門」という統計計算の入門的講義科目に対して、この科目は、より高度な実習を行うことにより、より大規模なデータを解析することを目指す。 「データ分析入門」の実習では、Excelと統計計算に特化したソフトウェアであるRのR言語を学習するのに対して、この授業では、その2つのソフトウェ アの使い方について簡単に触れた後、プログラミング言語Cを用いて、主成分分析などにおいて重要な、対称な大規模疎行列の最大固有値から数個の固有値とそ れに付随する固有ベクトルを計算するプログラムを自らの手で作成する。本講義の目的の一つに、統計計算の基本的な内容に対する理解を深めることがあげられ る。統計処理がどのように利用されるか概説し、計算機を用いて統計処理を行う方法を解説し実習を行う。加えて、プログラミング言語Cの知識を持たない学生 が、この言語に習熟することで自らのプログラミングスキルを高める目的もある。また、計算機の構成とプロセッサアーキテクチャの基礎知識をもとに、動作速 度の点で優れたプログラムを作成するための基本的な手法を解説する。プログラミング言語への理解を深めるだけでなく、統計計算というアプリケーションの作 成を通して、さまざまなアプリケーションを作成する状況においても活用できるプログラムの高速化技法について習熟することを目的とする。

授業計画と内容

全14回の予定は、以下の通りである。

ガイダンス

・数値計算と統計計算(3回)
計算科学の重要な手法である数値解析・数値計算の基礎について講述する。2分法やニュートン法などの基本的な数値計算の内容について学習する。また、線形代数の基礎的な内容を学習した上で、計算機で統計計算を行う上で重要となるアルゴリズムを
解説する。特に、連立一次方程式の解法であるLU分解、最小二乗法において基礎となるQR分解と固有値分解について解説する。

計算科学とは

連立一次方程式

QR分解

固有値問題

レポート問題

・計算機の構成とプロセッサアーキテクチャの基礎(1回)
計算機の構成とプロセッサアーキテクチャの基礎知識を講義する。

・C言語の文法とプログラミング技法の解説(3回)
プログラミング言語の基礎知識を持たない学生を対象として、C言語の基本的なプログラミング手法を丁寧に解説する。

・統計処理入門(2回)
統計処理について概説する。その後、統計学の基礎として平均、分散などについて解説した後、回帰分析、主成分分析等のデータの統計処理について講述する。加えて、Excelと統計ソフトRの実習を行う。

平均・分散・回帰分析

主成分分析

9-1.csv

レポート課題

・統計計算を行うためのC言語によるプログラムの作成(5回)
主成分分析などにおいて重要な対称な大規模疎行列の最大固有値から数個の固有値とそれに付随する固有ベクトルを計算するプログラムを以下の2種類作成する。

C言語入門

(1) 直交化法を利用した複数個の固有値・固有ベクトルの組を逐次的に求めるべき乗法
(2) 同時反復法

履修要件
特になし
予備知識
統計に重要な数値線形代数の知識は、授業内でも解説を行うが、必ず予習あるいは復習することを期待する。さらに、統計の基礎知識、特に、主成分分析などの知識を予習あるいは復習し、受講されることを期待する。プログラミング言語Cについては、授業時間内のみでは完全な習得が困難であるため、予習と復習を授業と並行して行うことを期待する。
成績評価の方法・基準
全14回の途中に、統計の基礎知識について、その知識を習得しているかを確認するため、レポート課題を出題する。さらに、大規模データ解析を行うレベルのC言語のプログラミングスキルを習得しているかについて、実習レポート課題を通して判断し、成績評価とする。特に、レポート課題への解答として作成したプログラムが、計算機の構成とプロセッサアーキテクチャの基礎知識をもとに、効率的な動作を行うものかという基準で評価する。講義・実習への出席状況も評価の基準に加える。
教科書
資料が必要な場合には、授業中にプリント等を配布する。
参考書等
URL
その他(授業外学習の指示・オフィスアワー等)
木村欣司:金曜・3限目13:00-14:30 kkimur[at]amp.i.kyoto-u.ac.jp
授業時間外で、質問がある場合には、あらかじめ、上記のアドレスにメールをすること。

センター提供科目一覧に戻る