ユニット提供科目
ユニット提供科目
今日,文理の分野を問わず最先端の研究を進めていくには,大規模データの分析・管理技術が不可欠となっている.本講義では,コンピュータで問題を解くのに 必要なモデル化やアルゴリズムとその情報検索への応用,データの管理およびデータから有用な情報や知識を抽出する技術,情報の分析結果の可視化と対話技術 など,多くの分野で利用されているトピックを精選して講述する.特に,具体的な問題に対してどのようにそれらの技術が適用できるかを学ぶことで技術の基本 的な考え方を理解し,各自の分野で応用が可能になることを目指している.
【研究科横断型教育の概要・目的】
上に述べたように,大規模データの分析・管理技術はあらゆる分野の研究に必要とされている.
また,この授業では,それらの技術の仕組みを概説するにとどまらず,「情報分析・管理演習」と連携して,各自が技術を実践できるレベルを到達目標としている.
ガイダンス(1回)
講義全体の概要
問題のモデル化と問題の解き方,情報検索(5回) (担当: 浅野)
コンピュータで問題を解くために必要となる,問題のモデル化と,問題の解き方,すなわち,アルゴリズムについて学ぶ.具体的には,まず,グラフを 用いたモデル化,アルゴリズムとその戦略(計算量,近似,動的計画など),情報検索に用いられるランキング手法PageRankやHITSなどの応用につ いて講述する.さらに,正規表現などの形式言語と,オートマトンや隠れマルコフモデルが生物情報学の配列解析に応用された事例を通して,情報科学の他分野 への応用について学ぶ.
データマイニング (3回) (担当: 浅野)
データを分析して,有用な情報や知識を抽出するための手法について講述する.具体的には,データマイニング技術(相関ルール,クラスタリング,決定木,サポートベクターマシンなど)と,そこで利用されている機械学習やベイズ推定の技術を学ぶ.
データベース (2回) (担当: 加藤)
大規模な情報を管理するデータベース技術について講述する.
情報検索(2回) (担当: 加藤)
大量の文書データから必要な情報を検索するする技術について講述する.基礎的な検索モデル,索引技術やランキング学習について学ぶことで,現状の 検索システムがどのように動作しているのかを理解する.また,検索システムの性能を定量的に評価する方法について理解を深めることにより,より良い検索シ ステムを選択・構築する方法を身につける.
情報の可視化と対話技術 (2回) (担当: 加藤)
分析結果などの情報の可視化,インタラクション技術,情報発信技術を取り上げる.
「情報分析・管理演習」を原則として受講すること.
講義で扱った情報分析・管理技術の仕組みを理解し,具体的な問題に応用し,実際にその解を計算できるようになることが達成目標である.「情報分析・管理演習」と合わせて,出席状況および毎週のレポートによってこの目標に到達しているかどうかを検証し,成績を算出する.
使用しない
Jon Kleinberg, Eva Tardos (著), 浅野孝夫, 浅野泰仁, 小野孝男, 平田富夫 (翻訳)Jon Kleinberg and Eva Tardos『アルゴリズム・デザインAlgorithm Design』(共立出版Addison Wesley.)
Richard Durbin, Sean R. Eddy, Anders Krogh, Graeme Mitchison.『Biological sequence analysis -Probabilistic models of proteins and nucleic acids-』(Cambridge University Press)
C.M. ビショップ(著), 元田 浩, 栗田 多喜夫, 樋口 知之, 松本 裕治, 村田 昇 (翻訳)C. M. Bishop『パターン認識と機械学習 -ベイズ理論による統計的予測- 上・下巻Pattern Recognition and Machine Learning』(シュプリンガー・ジャパンSpringer-Verlag.)
前期・後期共に同一内容のリピート科目である.
自身の研究に,種類は問わず,何らかのデータを用いている学生を歓迎する.
オフィスアワーについては特に指定せず,メールのやり取りで随時行う.
浅野泰仁: asano@i.kyoto-u.ac.jp 加藤誠: kato@dl.kuis.kyoto-u.ac.jp
※オフィスアワー実施の有無は、KULASISで確認してください 。