アルゴリズムとデータ構造 Ⅰ 及び演習

アルゴリズムとデータ構造Ⅰ及び演習 担当　　講義部分：阿部圭一　　　　　演習部分：小西達裕 TA（相澤　直人、　　　　　　　　　　　　　　　伊藤　大輔）厳しい！「プログラミング」でわからなかったことを放っておかないように。

この授業に関するホームページ http://edu.cs.inf.shizuoka.ac.jp/2005/X121 昨年度の資料は http://edu.cs.inf.shizuoka.ac.jp/2004/T020

2005年度スケジュール（暫定）

2005年度スケジュール（つづき）

今日の疑問 １．アルゴリズムって何だろう？　　なぜ、アルゴリズムについて勉強するの？２．アルゴリズムとデータ構造とは　　どういう関係があるのだろう？

ソフト・サービス化 製品のソフト化内蔵ソフトウェア　　　　　　　ステップ１２０万ソフトウェア・テストケース　　　　　　　　　ケース約７万

１．アルゴリズムとは　　p.2 処理の手順を記述したもの →厳密な定義　　　　　「計算モデルとアルゴリズム」 (3年後期）プログラムとどう違う？　アルゴリズムはプログラム言語で　書かなくてよい

普通の順序 　　アルゴリズム（とデータ構造）を考える　　　　　　　　　↓ 　　プログラムを書くアルゴリズム＝プログラム　？

C言語を習得したら、プログラムが書けるか？C言語を習得したら、プログラムが書けるか？たとえ話：　　英会話を習得したら、英語で話せるか？　　囲碁のルールがわかったら、囲碁が　　　上手に打てるようになるか？

あなた方の目標 × ○ プログラムが書ける良いプログラムが書けるそのためには１．アルゴリズムとデータ構造　２．プログラミング技術この授業では、１を主、２を従　２→「プログラミング方法論」に続く

教科書 p.3 先頭 プログラムを書く（プログラミング）という行動は、　①プログラムの仕様の決定　②プログラムの設計　③コーディング「プログラミング」の授業で得られたのは主として③の知識と技術 ②：この授業 ①→「システム要求分析設計」

Ｎ．Ｗｉｒｔｈの有名な本：「アルゴリズム＋データ構造＝プログラム」Ｎ．Ｗｉｒｔｈの有名な本：「アルゴリズム＋データ構造＝プログラム」なぜか？　　→この授業を聞けばわかる以下、とりあえず省略　　→ p.6　１．３へ

１．３　なぜアルゴリズムを勉強するのか？ 著者の回答　１．好奇心　２．プログラミング技術の向上でも、待てよ？プログラムの再利用は最近の流れ　　　　　　↓ 　すでにあるプログラムはブラックボックスで　よい？　利用できればいいんだ！？

高い安いできる仕事の範囲基本部品の中味を知っているプログラマ基本部品の中味を知らないプログラマ

教科書 p.7　中央付近 ブラックボックス化が進むからこそ、アルゴリズムに関する深い知識が必要とされる同じことをするのに、複数のアルゴリズムが存在する　→　アルゴリズムの選択アルゴリズムの性能を知っていなければならない　　平均的なふるまい、最良／最悪の場合　　　　　　　　↓ アルゴリズムの中味を知っていなければならない

もう一つの論点（教科書には書いていない） 基本的な部品を組み合わせるだけで　適切なアルゴリズムが作れるか？ＮＯ！　　　　↓ 自分で適切なアルゴリズムとデータ構造を作り出す能力が必要　　　　↓ 既存のアルゴリズムとデータ構造を学ぶことにより、培われる

　　　　プログラムを書く学習 　　　　　　　ｖｓ．　　　　プログラムを読む学習（良い） ↓ 　ここに、問題あり！世の中にあるプログラミングの本の　かなりの割合はお勧めできない。この教科書のプログラムはまあまあ良いが、　構造化、プログラム書法に問題あり。

次の疑問 １．計算量って何だろう？　　どういう意味があるの？２．探索とは？　　線形探索と二分探索

２．２．１　線形探索法による探索の計算量p.11２．２．１　線形探索法による探索の計算量p.11 ２．１　後回し２．２　後回し表の探索（表引き）という問題：　次のスライド　解法（アルゴリズム）：・線形探索

探索とは：　２８番の学生の氏名は？

線形探索法のプログラム　p.12List 2.1 struct { int key; int data; } table[100]; int n; /* table に登録されているデータの個数 */ int search( int key ) { int i; i = 0; while ( i < n ) { if ( tabel[i].key == key ) return ( table[i].data ); /* 見つかった */ i++; } return -1； /* 見つからなかった */ } 構造体変数の宣言のしかた struct { 　　メンバの変数宣言; 　　メンバの変数宣言; 　　　　　： } 構造体変数; 　　　　　↑ この例では、ここが配列 tabel[100] もう一つの方法： typedef struct { メンバの変数宣言; 　　メンバの変数宣言; 　　　　　： } 型名; 型名　変数, 変数, ・・・; 配列もよくわかってないんですけど・・・。おいおい、そこまで戻っているとこの授業が進まないから、演習の時間に個人授業を。

番兵 (sentinel) ８７別解（プリント講＃２参照）　　　８７を探す三浦宏之

２．２．２　二分探索法による探索の計算量 疑問：　もっと速い方法はないか？辞書を引くときにあなたはどうするか？表の探索（表引き）という問題：　解法（アルゴリズム）：・線形探索　　p.12List 2.1 ・二分探索　　p.16List 2.2

二分探索法の過程　　　　　　　　p.17Fig. 2.1 探すキーの値は 14とする。 a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 low→ a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 middle→ <14 =14 low→ low, middle→ high→ >14 middle→ high→ high→

二分探索法のプログラム　　　　　p.16List 2.2 struct { int key; int data; } table[100]; int n; /* table に登録されているデータの個数 */ int binary_search ( int key ) { int low, high, middle low = 0; high = n-1; while ( low <= high ) { middle = ( low + high ) / 2; if ( key == table[middle].key ) return ( tabel[middle].data ); /* 見つかった */ else if ( key < tabel[middle].key ) high = middle – 1; else /* key > tabel[middle].key である */ low = middle + 1; } return (-1); /* 見つからなかった */ ｝

線形探索と二分探索について，なお理解不足ならば線形探索と二分探索について，なお理解不足ならば http://www.kayoo.org/home/mext/joho-kiki/ →ソフトウェア→検索のアルゴリズム

前回の復習 • アルゴリズムとは何か　なぜアルゴリズムとデータ構造を学ぶのか • 表の探索（表引き）　・線形探索　・二分探索

今日の疑問 １．計算量って何だろう？　　なぜ計算量という考え方をするの？２．スタックってどういうデータ構造だろう？　　配列を使ってスタックを作るには？

２．２　計算量　　p.10 あるアルゴリズムはどのくらい速いか？つまり、計算速度（計算時間）は？ ↓ コンピュータ、OS、言語、コンパイラ、コンパイラのオプションに依存する ↓ 計算の手数(必要な基本演算の数）がデータの個数ｎに対してどのように増えるか？

計算量とは（つづき） O(ｎの関数）の形で表すこのとき、定数係数は無視するオーダーというオーダーが違う　オーダーが１桁違う

定数係数は無視する O(１）　　　　　　（p.14 先頭） O(log ｎ） O(ｎ） O(ｎ log ｎ） O(ｎ２） O(ｎ３）　　多項式オーダー・・・ O(２ｎ）　　指数関数的

計算量の性質 Ｏ（ｆ（ｎ））＋Ｏ（ｇ（ｎ））＝Ｏ（max｛ｆ（ｎ），ｇ（ｎ）｝） p.13 Ｏ（ｆ（ｎ））・Ｏ（ｇ（ｎ））＝Ｏ（ｆ（ｎ）・ｇ（ｎ）） p.14

線形探索の計算量（比較の回数）は 最良１、最悪ｎ、平均（ｎ＋１）／２　　データ数ｎに対して　Ｏ（ｎ）二分探索の計算量（比較の回数）は　　２ｋ－１≦ｎ＜２ｋのとき　　ｋ回　　つまり、データ数ｎに対して　約Ｏ（ｌｏｇ２ｎ）ｌｏｇの底は何でもかまわない　（理由）　　ｌｏｇ２ｎ＝ｌｏｇ２１０・ｌｏｇ１０ｎ ↑ 定数係数

線形探索の計算量は　Ｏ（ｎ） 二分探索の計算量は　Ｏ（log ｎ）ｎ＝１，０００だったら？　　ｎ＝１，０００ log2ｎ＝約１０　（なぜなら２１０＝1,024）１００倍違う！定数係数が少しくらい違ったって、　　勝負は明らか！

データの登録も考えると　　p.18～ 　　　　　　　登録（ｎ要素当り）　探索（１回当り）線形探索　　　　Ｏ（ｎ）　　　　　　　Ｏ（ｎ）二分探索　　　　Ｏ（ｎ２）　　　　　　Ｏ（log ｎ）　　　　　　　クイックソートで　　　　　　　　　Ｏ（ｎ log ｎ）

線形探索：　２８番の学生の氏名は？

二分探索法の過程　　　　　　　　p.17Fig. 2.1 探すキーの値は 14 とする。 a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 low→ a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 a[0]=1 a[1]=3 a[2]=4 a[3]=8 a[4]=13 a[5]=14 a[6]=18 a[7]=20 a[8]=21 a[9]=25 middle→ <14 =14 low→ low, middle→ high→ >14 middle→ high→ high→

登録１回あたりの検索の回数をＳとすると、 　　線形探索　Ｏ（ｎ）＋Ｓ・Ｏ（ｎ）　　二分探索　Ｏ（ｎ log ｎ）＋Ｓ・Ｏ（log ｎ）ｎ＜＜Sでないと、二分探索は有利に　　ならない！　　頻繁にデータ集合が変わるような応用には　　二分探索は適さない →では、どうする？

ｐ．２３　下から１／４ 一般に，プログラムの実行速度を上げるには　①速いマシンに乗り換える　②高性能なコンパイラでコンパイルする　③頻繁に実行される部分をアセンブラで　　　記述するなどして高速にするこれらの手段はいずれも定数係数を小さくするだけ！計算量のオーダーは改善されない効率の悪いアルゴリズムを選んだら終わり！

アルゴリズムとデータ構造 Ⅰ 及び演習