250 likes | 414 Vues
Wykład 2 Relacje i funkcje. Zbiory. Zbór w matematyce jest pojęciem pierwotnym, niedefiniowalnym. Przynależność elementu do zbioru (zdanie logiczne x X) jest pojęciem pierwotnym
E N D
Zbiory Zbór w matematyce jest pojęciem pierwotnym, niedefiniowalnym. Przynależność elementu do zbioru (zdanie logiczne xX) jest pojęciem pierwotnym Pojęcia te wraz z logiką formalną i systemem aksjomatów ZF (Zermelo Fraenkla z początku XX wieku) tworzą obecnie dziedzinę matematyki zwaną teorią mnogości (set theory). Teoria ta stanowi podstawę wszystkich dziedzin matematyki. Choć współczesna matematyka jest nauką aksjomatyczna, nie znaczy to że nie ma nic wspólnego z otaczającym nas światem. Nie będziemy wnikać i wchodzić w abstrakcyjnie formułowane systemy aksjomatyczne współczesnej matematyki. Spróbujemy po prostu wyciągnąć z różnych dziedzin matematyki to, co używane jest w biologii. Zbiory w biologii wyróżnić jest łatwo, a ogólność tego sformułowania powoduje, że każdy zestaw, kolekcja czegokolwiek jest zbiorem. Element, grupa, kolekcja – inne nazwy pojęcia zbiór Przykład: Biocenoza jest zbiorem populacji Populacja jest zbiorem osobników Osobnik jest zbiorem komórek Komórka jest zbiorem cząsteczek i atomów Atom jest zbiorem kwarków .....
Podstawowe symbole i oznaczenia • - zbiór pusty AA, AB, BA, BA – zbiór A jest podzbiorem zbioru B AB – suma mnogościowa dwóch zbiorów AB – iloczyn mnogościowy dwóch zbiorów A-B (rzadziej A\B) – różnica zbiorów Symbole sumy i iloczynu zbiorów, oznaczenie zbioru pustego, pojawiają się niekiedy w pracach biologicznych (choć najczęściej w jakiś matematycznych aneksach). Częściej stosuje się słowny opis pewnych operacji mnogościowych (typu ogół wszystkich osobników należących do badanych populacji zamiast oznaczenia sumy mnogościowej badanych populacji). Stosowanie symboli skraca zapis pewnych formuł i nadaje im jednoznaczność. Symbole stosujemy, kiedy zależy nam na ścisłości, jednoznacznym i krótkim opisie operacji mnogościowych. Pokazane tu symbole są dobrze wszystkim znane ze szkoły i przypuszczam, że z ich zapamiętaniem nie będzie kłopotu. Gdy mamy zestaw zbiorów A1,A2,... (indeksowaną rodzinę zbiorów) - Ogół wszystkich elementów zbiorów A1, A2,... - Wybrane elementy należące do każdego ze zbiorów A1, A2,...
Przy zmianie porządku: {a1, a2, ... , ak} = {ai1, ai2, ... , aik} (a1, a2, ... , ak) (ai1, ai2, ... , aik) Podstawowe symbole i oznaczenia {a1, a2, ... , ak} – zbiór elementów (a1, a2, ... , ak) – uporządkowany zbiór elementów (ciąg elementów) Choć indeksowanie elementów i określaniem ich pozycji wydaje się być już określeniem pewnej funkcji i związane z określeniem relacji porządki - matematycy znaleźli sposób na ich zdefiniowanie uporządkowanych zbiorów bez posługiwania się tymi pojęciami. Nie będziemy analizować tej definicji, bo i tak wszyscy wiedzą o co chodzi. Warto jednak zwrócić uwagę na typowe zapisy zbioru nieuporządkowanego i uporządkowanego, gdyż oznaczenia te przyjęły się powszechnie i są używane także w biologii. Dobrze jest wszystkim znana definicja iloczynu kartezjańskiego zbiorów. Jej symboliczny zapis jest krótki i warto zwrócić uwagę na jego składnię. Czasami biolodzy muszą zdefiniować jakiś zbiór i robi się to podobnie (nawias klamrowy, rodzaj elementów definiowanego zbioru, średnik, warunki połączone spójnikami logicznymi). Iloczyn kartezjański dwóch zbiorów – ogół wszystkich par (uporządkowanych zbiorów dwóch elementów), z których pierwszy należy do pierwszego zbioru, a drugi do drugiego. AB = {(a,b); aA i bB}
Relacja – definicja Definicja powszechnie stosowanego w nauce pojęcia „relacja” jest bardzo ogólna. Obejmuje wszystkie rodzaje związków, jakie można określić między elementami dwóch zbiorów, a także jednego zbioru (gdy A=B i relacja jest podzbiorem AA). Definicję relacji często próbuje się formułować nieco inaczej, mówiąc o elementach będących i nie będących w relacji, tak aby nie kojarzyć słowa relacja ze zbiorem. Mówi się o zależności elementów (nie wyjaśniając co to jest zależność), albo stosuje się definicje typu – jest to jedno z podstawowych pojęć matematycznych. Przedstawiona tu definicja nie jest moim wymysłem. Tak definiuje się relację w teorii mnogości. Definicja ta upoważnia do sformułowania: element „a” jest w relacji „R” z elementem „b” jeżeli para elementów (a,b) należy do relacji R. Można to wtedy traktować jako definicję odpowiedniego sformułowania. Relacja jest to dowolny podzbiór iloczynu kartezjańskiego dwóch zbiorów Jeżeli RAB to R jest relacją Jeżeli R jest relacją to istnieją takie zbiory A i B, że RAB Element a jest w relacji R z b wtedy i tylko wtedy gdy (a,b)R aRb oznacza to samo, co (a,b)R
Najważniejsze rodzaje relacji Relacja zwrotna RAA Cała teoria mnogości jest pełna różnych definicji i twierdzeń wynikających z implikacji bądź równoważności różnych definicji. Biologom tak rzadko są one potrzebne, że nie będziemy rozwijać w sposób matematyczny tej teorii. Pokazane tu rodzaje relacji funkcjonują zarówno w matematyce jak i naukach przyrodniczych. Warto zatem wiedzieć co one oznaczają. Na szczęście, pomimo abstrakcyjnych sformułowań definicji kojarzą się one w sposób naturalny ze swoimi nazwami. Zauważmy, że w matematyce funkcja jest specjalnym rodzajem relacji. Jest to relacja (czyli podzbiór iloczynu kartezjańskiego dwóch zbiorów), w którym co najwyżej jeden element zbioru B może być w relacji z pewnym elementem zbioru a. Elementowi aA nie mogą być przyporządkowane dwa lub więcej różnych elementów zbioru B. Relacja symetryczna RAA Relacja asymetryczna RAA Relacja przechodnia RAA Relacja równoważności RAA zwrotna, symetryczna, przechodnia Relacja liniowego porządku (mocnego) RAA asymetryczna, przechodnia, Funkcja RAB
Relacje równoważności (zwrotne, symetryczne i przechodnie) występują wtedy, gdy określają nam podział badanego zbioru na rozłączne podzbiory. Wydzielanie podzbiorów nie jest wcale rzadkie w badaniach biologicznych, a typowym tego przykładem jest podział populacji na rodziny spokrewnionych ze sobą osobników, osobników korzystających z tych samych karmników, śpiących w tych samych norach itd. Poprzez obserwacje behawioralne lub eksperymenty genetyczne możemy określić, które osobniki są ze sobą w relacji pokrewieństwa i relacja ta dzieli nam populację na grupy osobników spokrewnionych ze sobą. Istnieją algorytmy pozwalające na wydzielanie grup osobników wynikających z określonej relacji równoważności. Problem polegać może na tym, że między niektórymi osobnikami z przyczyn technicznych nie jest zbadane pokrewieństwo. Wtedy można skorzystać z twierdzenia mówiącego o istnieniu minimalnego dopełnienia relacji do pewnej relacji równoważności. Relacja ta jest określona jednoznacznie, a zatem i odpowiedni podział populacji będzie jednoznacznie określony. Przy dużej liczbie braków w określeniu relacji między osobnikami może się zdarzyć, że osobniki w rzeczywistości spokrewnione zostaną umieszczone w kilku różnych grupach. Gdy nie zdarza się to zbyt często – to opisane postępowanie pozwala wyciągnięcie pewnych wniosków populacyjnych (np. dotyczące wielkości i liczby rodzin w różnych sytuacjach środowiskowych) Zobaczmy jak to pracuje na przykładzie: Relacja równoważności – podstawowe własności • Podziałem zbioru A nazywamy taki zbiór {A1,A2,...,Ak} podzbiorów zbioru A, że: • Podzbiory A1,A2,...,Ak są parami rozłączne • Suma mnogościowa tych podzbiorów jest równa A Ogół podziałów zbioru A oznaczymy: podz(A) Relacja RAA jest relacją równoważności Każdy podział zbioru definiuje relację równoważności i każda relacja równoważności określa pewien podział zbioru Dla dowolnej relacji RAA istnieje relacja równoważności QAA taka, że:RQQ jest najmniejszą relacją równoważności zawierającą RQ jest określona jednoznacznie
Ssaki z rodzaju mus i ratus (myszy i szczury) żyją w grupach rodzinnych z dominujących samcem, jedną lub kilkoma dominującymi (rozradzającymi się) samicami i całą plejadą subdominantów (osobniki młodociane i ustępujące dorosłe, rzadko rozradzające się). W warunkach kontrolowanych (w wolierach) grupy zajmują rozłączne terytoria z jednym lub kilkoma karmnikami i starają się nie wchodzić sobie w drogę. Czasami zdarzają się przejścia osobników z jednych grup do innych, przepędzenia pewnych osobników z grup, rozpad grup po śmierci dominanta i inne zdarzenia, które kończą trwanie pewnych grup lub zaczynają trwanie innych. Miałam kiedyś okazję brać udział w badaniach myszy domowej w Instytucie Ekologii PAN. Dotyczyły one dzikiej populacji, która zamieszkała wolierę. Było w niej 48 karmników, do których codziennie wysypywano owies. W karmnikach tych umieszczono po 4 pułapki i w czasie serii połowów pokarm umieszczano tylko w pułapkach. Myszy łowiły się chętnie i w czasie 12 lat badań stwierdzono 34643 złowień 4252 myszy. Informacje o złowieniach były jedynymi jakie posiadano, gdyż nie prowadzono innych obserwacji populacji (woliera była ziemna i w czasie dnia myszy przebywały głęboko w norach). Jak zatem określić grupy rodzinne? Grupy rodzinne myszy mają charakter socjalny. Nie wszystkie osobniki w grupie muszą być spokrewnione, a nawet oczekuje się braku pokrewieństwa między dominującym samcem, a dominującymi samicami. Dobrym kryterium było odwiedzanie w tym samym czasie tego samego karmnika. Pozwoliło to na określenie relacji między osobnikami, która dopełniona do relacji równoważności wydzieliła w populacji grupy. Choć osobniki, które łowiły się rzadko nie zostały przypisane do żadnej grupy (a pewnie większość z nich do którejś należała) procedura ta pozwoliła na analizę wielkości i trwałości grup i zależności tych parametrów od różnych czynników. Relacja równoważności – przykład zastosowania Badania w latach 1986-1998156 serii połowówKażda seria trwała 5 dni10 przeglądów w każdej serii Dwa osobniki są w relacji R jeżeli podczas danej jednej serii połowów każdy z tych osobników złowił się co najmniej dwa razy w tym samym punkcie lub co najmniej po jednym razie w dwóch tych samych punktach. Relacja R nie jest relacja równoważności, ale można rozważać jej dopełnienie do relacji równoważności i dzielić populację na grupy i samotników.
Relacje porządku Relacja porządku (mocnego) Często badania ekologiczne związane są z poszukiwaniem pewnego porządku w grupie badanych obiektów. Relacja porządku spełnia warunek asymetryczności lub quasi-asymetryczności. Pierwsza z nich pokazuje, że nigdy obiekt nie może być w relacji z samym sobą, druga dopuszcza taka możliwość. Jest to relacja przechodnia, a ponadto oczekujemy, że dla dowolnych dwóch różnych obiektów możemy określić relację miedzy nimi. Ten ostatni warunek określa nam tak zwany liniowy porządek i w różnych uogólnieniach relacji porządku rezygnuje się z niego lub zastępuje warunkami słabszymi. Powstają wtedy relacje częściowego porządku o różnych własnościach. Uporządkowanie elementów w zbiorze powoduje, że możemy stosować zapis typu: a1 < a2 < a3 < a4 ... co oznacza koniunkcję zdań: a1 < a2 i a2 < a3 i a3 < a4 ... Przechodniość relacji porządku powoduje, że prawdziwe są też zdania a1 < a3, a1 < a4 itd. Tu mieszczą się relacje < i > Relacja porządku (słabego) Tu mieszczą się relacje i
Relacja porządku – przykład zastosowania • Hierarchia socjalna w stadzie • porządek dziobania • dominacja i ustępowania Przykładem relacji porządku istniejącymi w populacjach jest hierarchia socjalna. U kur opisano zjawisko zwane porządkiem dziobania. Możemy zapisać za pomocą symbolu > zdanie: kura A dziobie kurę B jako A>B. Okazuje się, że w typowym stadzie > jest relacją mocnego porządku i porządkuje nam kury od tej która dziobie wszystkich do tej, która nie dziobie nikogo. U ssaków układy socjalne są bardziej złożone i w typowym stadzie możemy określić dominanta i kilka kategorii subdominantów. Badając organizację stada grupujemy osobniki oraz określamy porządek między grupami pokazujący, która grupa dominuje nad którą. W porządkowaniu elementów zbioru nie ma nic tajemniczego. Jest to naturalna operacja dobrze wszystkim znana i dlatego nie będziemy więcej o niej mówić. A dziobie B, A dziobie C, A dziobie D B dziobie C, B dziobie D C dziobie D A > B > C > D A dominuje na wszystkimi B i C dominują nad D, E, F Wśród D, E i F nie ma układu dominacji A > {B,C} > {D, E, F}
Relacje porządku w zbiorach liczbowych ℕ - Zbiór liczb naturalnych (całkowitych dodatnich){1,2,3,....} ℕ0 – Zbiór liczb całkowitych nieujemnych {0,1,2,....} ℝ - Zbiór liczb rzeczywistych. ℕ - Zbiór liczb naturalnych (całkowitych dodatnich){1,2,3,....} ℝ - Zbiór liczb rzeczywistych Wprowadzone tu oznaczenia zbiorów liczb naturalnych i rzeczywistych nie są standardem w biologii, ale tez takiego standardu nie ma. Kiedy występuje konieczność zastosowania tego typu oznaczeń w pracy należy jakieś ozdobne, pogrubione duże R i N odpowiednio zdefiniować (zawsze R będzie związane z liczbami rzeczywistymi, real numbers, a N z liczbami naturalnymi, natural numbers). Bardzo rzadko potrzebne są oznaczenia dla zbioru liczb całkowitych, wymiernych lub zespolonych. Relacje porządku w zbiorach liczbowych oznaczany jest standardowo znakami <, >, , , które wszyscy dobrze znają i nie trzeba ich w pracy definiować. Czasami w pracy należy zastosować symbole przedziałów. Przedziały otwarte oznacza się tak samo jak parę liczb i nic na to nie poradzimy. W niektórych podręcznikach matematyki stosuje się czasem zaostrzone nawiasy dla par i ciągów oraz bardziej zaokrąglone dla przedziałów – ale biolodzy korzystając z typowych znaków klawiatury nie maja wyboru. Dobrym sposobem rozróżnienia tych innych obiektów matematycznych jest poprzedzanie stosowanego symbolu odpowiednim wyrażeniem: para liczb (a,b), przedział (a,b). Relacje <, >, , Przedziały liczbowe: (a,b) = {x; x>a i x<b}={x; a<x<b} [a,b) = {x; xa i x<b}={x; ax<b} (a,b] = {x; x>a i xb}={x; a<xb} [a,b] = {x; xa i xb}={x; axb} (a,) = {x; x>a} [a,) = {x; xa} (-,b) = {x; x<b} (-,b] = {x; xb}
Funkcja RAB fAB oznacza się jako: f:AB (x,y)f xfy y=f(x) Zamiast lub pisze się Funkcje Teoriomnogościowa definicja funkcji ma jedną wielka zaletę. Nie używa się w niej niedefiniowalnych wyrażeń typu zależność, przyporządkowanie, podstawowe pojęcie itd. Jest bardzo ogólna i obejmuje wszystko to co może być uważane za funkcję. Zawsze gdy pewnym elementom jednego zbioru odpowiada jeden i tylko jeden element innego zbioru mamy do czynienia z funkcją. Funkcje dobrze są wszystkim znane przede wszystkim z lekcji matematyki, przede wszystkim jaki opis zależności liczbowych za pomocą ściśle zdefiniowanych formuł. Pojęcie to jest znacznie szersze. Przykładowo jest to wzrost, ciężar, wiek, płeć, kolor osobnika z populacji w danym momencie, jako że w danym momencie osobniki maja tylko jeden wzrost, ciężar, wiek, płeć i kolor. Jest to krzywa wzrostu, krzywa zmian ciężaru, długość życia osobników w populacji badanej przez wiele pokoleń osobników, jako że każdemu osobnikowi można przypisać tylko jedną krzywą opisującą jego wzrost, zmiany ciężaru w czasie całego życia, długość życia itd. Po wykonaniu jakiegoś eksperymentu mamy wyniki wyrażone jaką liczbą lub charakterystyką, bądź ciągiem takich wyrażeń i przyporządkowanie „eksperyment” „wyniki” jest funkcją. Już taki przegląd pokazuje, że w biologii operuje się funkcjami rozumianymi w bardzo ogólny sposób. Funkcje pojawiają się także w informatyce jako zestawy instrukcji pozwalające na wyliczenie konkretnych wartości (liczb, ciągów licz i innych wielkości) dla określonych wartości parametrów. Jest to zgodne z ogólną definicją funkcji, w której zestawom parametrów przyporządkowuje się określoną, w jednoznaczny sposób wyliczoną wartość. Relacja spełniająca jeden tylko warunek: Funkcje tradycyjnie oznacza się literami f lub F
Ciągi i działania jako funkcje ℕ - Zbiór liczb naturalnych (całkowitych dodatnich){1,2,3,....} ℕ0 – Zbiór liczb całkowitych nieujemnych {0,1,2,....} Definicja funkcji obejmuje wiele pojęć traktowanych w matematyce szkolnej nieco odmiennie. Ciągami są funkcje, których dziedziną są liczby całkowite nieujemne lub liczby naturalne (bądź też podzbiór liczb całkowitych nieujemnych). Właściwości ciągów wynikają przede wszystkim z faktu, że w zbiorze liczb całkowitych istnieje naturalny porządek. Jeżeli w biologii pojawiają się ciągi to wynikają one z uporządkowania pewnych wielkości, faktów, wyników. W definicji funkcji mieszczą się wszystkie działania. Reguły typowych działań określonych dla liczb rzeczywistych poznaliście we wczesnym dzieciństwie i wydają się one być czymś innym niż funkcje. Tymczasem jako obiekt matematyczny są to funkcje określone jako podzbiory iloczynu kartezjańskiego dwóch zbiorów, z których pierwszy jest iloczynem kartezjańskim dwóch zbiorów liczbowych, a drugi zbiorem liczb rzeczywistych. Typowe działania to proste funkcje dwóch zmiennych (jak powiedział by matematyk) lub dwuczynnikowe (wg. biologów). Warto jednak wiedzieć, że w wielu programach składnia funkcji będących typowymi działaniami jest inaczej zdefiniowana. Odpowiada temu, z czym spotykamy się w szkole, a więc jest symbolem pomiędzy liczbami, a nie symbolem funkcji z nawiasami i liczbami miedzy nawiasami. Dotyczy to tych symboli, które są na klawiaturze. Ciągiem nazywamy każdą funkcję: f: ℕA A – dowolny zbiór Działania także są funkcjami. ℝℝ(x,y)(x+y)ℝ ℝℝ(x,y)(x-y)ℝ ℝℝ(x,y)(x*y)ℝ ℝ(ℝ-{0})(x,y)(x/y)ℝ ℝ - Zbiór liczb rzeczywistych
Podstawowe pojęcia związane z funkcją jak dziedzina i zbiór wartości są dobrze wszystkim znane. Nie przyjęło się jakieś jedno oznaczenie dla tych zbiorów i niestety w biologii operowanie dziedziną funkcji lub jej zbiorem wartości wymaga słownego opisu. Nie ma też jednej ogólnie przyjętej nazwy dla funkcji, której dziedziną jest cały zbiór X, lub funkcji której zbiorem wartości jest cały zbiór Y. W podręcznikach matematyki definiowane są czasem tego typu funkcje jako odwzorowania lub przyporządkowania, ale niezbyt konsekwentnie (różni autorzy stosują różne definicje). W biologii odwzorowanie i przyporządkowanie jest synonimem funkcji, które można używać zamiennie, gdy operuje się tym pojęciem. Ważnymi funkcjami w biologii są natomiast zmienne. Są to pomiary badanych osobników, ocena środowisk, wyniki eksperymentów – wszystko co może przyjmować różne wartości, a pod względem pomiarowym stanowi określoną wielkość fizyczną. Zmienną przykładowo jest ciężar myszy z określonej populacji złowionych w danym dniu, temperatura powietrza w określonym miejsce i czasie, pH gleby z określonego miejsca w danym okresie. Dziedziną tych zmiennych jest zbiór badanych osobników, zbiór momentów czasowych, w których dokonywano pomiarów temperatury, zbiór próbek gleby, dla których zmierzono pH. Ciężar, pH są wielkościami fizycznymi, które posiadają wszystkie osobniki populacji, wszystkie możliwe próbki gleby, a temperaturę powietrza w danym miejscu można przypisać wszystkim momentom czasowym - nie tylko tym mierzonym. Złapanie myszy i jej zważenie można traktować jako zdarzenie losowe, a wynik pomiaru (ciężar) jest wtedy zmienną losową. Wyniki jakiejś serii eksperymentów też można traktować jako zmienne losowe wybrane wśród wyników z hipotetycznej nieskończonej serii eksperymentów. Konsekwencje takiego podejścia do badań biologicznych omówimy w drugiej części naszych wykładów. Definicje pojęć związanych z funkcją Dana jest funkcja f:XY Dziedzina funkcji: Zbiór wartości funkcji: Synonimy funkcji: odwzorowanie, przyporządkowanie Zmienna – specyficzna funkcja, której dziedziną jest zbiór badanych rzeczywistych obiektów (np. osobników), a zbiorem wartości wynik pomiaru lub eksperymentu Zmienna losowa – specyficzna funkcja, której dziedziną jest zbiór zdarzeń (np. złowień osobników), a zbiorem wartości wynik pomiaru lub eksperymentu
Bazy danych wykonywane w biologii maja ściśle określona strukturę, która nosi nazwę „baza danych”. Bazami danych są książki telefoniczne, karty katalogowe w bibliotece, dane osobowe w dziekanacie, listy towarów i ich cen wyświetlające się w kasach i podobne struktury, które przechowuje się w specjalnych programach nazywanych także „bazami danych”. Dane są ciągiem informacji zapisywanych w ściśle określonej kolejności (ale nie koniecznie w takiej samej kolejności wyświetlanych na ekranie). Bazę danych najlepiej wyobrazić sobie jako tabelę złożoną z wierszy i kolumn, w której w wierszach umieszczone są informacje o badanych obiektach, a kolumny dotyczą informacji określonego typu. Ponadto typ informacji (kolumna) ma swoja nazwę, która także trzeba wprowadzić do bazy danych. Pokazane przykłady baz danych są zrobione w Excelu (w programie należącym do tzw. arkuszy kalkulacyjnych). Większość z was wykonując w przyszłości swoje badania będzie zapisywała ich wyniki właśnie w Excelu (a nie w bazach danych), ale powinna to zrobić w taki sam sposób jak to pokazano na ekranie (pierwszy wiersz, tylko jeden z nazwami kolumn, kolejne wiersze – informacje o obiektach badań i wyniki pomiarów. Pierwsza z tych baz dotyczy stężeń metali ciężkich(cynku, kadmu i ołowiu) w różnych organach dwóch gatunków żab (trawna i moczarowa) złapanych w stawie opodal hałdy w Miasteczku Śląskim. Zauważmy, że każda z tych żab dostała swój identyfikator. Identyfikator ten był umieszczany na każdej próbówce z organami żab gdy szły one do kolejnych analiz. Choć przyporządkowanie identyfikatora żabie można traktować już jako funkcję – jest to funkcja wzajemnie jednoznaczna (każdej żabie odpowiada określony identyfikator i każdemu identyfikatorowi odpowiada określona żaba). Wyniki ważeń i analiz przyporządkowane są tym identyfikatorom, a więc i odpowiednim żabom. Bazy danych
Bazy danych Druga z przykładowych baz danych nie dotyczy osobników, ale prób glebowych pobranych z tzw. „głęboczków” czterech jezior. Próby te pobierane były poprzez wbicie z dno jeziora długiej (20 cm) rurki, zatkanie jej końca i wyciągnięcie. Ponadto wykonano 5 powtórzeń takiej operacji (tu pokazano dwie). Materiał z rurki podzielono następnie na 4 części i w każdej z nich badano stężenie kilkunastu pestycydów stosowanych w przeszłości w rolnictwie oraz ich metabolitów. Pięć z tych związków pojawiło się w próbach. Charakterystyczne jest w tej bazie danych jest brak jednego identyfikatora próby. Identyfikacji próby można dokonać poprzez trzy pola (Nazwa jeziora, numer próby i głębokość osadu). Takiej trójce przyporządkowane są wyniki analiz laboratoryjnych.
Wielofunkcje i funkcje wielu zmiennych Króciutkie wejrzenie w bazy danych utworzone przez waszych starszych kolegów przy okazji wykonywania pracy magisterskiej pokazało z jakimi materiałami pracują biolodzy. Po pierwsze po pozyskaniu próby wykonuje się wiele rodzajów pomiarów. Wyniki tych pomiarów to ciąg liczb – bardzo rzadko jedna liczba. Innymi słowy przyporządkowanie wyniku danej próbie, osobnikowi, eksperymentowi najczęściej jest wielofunkcją (ang. multifunction) inaczej nazywaną funkcją wielowartościową. Czasami przy analizach materiału wykorzystuje się ten fakt, choć najczęściej analizuje się wpływ różnych czynników na każdą kategorie wyników osobno. Korzysta się tu z prostego twierdzenia, że wielofunkcję można traktować jako ciąg pojedynczych funkcji. Przy opracowaniu materiału często trzeba uwzględnić, że kilka czynników może wpływać na pojedynczy wynik. Tworzy się wtedy funkcję wieloczynnikowej (ang. multifactor function) zwaną też funkcją wielu zmiennych. Pokazane definicje są proste, ale niestety to nie wszystkie rodzaje funkcji rozpatrywane w biologii. Kiedy analizujemy np. Populację w dłuższym okresie czasu możemy każdemu osobnikowi przyporządkować krzywą jego wzrostu (pewne funkcje czasozależne), numery identyfikacyjne osobników będące jego potomkami (zbiory lub ciągi identyfikatorów) i wiele innych wielkości należących pod względem matematycznym do różnych kategorii obiektów. Jest to dość istotne, bo standardy opracowania materiały dotyczą w zasadzie tylko liczb. W innych sytuacjach trzeba szukać w literaturze sposobów analizy materiału lub wręcz tworzyć własne rozwiązania. Wielofunkcja: f:XY1Y2...Yk f(x)=(y1,y2,...,yk) Jeżeli dla każdego i=1,2,...,k oznaczymy: fi(x)=yi to f=(f1,f2,...,fk) Funkcja wielu zmiennych: f:X1 X2 ...XkY f(x1,x2,...,xk)=y Zmienne są najczęściej zarówno funkcjami wielu zmiennych jak i wielofunkcjami. Nie wyczerpuje to wszystkich rodzajów funkcji rozpatrywanych w biologii.
Bazy danych – etap w tworzeniu pracy dyplomowej Badania terenowe, pomiary, eksperymenty Utworzenie bazy danych jest dopiero początkiem procesu, którego celem jest napisanie pracy dyplomowej. Jest to jednak ważny i niezbędny etap. Baza danych – to podstawowe informacje o wykonanych przez studentów obserwacjach i eksperymentach. Pod względem prawnym jest jednak własnością Uniwersytetu Warszawskiego, który finansował badania. Powinna być załącznikiem do pracy dyplomowej, choć teraz nie jest to wymagane przepisami. Wielu jednak promotorów, wiele zakładów wymaga dołączenia do pracy właśnie bazy danych. Dodam też, że często to się studentom opłaca. Bazy danych zawierające obserwacje terenowe mają dłuższy żywot naukowy niż prace dyplomowe. Mody na opracowanie materiału zmieniają się, a to co stwierdzono w terenie teraz za wiele lat będzie być może jedyna informacja porównawczą dla przyszłych badań. Dodam też że bazy danych są tak samo chronione jak prace dyplomowe. Przy ich wykorzystaniu należy podać autora wykonywanych badań. Pod względem prawnym ani prace dyplomowe ani bazy danych nie podlegają ochronie praw autorskim i ich nielegalnego wykorzystania nie można ścigać sądownie (miejmy nadzieje, że to się zmieni). Nie mniej zgłoszenie dziekanowi lub rektorowi faktu bezprawnego korzystania z zebranych danych bez informacji o tym kto te dane zbierał, może się dla osoby oskarżonej skończyć wyrzuceniem ze studiów albo anulowaniem jego pracy dyplomowej. Utworzenie bazy danych Opracowanie wyników Pisanie pracy dyplomowej Przyjęcie pracy (egzamin) Formalności
Przypatrzmy się teraz jak opracowuje się materiał dla potrzeb pracy dyplomowej. Po pierwsze rozpatruje się różne zależności tworząc relacje między zmiennymi mogącymi wpływać na wyniki, a wynikami. Jest to utworzenie i analiza różnych relacji. Przykład pierwszy dotyczy stężenia ołowiu w skórze żab dwóch gatunków. Mamy tu rozrzut wyników. Można sobie wyobrazić, że wszystkie żaby żyjące w badanej sadzawce (oraz te, które mogłyby żyć w danych warunkach środowiska) określonego gatunku mają podobne stężenia ołowiu w skórze. Moglibyśmy zagęścić pokazany rozrzut wyników dodając kilka wyjątków w pewnym oddaleniu od pokazanej chmury. Oczywiście nikt tego nie robi, ale z danymi warunkami środowiska można związać pewien rozkład stężeń ołowiu w skórze dla żaby moczarowej i żaby trawnej. Takie patrzenie na populację powoduje, że danym warunkom środowiska i strukturze genetycznej osobników przyporządkowuje się pewien rozkład danych, który zapewne istnieje, tylko nie jest nam znany. Znana nam jest tylko próba uzyskana dla konkretnych osobników, a co więcej wyniki pomiarów tych osobników obarczone są pewnym błędem. Obserwując jednak rozrzuty danych dla prób skłonni jesteśmy podejrzewać, że w skórze żab trawnych jest więcej ołowiu niż u żab moczarowych. Formułujemy taką hipotezę, ale zauważmy dotyczy ona tego nieznanego nam rozkładu wszystkich możliwych stężeń ołowiu w skórze jakie występują i mogłyby u żab wystąpić. Hipoteza ta formułowana bywa różnie ale dotyczy przesunięcia „w górę” całego rozkładu stężeń Pb u żab trawnych w stosunku do rozkładu Pb u żab moczarowych. Innego typu relacja powstaje gdy analizujemy zależność między ciężarem osobnika a stężeniem ołowiu w wątrobie. Tak się złożyło, że w próbie analizowanych osobników nie było dwóch ważących tyle samo. Można mówić można zatem o funkcji między ciężarem osobnika a stężeniem Pb w wątrobie – ale to nic nie znaczy. Znowu zastanawiamy się nad tym jak to byłoby dla wszystkich osobników w populacji. Wtedy biorąc pod uwagę różne historie życiowe osobników ważących tyle samo można by u nich różne stężenia Pb w wątrobie. Tak naprawdę mamy tu do czynienia tylko z relacją między ciężarem osobnika a stężeniem Pb w wątrobie. Co dalej ? Czy stężenia metali ciężkich były inne u różnych gatunków? Czy stężenia metali ciężkich zależały od ciężaru osobników?
Relacje i funkcje liczbowe RXY, f:XY ℝ - zbiór liczb rzeczywistych Tworząc na użytek pracy dyplomowej wykresy stwierdzonych w środowisku zależności bez przerwy rozważamy relacje między różnymi wielkościami liczbowymi i nieliczbowymi. Wielkości liczbowe cechuje znacznie większa liczba możliwych analiz. Jest wśród nich określony naturalny porządek i są dla nich określone typowe działania (dodawanie, odejmowanie, mnożenie, dzielenie itd.). Relację między brakiem i obecnością sójki w lesie, a procentem gniazd wyjedzonych przez drapieżniki można zamienić na funkcję między brakiem i obecnością sójki w lesie, a średnią liczbą wyjedzonych gniazd. Podejście to można rozszerzyć dla relacji między dwiema zmiennymi liczbowymi: dla każdej wartości zmiennej niezależnej można wyobrazić sobie, że istnieje pewna typowa (np. średnia) wartość zmiennej zależnej. W ten sposób powstaje funkcja. • Relacje i funkcje, dla których X=ℝ, Y nie jest zbiorem liczbowym • Relacje i funkcje, dla których Y=ℝ, X nie jest zbiorem liczbowym • Relacje i funkcje, dla których X=ℝ i Y=ℝ
Funkcje w biologii odgrywają dużą rolę i to nie tylko wtedy gdy patrzymy na funkcjonowanie przyrody w sposób deterministyczny. Przy takiej filozofii uwzględnienie wszystkich przyczyn danego zjawiska da jeden określony efekt. Występują także wtedy gdy analizujemy nie wszystkie przyczyny jakiegoś zjawiska, spodziewamy się pewnego rozrzutu danych wynikającego z nieuwzględnionych przyczyn ale wyliczamy ściśle zdefiniowana charakterystykę takiego rozrzutu (np. średnią wartość) i uzyskujemy funkcję. • Jakie funkcje możemy w taki sposób uzyskać? • Ciągłe gdyż rzeczywiste czynniki nie działają tak by dla jakiejś jednej wartości zależność się nagle zmieniała (innego typu zależność dla wszystkich x<x0 a inna dla x>x0) • Gładkie czyli różniczkowalne, tzn. które w każdym punkcie posiadają jedną styczną. Trudno sobie wyobrazić zależność miedzy dwoma rzeczywistymi zmiennymi wyglądającą jak łamana. Jakiego typu wartości zmiennej X mogłyby dawać taki efekt? Ponownie musielibyśmy dojść do wniosku, że istnieja jakieś szczególne wartości zmiennych o odmiennych cechach niż wartości minimalnie się od nich różniące. • Opisane cechy tworzą pewna kategorię funkcji, które tworzy nam przyroda. Przykładowo, jeżeli założymy, że dane warunki środowiska określają nam wielkość żyjących w nim osobników danej populacji to zależność miedzy długością osobnika, a średnim ciężarem jest funkcją utworzona przez przyrodę. Zakładamy przy tym, że każdy osobnik ma długość i ciężar, długości i ciężary są liczbami rzeczywistymi (które mierzymy z pewna dokładności, ale to na razie pomijamy), że w tym środowisku mogłyby żyć także inne osobniki o pewnym wzroście i ciężarze. Zakładamy, że istnieje średni ciężar wszystkich możliwych osobników o takiej samej długości. Funkcja przyporządkowująca określonej długości ten średni ciężar istnieje i ma jakiś ciągły, gładki wykres. Funkcje liczbowe „tworzone przez przyrodę” f: ℝℝℝ f jest funkcją ciągłą w punkcje x0 wtedy i tylko wtedy gdy: f jest funkcja ciągłą wtedy i tylko wtedy gdy jest ciągła w każdym punkcie f jest funkcją różniczkowalną jeżeli w każdym punkcie jej wykresu można określić tylko jedną styczną (nie ma załamań) f jest funkcją ograniczoną jeżeli zbiór wartości funkcji jest ograniczony
Twierdzenie Weierstrassa Twierdzenie 1 Wśród wszystkich funkcji ciągłych, różniczkowalnych, ograniczonych i określonych na ograniczonym przedziale jest „więcej” funkcji, które nie wyrażają się jakimkolwiek wzorem matematycznym niż tych, które są funkcjami o jakimś wzorze. Przedstawione tu twierdzenia odgrywają zasadnicza rolę w analizie rzeczywistości, a więc nie tylko w naukach przyrodniczych, ale także w fizyce, chemii i innych dziedzinach nauki. Przedstawiam je tu niezbyt formalnie, ale chodzi przede wszystkim o zrozumienie istoty tych twierdzeń. Była mowa o funkcjach istniejących w przyrodzie i pierwsza rzecz, która się nasuwa – to jakim dane są one wzorem. Funkcje dane różnymi wzorami znane są wam ze szkoły, ale nie wszystkie funkcje liczbowe musza być dane wzorem. Co więcej można dowieść że w zbiorze wszystkich funkcji rzeczywistych ciągłych, różniczkowalnych i ograniczonych, podzbiór funkcji danych wzorami jest znikomo mały. Gdyby losować jakąś funkcję rzeczywistą, ciągłą, różniczkowalna i ograniczoną to prawdopodobieństwo wylosowania funkcji danej wzorem jest równe 0. Przyroda nie musi się posługiwać wzorami wymyślonymi przez ludzi. Nie mniej drugie twierdzenie udowodnione po raz pierwszy przez Karla Weierstassa (XIX wiek) pokazuje, że możliwe posługiwanie się funkcjami danymi wzorami do wyliczenia pewnych zależności przyrodniczych. Błąd popełniany przy takich przybliżeniach można dowolnie zmniejszać wybierając wielomiany coraz to wyższego stopnia. Twierdzenie 2 (Weierstrassa) Wszystkie funkcje ciągłe, gładkie, ograniczone o ograniczonej dziedzinie, można przybliżać wielomianami.
Funkcjonowanie twierdzenia Weierstrassa Podany przykład pokazuje jak zwiększając stopień wielomianu uzyskujemy coraz lepsze przybliżenie nieznanej funkcji. Bardzo często wiemy, że nieznana zależność musi być monotoniczna – malejąca lub rosnąca. Wtedy przybliżenie funkcją liniową może być wystarczające. Takie przybliżenie zakłada, że tempo wzrostu/spadku Y przy wzroście X jest stałe. Tak nie musi być, ale stosując to przybliżenie mamy prostą interpretację wyliczonych wartości parametrów funkcji liniowej. Przy konieczności stosowania wielomianów wyższego stopnia komplikuje się interpretacja kolejnych parametrów. Jesteśmy zatem w naszych badaniach zdani na stosowanie nawet niezbyt dobrych przybliżeń funkcji generowanych przez przyrodę po to aby posługiwać się zrozumiałymi i interpretowalnymi wzorami. Zauważmy jeszcze jedną rzecz. Funkcje dane przez przyrodę są ciągłe i różniczkowalne. Przy małym zakresie zmienności X takie funkcje rzeczywiście niewiele odbiegają od stycznej w tych punktach. Problem polega na tym, że często nie wiemy czy zakres zmienności X stwierdzony w naszych badaniach był rzeczywiście mały. Wielomian stopnia n ma n+1 nieznanych parametrów. Nadawanie im interpretacji biologicznej zaczyna nie mieć sensu. y = ax + b funkcja dana przez przyrodę funkcja liniowa funkcja kwadratowa wielomian 3 stopnia funkcja dana przez przyrodę funkcja liniowa funkcja kwadratowa wielomian 3 stopnia tempo zależności stała y = ax2 + bx+c Połowa tempa zmian tempa zależności tempo zależności stała
Wniosek z twierdzenia Weierstrassa Każdą funkcję (także nieograniczone) można przybliżać funkcjami analitycznymi Twierdzenie Weierstrassa dotyczy funkcji ograniczonych i określonych na ograniczonym przedziale, a nie wszystkie funkcje tworzone przez przyrodę są ograniczone. Niektóre wielkości fizyczne są tak zdefiniowane (np. pH określone jako minus logarytm dziesiętny ze stężenia jonów wodorowych H+, a właściwie hydroniowych OH3+, w roztworze wyrażane w molach na metr sześcienny), że mogą zmierzać do nieskończoności. Znacznie częściej chcemy posługiwać się funkcjami które są określone na całym ℝ lub ℝ+ a przyjmują ograniczone wartości (np.. Są procentem osobników zmarłych przy wzroście zanieczyszczenia wody. Od pewnej liczby wyrażającej tak duże zanieczyszczenie, że brak tam będzie możliwości życia – mamy stałą wartość 100. Problem z wielomianami jest taki że przy wzroście x do nieskończoności wartość każdego wielomianu zmierza do lub -. Poprzez stosowanie różnych przekształceń (wystarczy do tego użyć funkcji wykładniczych i logarytmicznych, funkcji tangens lub cotangens) możemy funkcje nieograniczone przekształcić na ograniczone i odwrotnie. Dla takiego złożenia można zastosować przybliżenie wielomianem i zastosować przekształcenie odwrotne do pierwszego. W ten sposób dochodzimy do wniosku, że wszystkie funkcje tworzone przez przyrodę możemy przybliżać pewnymi funkcjami danymi wzorami. • przekształcamy funkcję nieograniczoną za pomocą odwracalnej funkcji analitycznej dającą funkcję złożoną ograniczoną • przybliżamy funkcję ograniczona wielomianem • stosujemy przekształcenie odwrotne do pierwotnie zastosowanej funkcji analitycznej Przykładowe rodziny funkcji przybliżające funkcje przyjmujące wartości zawsze dodatnie: Przykładowe rodziny funkcji przybliżające funkcje przyjmujące wartości zawsze dodatnie i mniejsze od 100:
Generalny wniosek z twierdzenia Weierstrassa Najważniejszy wniosek z twierdzenia Weierstrassa zostawiłam na koniec wykładu. Jest to możliwość tworzenia nauki i wiedzy, wiedzy w oparciu o wzory matematyczne, nawet wtedy gdy przyroda wcale się nimi nie posługuje. Nie musimy porównując wzrost osobników dwóch populacji zastanawiać się jaka jest wydajność cyklu Krebsa u osobników, jaki wydatek energii przeznaczają komórki na detoksykację i rozważać wiele innych rzeczy, których ostatecznym efektem jest mniejszy lub większy wzrost osobników. Możemy rozkład wzrostu właściwy dla tych populacji przybliżyć jakimiś funkcjami i prowadzić porównania i różne rozważania w oparciu o zmienność tych funkcji. Wydajność szlaków metabolocznych komórek osobników tych populacji i wszystko co wpływa na wzrost osobników są ukryte we wzorach zastosowanych funkcji. Wszystkie procesy biologiczne wyrażające się funkcjami liczbowymi możemy przybliżać pewnymi funkcjami danymi wzorami matematycznymi. Funkcje te nie są prawem natury, ale mogą w tak dobry sposób pokazywać nam liczbowe (ilościowe) własności różnych procesów, że można w oparciu o nie budować cywilizację.