Miljoona apinaa näppäimistöllä – elämän synnyn todennäköisyys

Infinite monkey theorem

Sanotaan, että jos tarpeeksi monta apinaa hakkaa tietokoneen näppäimistöä tarpeeksi monta vuotta, he tuottavat lopulta koko Shakespearen tuotannon. Tämä on mielenkiintoinen teoreema ja vie meidät naurettavan suurten lukujen ihmeelliseen maailmaan. Mutta ennen kuin tutkimme apinoita ja Shakespearen tuotantoa, katsokaamme ensin meille jokaiselle tutumpaa ja helpommin ymmärrettävää esimerkkiä, tavallista polkupyörän lukkoa, jossa on kolme rinkulaa, joissa kussakin numerot nollasta yhdeksään. Jos ystäväsi kertoo unohtaneensa polkupyörän lukkonsa koodin, mutta saatuaan sen avattua kokeiltuaan satunnaisia yhdistelmiä, todennäköisesti uskoisit ystävääsi, mutta pitäisit häntä todella onnekkaana. Tässä tapauksessa mahdollisia yhdistelmiä on 10³ eli 10*10*10 eli 1000. Todennäköisyys avata lukko sattumalta on 1/1000, eli siis täysin mahdollista. Mutta kuvitellaanpa, että ystäväsi kertoo avanneensa lukon, jossa on viisi rinkulaa. Nyt saattaisit jo hieman epäillä, sillä tässä tapauksessa mahdollisia yhdistelmiä on 10⁵ eli siis 100000. Jos ystäväsi ei ole aiemmin valehdellut, saattaisi uskoa häntä, mutta varmasti ihmettelisit hieman. Kuvitellaan vielä, että ystäväsi kertoisi avanneensa sattumalta lukon, jossa on 10 rinkulaa. Nyt todennäköisyys avata lukko sattumalta on 1/10¹⁰ eli siis 1/10000000000 (1 kymmenestä miljardista) – todennäköisempää olisi voittaa lotossa. Mutta kyllähän joka viikko aina joku voittaa lotossa, joten teoriassa ystäväsi on saattanut saada lukon avatuksi. Jos olet teoreettinen tyyppi, ehkä uskoisit ystävääsi, mutta me maalaisjärjellä ajattelevat realistit päättelisimme, että on todennäköisempää, että ystäväsi valehtelee. Jatketaan ajatusleikkiä ja kuvitellaan, että ystäväsi kertoo avanneensa sattumalta polkupyörän lukon, jossa on sata rinkulaa. Nyt mahdollisia yhdistelmiä on peräti 10¹⁰⁰ – täysin naurettavan absurdin suuri luku, ykkönen, jonka perässä on sata nollaa. Jotta käsittäisit, kuinka suuri tämä luku on, mieti, että koko maailmankaikkeudessamme on vain 10⁸² atomia. Todennäköisyys sattumalta avata polkupyörän lukko, jossa on sata rinkulaa, on 1/10¹⁰⁰, siis paljon todennäköisempää olisi sattumalta löytää yksi tietty atomi koko universumista. Tässä tapauksessa ei olisi epäilystäkään siitä, että ystäväsi valehtelee. Ainoastaan täysi mielipuoli pitäisi ystäväsi tarinaa uskottavana. Toki tuo tapahtuma olisi teoriassa mahdollinen, mutta ainoastaan teoriassa, käytännössä kukaan ei ikinä tällä planeetalla saisi lukkoa avatuksi, ei vaikka yrittäisi biljoona kertaa sekunnissa alkuräjähdyksestä maailmanloppuun asti.

Palataanpa takaisin apinoihin. Jos jätämme välimerkit huomiotta ja tutkimme todennäköisyyttä apinoiden kirjoittaa Shakespearen tuotantoa alkukielellä, todennäköisyys sattumanvaraisesti näpytellä 100 ensimmäistä merkkiä Hamletista olisi 1/26¹⁰⁰ eli siis 1/(3*10¹⁴¹). Kuten esimerkissä polkupyörän lukosta, jossa on sata rinkulaa, myös tässä tapauksessa todennäköisemmin löytäisi universumista yhden atomin kuin onnistuisi näpyttelemään sattumanvaraisesti 100 ensimmäistä kirjainta Hamletista. Jos sata biljoonaa apinaa olisi näpytellyt tietokoneen näppäimistöä alkuräjähdyksestä tähän päivään asti syöttäen sata biljoonaa merkkiä sekunnissa, he olisivat käyneet läpi 10¹⁴*4*10¹⁷*10¹⁴=4*10⁴⁵ merkkiä, joka on taskulaskimeni mukaan tasan nolla prosenttia kaikista mahdollisista yhdistelmistä (3*10¹⁴¹). Apinat siis eivät varmuudella olisi onnistuneet näppäilemään edes sataa ensimmäistä merkkiä Hamletista. Jätän kotitehtäväksi laskea, kuinka monta biljoonaa vuotta apinoiden tulisi hakata näppäimistöjään, jotta he saisivat koko Shakespearen tuotannon näpyteltyä.

Model of the newly-identified clorophyll f enzyme that converts chlorophyll a into chlorophyll f. The green molecules near the bottom of the structure represent chlorophyll a molecules that would be modified in light to produce chlorophyll f.

Tätä apinateoreemaa käytetään usein todistamaan, että kyllä evoluutio on mahdollinen, sillä jos evoluutiolla on käytössä useita miljoonia vuosia, myös epätodennäköiset tapahtumat ovat mahdollisia. Tutkitaan siis seuraavaksi elämän syntyä, millä todennäköisyydellä ensimmäinen elävä solu on voinut syntyä? Emme tässä tarkastele koko solua, vaan otamme tarkasteluun ainoastaan yhden proteiinin. Elämä rakentuu pitkälti proteiineista. Proteiinit ovat polypeptidiketjuja, jotka rakentuvat kahdestakymmenestä eri aminohaposta. Yksi proteiini koostuu keskimäärin kolmestasadasta aminohaposta. Näin ollen on olemassa 20³⁰⁰, eli siis 2*10³⁹⁰, mahdollista eri tapaa rakentaa yksi 300 aminohappoa pitkä proteiini. Todennäköisyys siis sattumalta löytää yksi proteeini on 1/(2*10³⁹⁰), aivan naurettavan tähtitieteellisen pieni luku.

Mutta, saatat sanoa, tuo on vain todennäköisyys löytää yksi tietty proteiini, meidän tulee ottaa huomioon kaikki potentiaalisesti funktionaaliset proteiinit. Olet aivan oikeassa. Paljonko niitä on? Douglas Axe vuonna 2004 arvioi vertaisarvioidussa tutkimuksessaan, että funktionaalisia proteiineja on yksi 10⁷⁷:stä. Vuonna 2012 Durston ja Chiu arvioivat luvun olevan vain yksi 10¹⁰⁰:sta. Selvästi nämä ovat vain arvioita, on mahdoton empiirisesti testata kaikkia mahdollisia proteiineja ja laskea tarkkaa lukua. Se on kuitenkin selvää, että funktionaaliset proteiinit ovat hyvin harvinaisia. Jos jokainen pisara maapallon valtamerissä (2.7*10²⁵ pisaraa) olisi alkuräjähdyksestä asti (4.4*10¹⁷ sekuntia) yrittänyt tuottaa funktionaalisia proteiineja kerran sekunnissa, ne olisivat pystyneet käymään läpi ainoastaan 10⁴³ eri proteiinia – ei lähelläkään todennäköistä, että ainuttakaan funktionaalista proteiinia olisi löytynyt. Kuitenkin biologian koulukirjat esittävät faktana, että elämä on syntynyt spontaanisti alkumeressä.

Long tailed weasel

Richard Dawkins astuu kuvaan ja tarjoaa oman selityksensä. Hänen kirjoittamansa nerokas Weasel-tietokoneohjelma ratkaisee tämän ongelman kätevästi. Hän osoittaa, että vain neljässäkymmenessä sukupolvessa hänen ohjelmansa pystyy satunnaisesti tuottamaan lauseen “ME THINKS IT IS LIKE A WEASEL”. Miten se on mahdollista? Koska hänen ohjelmansa vertaa satunnaisesti tuotettuja merkkejä ja valitsee seuraavalle kierroksella ne, jotka vastaavat ennalta annettua lausetta. Mutta tämä on tietoa, jota evoluutiolla ei ole, joten Dawkinsin ohjelma ei todista mitään. Evoluutio ei voi tietää, jos kaksi ensimmäistä aminohappoa on oikein, se ei voi tietää, jos kymmenen ensimmäistä aminohappoa on oikeassa järjestyksessä, se ei voi tietää, vaikka 99% prosenttia aminohapoista olisi oikeilla paikoillaan. Toisin kuin Dawkins väittää, epätodennäköisyyden vuorelle ei johda mitään tasaista oikopolkua. Kukaan ei ole koskaan pystynyt osoittamaan polkua yhdestä proteiinista toiseen. Sellaisia ei ole olemassa. On vain äärettömän suuri epätodennäköisyys löytää ainuttakaan proteiinia. Ja jos puhumme elämän synnystä, ei kemiallisella evoluutiolla edes ole käytettävissä mitään evoluutiomekanismia.

Mutta, voittaahan aina joku lotossa. Mutta kukaan ei voita miljoona kertaa peräkkäin.

Douglas Axe, ” Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds”, 2004, Journal of Molecular Biology

Kirk Durston and David K. Chiu, “Functional sequence complexity in biopolymers” (2012)

10⁸² atomia koko maailmankaikkeudessamme.
4.35454*10¹⁷ sekuntia alkuräjähdyksestä.
2.664*10²⁵ pisaraa vettä maapallon merissä.

https://en.wikipedia.org/wiki/Infinite_monkey_theorem